实验室博士生王朝阳的论文被ACM TDS接收-现代数据工程与实时计算实验室
现代数据工程与实时计算实验室

实验室博士生王朝阳的论文被ACM TDS接收
时间:2022年02月28日 10:16   访问量:

近日,实验室博士生王朝阳的论文“A Text-based Deep Reinforcement Learning Framework using Self-supervised Graph Representation for Interactive Recommendation”被ACM Transactions on Data Science(ACM TDS)期刊录用。
由于强化学习(RL)具有从动态交互中学习和规划长期性能的特性,近年来在交互式推荐系统(IRS)中受到了广泛关注。IRS通常面临着较大的离散动作空间问题,这使得现有的大多数基于RL的推荐方法效率低下。此外,数据稀疏性是大多数IRS面临的另一个挑战性问题。为了解决动作空间大和数据稀疏两个问题,在论文中,我们提出了一个基于文本的深度强化学习框架TRGIR。具体地,该框架通过一种基于图卷积网络的自监督嵌入方法利用文本信息,大大缓解了数据稀疏性问题。此外,我们还设计了一种有效的方法来构造动作候选集,从而直接缩小了动作空间的规模。我们已经用两种有代表性的强化学习算法(DQN和DDPG)实现了上述框架TRGIR。由于IRS是离散的,用DQN实现TRGIR是很自然的,但在TRGIR-DDPG的实现中,我们设计了一个策略向量,该策略向量可以从TRGIR-DDPG的Actor部分动态学习得到,以表达用户的偏好,并利用它从候选集生成动作。通过在三个公共数据集上的大量实验,我们证明了TRGIR-DDPG在多个基线上以较高的效率达到了最优的性能。

地址:湖北省武汉市洪山区珞瑜路1037号,华中科技大学南一楼西南501室 邮编:430074 电话:027-87556601
计算机科学与技术学院,现代数据工程与实时计算实验室 有问题和意见请与网站管理员联系:adelab@163.com

温馨提示:为保证能正常的浏览此网站,请用IE9.0以上版本查看!    访问人次: