创新点
1、目前已有一些工业界的研究成果将强化学习应用于广告系统中,但是通常只会考虑广告带来的收益最大化,并不会考虑广告给用户造成的影响。
2、本文给出了一种自然结果和插入广告的平衡,也是用户体验和平台收益的trade-off。
3、本文基于DQN提出一种改进的模型框架——DEAR,该框架可以自适应的对投放策略做出调整(推荐列表中是否需要插入广告、插入什么广告、在什么位置插入广告)。
文献总结:
















文章转载自北邮数据科学与商务智能实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




