AI综述专栏|跨领域推荐系统文献综述(下)

2018 年 5 月 18 日 人工智能前沿讲习班
AI综述专栏|跨领域推荐系统文献综述(下)

AI综述专栏简介

在科学研究中,从方法论上来讲,都应先见森林,再见树木。当前,人工智能科技迅猛发展,万木争荣,更应系统梳理脉络。为此,我们特别精选国内外优秀的综述论文,开辟“综述”专栏,敬请关注。

导读

跨领域推荐系统(Cross domain recommender systemsCDRS)能够通过源领域的信息对目标领域进行辅助推荐,CDRS由三个基本要素构成:领域(domain),用户-项目重叠场景(user-item overlap scenarios)和推荐任务(recommendation tasks)。这篇研究的目的就是明确几种广泛使用的CDRS三要素的定义,确定它们之间的通用特征,在已明确的定义框架下对研究进行分类,根据算法类型将同类研究进行组合,阐述现存的问题,推荐CDRS未来的研究方向。文章分为上、下两部分,本篇为“下篇”。


「关注本公众号,回复"CDRS",获取英文版PDF」


五 结果

本节回答了四.1节提出的问题。具体分为四个部分,第一部分是总结了各CDRS三要素定义的共通点,第二部分根据分类坐标系对一级研究进行了分类,第三部分强调了一些当前CDRS使用的算法,第四部分指出了未来发展趋势。

每个部分都使用了跨案例分析方法[Milesand Huberman 1994]去综合分析结果,跨案例分析方法包括了各种不同的表现方式,如图表等方式,通过密集编码的形式,在不破坏原有意思的情况下,对已经确定的数据进行管理和表示。在文本中,我们使用标签法对数据进行编码,我们的数据就是一级研究,我们使用跨案例分析方法设计分类指标,对一级研究进行分类和组合。

1 RQ1DRS三要素的定义去如何扩展才能够将大量的一级研究进行分类?

这个研究问题主要指向如何确定不同CDRS三要素定义之间的共同特征。首先,领域定义的共同点已经提到了。第二,类域也已被提出,作为Ivan提出的属性等级、项目类型等级和项目等级的定义的补充。第三,用户-项目重叠场景根据候选文献的标准进行选择。第四,推荐任务通过候选文献提出的定义进行定义。总的来说,提出的定义集已被使用于生成分类坐标系,使用分类坐标系对一级研究进行的分类将会在后面的章节讨论。

·领域

6简化了领域定义,图中显示了在Li[2011]Ivan[2015]的研究中系统领域定义的共同点。Ivan关于项目属性的定义被组合成一个领域,即类域,这样做很有用,因为Ivan的定义使用项目的属性和类型进行区分,没有指定区分需要的属性的数量,属性的数量对于区分项目属性等级和项目类型等级是很有必要的。

使用的领域定义

类域:推荐系统的项目可以根据在单领域中项目的属性或者类型被分组。因此,每个属性或者类型都可以认为是一种不同的类。当进行推荐时,信息从不同的类之间进行转移,这被认为是类域的迁移,例如:

-Hu etal. [2013a]  Loni et al. [2014]AMAZON中的书籍、CDDVDVHS之间完成了信息迁移

-Tanget al. [2012]  Shapira et al. [2013] Facebook中的音乐、电影、电视节目、书籍之间完成了信息迁移。

-Berkovskyet al. [2007]  Nakatsuji et al. [2010]EachMovies的不同项目之间完成了信息迁移。

·用户-项目重叠场景

对于用户-项目重叠场景,Cremonesiet al. [2011]提出的定义现在已经被主流的研究所接受,因此,本文也使用他们对一级研究分类的定义。

·推荐任务

推荐任务由Cremonesi et al.[2011]提出,Fernandez-Tobias et al. [2012]Ivan Cantador[2015]虽然对其有不同的定义方式,但是表达的概念都比较相似。为简单起见,我们创建了三种推荐任务,如表7所示。每种类型为CremonesiFernandez-TobiasIvan Cantador提出的推荐任务提供了明确的解释。

推荐任务比较

C1:单任务领域推荐。通过从其它领域获取到的信息,将一个领域的项目推荐给各自领域的用户。这种场景和单领域推荐很相似,Cremonesi et al. [2011]Fernandez-Tobias etal. [2012]分别描述了推荐质量改善的场景。

C2:组合推荐。将物品推荐给某两个领域或其中之一领域的用户的过程中,两个领域对推荐都做出贡献。这种场景和Cremonesi et al. [2011]Ivan Cantador[2015]Fernandez-Tobiaset al. [2012] 描述的多领域推荐和相邻用户-项目重叠推荐场景非常相似。

C3:跨领域推荐。根据从两个领域的用户和项目之间收集到的信息,将其中一个领域的项目推荐给其他领域的用户。这种场景和Cremonesi et al. [2011]Ivan Cantador[2015]描述的相关领域推荐和跨领域推荐很相似。

总结

本节回答了提出的第一个研究问题。首先区分了领域之间的相似性,提出了类域,然后讨论了推荐场景,最后,对推荐任务进行了组合,下一节中将根据此组合对一级研究进行分类。

2 RQ2:在大部分相关推荐场景的构建都是基于领域差异、推荐场景和推荐任务的情况下,跨领域推荐系统研究中这些场景所占比率是怎么样的?

跨领域推荐系统的研究立足于三个基本要素,即领域信息转移,用户项目重叠和推荐生成(推荐任务)。此问题的目的是正确的定位一级研究在分类坐标系中的位置。对一级研究进行分类时,“用户-项目”重叠被认为在包含多领域和推荐任务的文献中具有共同之处。因此,为了更方便的在坐标图中表示研究,我们设置了两种变化形式:

-领域vs用户-项目重叠场景坐标图

-推荐任务vs用户-项目重叠场景坐标图

(1)领域vs用户-项目重叠场景坐标图

共有86篇文献被用于绘制领域vs用户-项目重叠场景坐标图,根据它们的文献ID,将这些研究在表8中列出,具体如图7所示。

领域vs用户-项目重叠场景坐标图

坐标图描述:横轴为用户-项目重叠场景。“用户-项目”,“用户-无项目”处于左象限,“无用户-项目”,“无用户-无项目”处于右象限。类似的,在纵轴上,系统和类域处于上象限,数据和时间域处于下象限,此坐标图中没有负值,每个地方都是由文献ID组成的。坐标图中的虚线表示各轴元素间的联系。水平的虚线表示与领域有联系,垂直的虚线表示与用户-项目重叠场景有联系。

简单观察坐标图中的圆,能发现两个结论,第一,圆总是存在于两个虚线的交汇处。如在左下方,一个包含两篇文献的圆(2740)存在于“用户-项目重叠”和“时间域”虚线的交汇处,这意味着这些一级研究的都是根据时域的变化将源领域的信息转移到目标领域,而且在两个领域中它们都有相同的用户和项目。

第二,圆总是存在于通过窄虚线连接到领域和用户-项目重叠的虚线的方块中。在坐标图中,有10个圆处于方块中,它们可以分为两类,第一类包括连接到两个领域和一条用户-项目重叠虚线(例如左上角包含(19.26)的圆分别连接到系统域、类域和用户-无项目重叠)的圆。第二类包括连接到三个领域和一条用户-项目重列虚线((8)这个圆连接到数据域、时间域、系统域和无用户-项目重叠)。

连接到两个领域的圆表示涉及保持用户-项目重叠相同的情况下两个领域之间的信息转移,类似的,连接到三个领域的圆表示三个领域之间的信息转移。

综上:

开放研究贡献:单领域vs用户-项目重叠

目前尚无研究是关于以下几种场景的:系统领域vs用户-项目重叠;数据领域vs用户-无项目重叠及无用户-无项目重叠;时间领域和用户-无项目重叠;无用户-项目和无用户-无项目重叠如图8A)所示,Fernandez-Tobıas强调它的原因是这个研究趋势一般没有合适的数据集。事实上,由相同数据源分出来的人工数据被一些研究者用来在不同的领域场景都进行过实验,比如Berkovsky et al. [2008], Winoto and Tang[2008], 以及Zhang etal. [2012]

开放研究贡献:多领域和用户-项目重叠

某些研究完成了两个领域之间信息的转移,还有少部分完成三个领域的。更多领域之间信息转移受到阻碍的主要原因是算法的复杂度过高。当然,这个方向上也有许多的组合可以拿来研究。

8B)是涉及不同领域数时不同重叠方案之间的比较,单领域场景非常多,三领域重叠方案最少

成熟的方案

由于从入选的一级研究中获得了最大权重,领域vs用户-项目重叠场景被认为是成熟的方案。对于某个单领域有贡献的一级研究被用于计算整个领域的贡献。根据这一准则,37篇文献讨论过类域,所占比重最高,只有两篇文献讨论过时域,所占比重最低。图8C)为所有领域的权重。

在用户-项目重叠比较的例子中,所有的场景的参与程度都被认为是相近的,具体见图8D)。

领域vs用户-项目重叠方向一级研究分析

(2)推荐任务vs用户-项目重叠场景坐标图

共有65篇文献都被用于绘制推荐任务vs用户-项目重叠场景坐标图,根据它们的文献ID,将这些文献在表8中列出,具体如图9所示。

推荐任务vs用户-项目重叠场景坐标图

坐标图描述:横轴为用户-项目重叠场景。“用户-项目”,“用户-无项目”处于左象限,“无用户-项目”,“无用户-无项目”处于右象限。纵轴代表推荐任务,和前面类似,此坐标图中没有负值,表格中的圆包含代表文献ID的一级研究。

综上:

开放研究贡献:C2C3

在所有的推荐任务中,单领域推荐(C1)提供了主要的贡献,然后是联合推荐(C2),最后是跨领域推荐(C3)。收集的一级研究表明,跨领域推荐(C3)的相互作用,用户-项目重叠和联合推荐(C2),以及无用户-项目重叠还处于研究空白。每种推荐任务所占比例如图10A)所示。

对于所有推荐任务-用户项目重叠场景,用户-无项目重叠场景所占比重最大,无用户-项目重叠场景所占比重最小,只有20%,具体信息如图10B)。

10 推荐任务vs用户-项目重叠方向一级研究分析

总结:

本节根据领域vs用户-项目重叠场景和推荐任务vs用户-项目重叠场景将CDRS的一级研究进行了分类。分类的结果指出了CDRS目前已经成熟的研究方向和缺乏关注的研究方向。

3 RQ3:目前CDRS主流的技术方法和分析算法

CDRS目前使用的算法可以被分成7类:聚类、语义分析、基于图的算法、概率分布、因式分解、基于标签关联的方法和其它。为了进一步理解每类算法,下一节中将会逐一举例说明。

(1)算法

聚类:CDRS方向最先提出聚类算法的是Morenoet al. [2012]。他们设计的算法能够根据用户和具有相同评分模式的物品对源领域进行聚类。然后将整个类转移到目标领域,并且能够根据相似的用户和项目进行扩展。其它研究聚类算法在CDRS上的应用的还有Chen et al. [2013],Wang et al. [2012], Gao et al. [2013b], Yi et al.[2015], Li et al. [2009],Berkovsky et al. [2007], Li et al. [2016], Tang et al.[2013], Li et al. [2011], and Li et al.[2016]

语义分析:基于语义分析的方法来自于知识工程和本体论,主要思想是根据源领域中的知识生成知识图谱,并将其转移到目标领域中,根据目标领域中的评分对项目进行分类。研究此类算法在CDRS上的应用的有Moe and Aung [2014a],以及Kumar et al. [2014b]

基于图的方法:基于图的方法尝试去建立源领域中用户和项目的联系,进而在目标领域中相似的用户和项目之间也建立联系。研究此类算法在CDRS上的应用的有Jiang et al. [2012], Shapira et al. [2013], Iwata and Takeuchi[2015], Biadsy et al. [2013], Guo and Chen [2014], 以及 Nakatsujiet al. [2010]

概率分布:概率分布主要面向于两个领域之间表征相似的项目,此种方法尝试根据源领域中的所有用户去学习每个项目的概率,寻找到合适的推荐分数。一旦学习成功,就将信息转移到目标领域中。使用概率分布的文献有Aizenberg et al. [2012], Ren et al. [2015], and Lu et al. [2013]

因式分解:尝试去将源评分矩阵分解为一对特征矩阵,以此能更好的和目标评分矩阵组合,补全没有的评分。研究此类算法在CDRS上的应用的有Shi et al.[2011], [Hu et al. 2013a], Huang et al. [2012], Gao et al.[2013b], Xin et al. [2014], Zhao et al. [2013], Loni et al. [2014], Shi et al.[2013a], Pan et al. [2012], Pan and Yang [2013], Shi et al. [2013b], Jing etal. [2014], Pan et al. [2015a], and Pan et al. [2015b]

基于标签关联的方法:指根据源领域用户和项目的标签建立标签关联,对用户和项目进行组合。同时关联源领域和目标领域已定义标签,据此共享评分矩阵。Dong and Zhao [2012], Yang et al. [2014], Guo and Chen [2013b], 以及Moe andAung [2014b] 等文献通过此方法将源领域的信息转移到目标领域。

其他:包括研究领域之间信息迁移的其它文献,此处举例都是有明确应用的,因此,有些技术并未提及。

文献需要使用一定的分析技术去衡量提及的算法的优劣程度,本文同时也对CDRS研究中使用的分析技术进行了阐述。从72篇进入备选范围的一级研究中提取出分析技术,并对其进行组合,最终形成三组评价指标,即分类指标,预测指标,排名指标。分类指标被用于衡量算法根据一定规则对正负样本正确分类的能力,预测指标和分类指标相似,主要用于能够在每次迭代中进行算法的改进。预测指标统计算法的结果和真实值之间的误差的数量。排名指标通常用于衡量两个已排名物品列表之间的相似程度。共找到了16种分析技术,其中3种对涉及分类指标,3种涉及预测指标,9种涉及排名指标。图11为算法和分析指标关系。

11 算法和分析指标

坐标图描述:为了能够更好的比较算法,将所有的一级研究放在坐标图中,坐标图的y轴是各类算法,x周是分析指标,如图11所示。分析指标被分为三类,即分类指标,预测指标,排名指标。此坐标图中的圆为表8列出的一级研究的文献ID。圆在虚线的交界处,虚线表示算法或者分析指标。

总结:

从图12A)中可以看出,研究主要集中于因式分解,基于图的方法和聚类方法。从图12B)中可以看出最常用的分析指标为预测指标,其次是分类指标,最后是排名指标。

12 涉及各算法和分析指标的研究分布

(2)使用的数据集

在收集算法和分析指标的同时,数据集信息同样被收集,MovieLens数据集被使用次数最多,有23篇文献使用,占总数的22%,接下来是Netflix,有11篇文献使用。此外,还有很多其它公共数据集被使用,如图13所示,其中4篇文献使用了自己的数据。总之,进入备选范围的一级研究中共使用了29个数据集,大多数研究者只关注最流行的数据集。

13 数据集分布

总结:

本节首先根据分析指标对所有算法和其所属的一级研究进行分析,分析指标能够帮助CDRS将源领域的信息转移到目标领域中。其次,本节也根据使用的算法对一级研究使用的数据集进行了分析。

4 RQ4:现有的方法能够解决什么研究问题,并应用于未来的研究中?

(1)问题

跨领域推荐系统尝试通过领域间信息转移的方法解决传统的推荐系统问题。本节讨论以下几个方面,一是传统推荐系统已经能解决的问题,二是CDRS方面尝试解决传统推荐系统存在问题的研究,三是CDRS遇到的问题。

传统推荐系统解决的问题:

传统推荐系统研究尝试改善准确率和与其它系统的差异性,Ricci et al. [2011]列出了推荐系统最热门的研究问题,作为图14中的x轴,这些问题中的一部分与推荐系统的数量正相关,如准确率,独立性和差异性等等,一些特性逆相关,如稀疏性,覆盖率,冷启动等,图14中的绿色箭头表示单独的问题和推荐系统数量之间的关系。

14 推荐系统问题跨领域解决方法

CDRS方面尝试解决传统推荐系统存在问题的研究:

跨领域推荐系统旨在解决现存的推荐系统问题。现存的推荐系统的问题根据收集的一级研究被分成4类:如图14所示。第一类问题是关于准确率和稀疏性的,这类问题被认为是“成熟”的,因为研究其的文献非常多;第二类问题是关于用户-项目模型,独立性和覆盖率的,这类问题属于“前沿研究关注”,因为目前大部分研究都着眼于这些问题;第三类问题是关于信任度,实用性和可扩展性的,这类问题属于“正在获得关注”,包括的问题正在被研究,取得的进展较少;第四类问题是关于隐私问题,惊喜度,意外性,鲁棒性,风险和适应性的,这类问题属于“开放性研究问题”,在这些方面的研究几乎还是空白。

CDRS面临的问题:

五.2中强调,跨领域推荐系统缺乏合适的数据集用于多重推荐场景和任务。这使得此方面的探究迫切的需要能够兼容独立推荐场景的数据。某些研究者提出了一些新的数据集,如Dooms et al.[2013]使用的MovieTweetings,也有一些人尝试在某些假设成立的情况下使用现有的数据集。

CDRS遇到的另一个问题是基于语境的推荐,大部分时间里,向目标领域辅助推荐的源领域会带来新的信息,这些额外的信息是和共享信息相关的元数据,因此被称为是语境。语境可以扮演领域;然而,它没有被定义,关于这方面的一级研究仍然处于初始阶段,此阶段中可能会不适合使用其作为一个领域。使用其作为语境的一些研究有Fernandez-Tobias et al. [2011], Roy et al. [2012a], and Cao et al.[2015]

(2)未来研究方向

CDRS未来的研究方向可以被分成5类:分别是领域相似性提升,算法改善,使用大数据作为源领域,传统推荐系统问题和数据集扩展。下面细说明这5类研究方向:

·领域相似性提升: 现有的跨领域推荐系统技术依赖于参与领域之间的相似性,研究者通常根据以下方法来寻找提升领域相似性的方法。

a. 析异构数据:用户的相互行为存在于不同的数据类型中,如喜欢-不喜欢,播放音乐,数字评分等。这表明在CDRS中,异构数据转移将会是一个非常有潜力的研究方向。

b. 分析用户兴趣转移: 用户兴趣随时处于变化之中,因此,为了能随时根据用户兴趣生成新的推荐,可以根据时间对用户行为进行分析。这种特殊的场景和时域跨领域推荐有关,Hu et al. [2013a]申明他们将持续研究相关内容。

c. 包括相关领域: 多位研究者都将其实验的扩展部分作为其未来研究方向。在这个方向上,他们打算使用不止一个源领域,在多个领域上进行实验,或者分析多个领域以找出究竟哪个领域能够提供最精确的结果。

d. 语境增强: 研究者们发现源领域往往包含和目标领域上相同的用户和项目有关的附加属性[Roy et al. 2012b; Kaminskas 2009; Shi et al. 2013a; Shapira et al.2013; Tang et al. 2011; Roy et al. 2012a; Hoxha et al. 2013]。这些属性能够增强用户或者项目的语境,进而生成效果更好的推荐。

·算法改善: 领域的相似性可以通过改善使用的算法进行提高,因此,研究者会在未来的研究中努力改进跨领域推荐生成算法[Moreno et al. 2012; hang et al. 2012; Li et al. 2016; Kumar et al.2014a; Cao et al. 2015]

·使用大数据作为源领域: 使用大数据作为源领域有三个可行的研究方向,分别是:

a. 大数据作为源领域:根据Roy et al.[2012b], Aizenberg et al. [2012], Yan et al. [2013], 以及 Lu et al.[2013] 等研究的建议,跨领域推荐系统可以使用大数据服务去调整目标领域的推荐。通过人口统计或者其他统计信息获得的大数据能够帮助对跟人进行推荐。

b. 分布式实现:研究者通过使用分布式算法去提升跨领域推荐的效果,分布式算法能够根据需求调整规模,Su et al. [2010]提出了此研究方向。

c. 利用社交媒体:社交媒体包括面对各种不同项目的用户行为,这些行为的大部分都是可以获得的,他们广泛的存在于Facebook, twitter, LinkedIn等网站。研究者强调了社交媒体用户行为是一个能够改善目标领域推荐效果的潜在源领域[Zhao et al. 2013; Pan and Ming 2014; Xu et al. 2011a; Tang et al.2013; Pan et al. 2012; Dong and Zhao 2012; Fern´andez-Tob´ıas et al. 2011],最近,Khan etal. [2016]验证了Facebook上的用户行为在外部推荐系统上的应用,这是社交网络数据的首次应用。

·传统推荐系统问题: 传统推荐算法的问题是由Ricciet al. [2011]提出的,这部分和CDRS的关系不大。

 a. 风险: Ricci et al. [2011]描述,风险和由于不正确或不适合推荐导致的用户丢失有关。CDRS可以通过使用其它领域的用户评价观点来协助,从而降低推荐风险。

b. 适应性: 适应性和随时变化的用户兴趣有关。CDRS能够在某个时间段内将源领域的信息进行转移,从而改善适应性。基于时间的CDRS推荐不仅能够帮助改善适应性,还能改善惊喜度和新颖性。

c. 棒性: 鲁棒性的定义为,当存在虚假评分时,能够避免推荐的能力。CDRS能够通过从超过一个领域中提取出的信息进行的信息转移协助改善鲁棒性,从而减少使用虚假评分的概率。

d. 惊喜度: 惊喜度的定义为,推荐系统推荐的物品是否是用户没有见过或不知道的。CDRS能够将源领域中和用户感兴趣的物品相似但用户不知道的物品推荐给用户。

e. 隐私问题: 隐私和是否能够识别喜欢相似物品的用户的身份或者目标用户有关。CDRS推荐不会遇到隐私问题,因为推荐是在多个不同的系统领域之间进行的,没有哪个系统能够保证自己的用户的其他系统的相似。为了使CDRS推荐包含各系统领域,CDRS中使用的算法一般都不直接将源领域的评分映射到目标领域,取而代之的是提供用户的信息。

·数据集兼容:跨领域推荐系统依赖于数据集进行推荐辅助;现存的数据集都是为了传统的推荐系统创建的,这使得CDRS的研究者能够自由的使用这些数据集,有时候CDRS研究者也将这些数据集用于本来不是这些数据集生成的场景。例如,Pan and Yang [2013]Movie-Lens数据集用于数字和0/1评分中,他们还通过阈值法将数字评分转化为0/1形式,用于模仿喜欢/不喜欢行为。尽管能够使用现成的算法对数据进行转化,但是往往转化的结果不能匹配真实的场景,数据集的不兼容性能够在未来的研究中通过以下方法得到改善:

a. 新数据集:指创建新的数据集并根据相应的领域、推荐场景或推荐任务对其进行分类。尽管这是可行的,但是可能要花大量的时间。

b. 现有数据集:将现有的数据用在CDRS上,当将现有的数据集用在具有某个特定领域、某个推荐场景或者某个推荐任务的方案中时,需要标准化使用条件,并且考虑限制条件。

总结:

本节总结了CDRS能够解决的传统推荐存在的问题。同时,也对CDRS面临的问题进行了讨论,最后,将CDRS未来的研究方向分成了五大类。

六 不足之处

本文献综述试图对跨领域推荐系统的相关一级研究进行比较和分类,相关的二级研究有一些潜在的限制,然而,系统文献综述总的来说是值得去做的。预期的不足之处主要存在于一级研究的识别和选择,数据提取不充足和未完成的结果这几方面。

一级研究的识别和选择的不足之处

为了能够对CDRS进行更深入的了解,我们尝试去收集尽可能多的一级研究,从收集的研究中提取出尽可能多的跨领域推荐场景,力争避免偏差,我们遇到的另一个挑战是改变领域和推荐任务的定义。

为了避免偏差,确保覆盖到所有的实验结果,我们使用通用的关键词法对现有的二级研究进行选择,构建搜索字符串,搜索字符串的使用使得4.2中提到的研究指数服务更加有说服力。这一做法在减少偏差的同时,也能够显著增加识别的任务数量。

分类标准被设计用于正确挑选和分类尽可能多的一级研究。需要分析的文献多达94篇,所以我们的方法还是不能像有些系统文献综述那样为每篇文献提供相对质量评分。相反,我们使用了标签法去收集所有的一级研究并对其进行相同的分析。

数据提取的不足之处

尽管我们已经尽可能多的收集了数据,但是根据我们观点仍然还有新的研究问题被不断提出。读者有可能找出本文所没有考虑到的一些问题并对研究趋势做出更好的分析。数据提取的另一个不足之处是没有利用质量评分。质量评分能够帮助优先考虑结果的输出和研究趋势。同时,为了简短和准确的说明问题,某些包括多重CDRS研究场景的文献被简化成只有一个有效场景了。

综合结果的不足之处

一级研究的质量评分能够产生更好的综合结果。然而,我们的目标是通过对一级研究进行分析,根据通用的标签对CDRS的研究进行可视化,尽可能的使读者能够理解分析过程。为了完成这一目标,所有一级研究被标注,领域场景被划分到分类坐标系中,用于提取出当前研究的趋势。我们认为更深一步的领域场景之间的数据集联系和研究问题之间的关系不大,但是仍然能够对CDRS提供比较好的理解。下一节中我们将对全文进行总结,并提出未来的展望。

七 结论

本文的目的是明确普遍认可的CDRS三个基本要素的定义,对当前CDRS研究在已定义三要素的框架之下进行分类和可视化,同时,根据算法的类型和现有的问题对CDRS研究进行组合,提出CDRS未来的发展方向。为了完成这些提到的目标,我们使用了一系列系统文献综述方法,对相关文献进行收集,尽量减少偏差,同时公开过程和结果,接受批评。

根据系统文献综述的准则,我们提出了两个研究问题,即本文做出两个贡献,第一个是通过将普遍认可的领域、用户-项目重叠场景和推荐任务的定义进行重组,确定CDRS三要素的定义,并尝试根据三要素去理清CDRS研究的混乱之处。第二是将所有进入备选范围的一级研究进行重新分类,构建坐标图,指明CDRS研究的趋势。

尽管本文尝试去解决提出的问题,但是仍然还有一些地方没有涉及到。本文在四.6节中指出CDRS目前的研究势头非常猛,在未来的文献研究中,有效的CDRS工具包将会给新的研究者提供更有用的信息。同时,能够看到数据集和CDRS三要素共同作用下,正确识别出某个特定场景下数据集的特征也是非常有趣的。

总的来说,随着CDRS的发展,我们相信总有一天CDRS的三个基本要素的定义会被标准化,也逐渐会有专用的工具包,为提升CDRS的效果提供巨大的帮助。


扫描下方二维码加入跨领域推荐系统述讨论群


感谢内容伙伴雷智文推荐并翻译本文

内容伙伴持续招募中,有意者联系微信号"前沿讲习班小助手(ID:must-tech)"

历史文章推荐:

  AI综述专栏 | 11页长文综述国内近三年模式分类研究现状(完整版附PDF)

   AI综述专栏 | 朱松纯教授浅谈人工智能:现状、任务、构架与统一(附PPT

【AIDL专栏】熊辉:《易经》如何指导我们做人工智能

【AIDL专栏】罗杰波: Computer Vision ++: The Next Step Towards Big AI

【AIDL专栏】姚力:基于神经生理信息的智能交互与应用

【AIDL专栏】操龙兵:非独立同分布学习

【AIDL专栏】基于图的RDF知识图谱数据管理[附PPT]


登录查看更多
14

相关内容

推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

简介: 目标检测作为机器视觉中重要任务之一,是人工智能体系中一个具有重要研究价值的技术分支. 对于卷积神经网络框架、 anchor-based模型和anchor-free模型三个主流的目标检测模型进行梳理. 首先,综述了主流卷积神 经网络框架的网络结构、优缺点以及相关的改进方法;其次从one-stage和two-stage两个分支对anchor-based类模型进行深入分析, 总结了不同目标检测方法的研究进展; 从早期探索、关键点和密集预测三部分分析anchor-free类模型. 最后对该领域的未来发展趋势进行了思考与展望.

成为VIP会员查看完整内容
深度学习目标检测方法及其主流框架综述.pdf
0
59

【导读】时尚是我们向世界展示自己的方式,并已成为世界上最大的产业之一。时尚主要通过视觉传达,近些年来已经吸引了诸多计算机视觉研究者的关注。基于这个领域的快速发展,本文对200多篇与时尚相关的论文进行了全面的概述,从四个方面对实现智能型时尚进行介绍与探讨;(1)时尚检测包括特征点检测(landmark detection),时尚解析和条目检索,(2)时尚分析包括属性识别,款式学习和流行预测,(3)时尚合成包括风格转换、姿势转换和物理模拟,(4)时尚推荐包括时尚搭配、服装搭配、发型建议。针对每项任务,我们总结了基准数据集和各种评估方式。此外,我们强调了未来有希望的研究方向。

介绍

时尚就是某种我们把自己展示给世界的方式。我们的穿着和打扮方式决定了我们独一无二的风格和与众不同。时尚在现代社会已经成为我们不可或缺的一部分。不出所料,仅全球服装市场就已超过3万亿美元,占世界国内生产总值(GDP)的近2%。具体来说,到2020年,时尚领域的收入将超过7180亿美元,预计年增长率将达到8.4%。

随着人工智能中计算机视觉的高速发展,人工智能已经开启了时尚界的大门,通过电子零售,个性化的设计师到时尚设计流程来重塑我们的时尚生活。在这篇论文中我们把计算机视觉时装技术称为智能时装。从技术上讲,智能时尚是一项具有挑战性的任务,因为与一般对象不同,时尚物品在风格和设计上存在很大的差异,最重要的是,可计算的低级特征和我们所编码的高级语义概念之间存在着巨大且长期的语义鸿沟。

文章的贡献点如下:

我们对目前在时尚领域最先进的研究成果进行了全面的调查,并将时尚研究主题分为四个主要类别:检测,分析,合成和建议。

对于智能时尚研究中的每一个类别,我们都会对其中最重要的方法及其贡献进行深入和系统的回顾。此外,我们还总结了各种基准数据集以及到相应门户网站的链接。

我们收集了不同任务的评估指标,并给出不同方法性能之间的比较。

我们列出了未来可能的研究方向,这有助于促进和激励这一领域的发展。

2.时尚检测

由于大多数和时尚相关的研究工作的第一步就是检测,所以时尚检测技术是重中之重。以虚拟试穿为例,它需要提前探测输入的图片中关于人体的各种信息,包括但不限于体型的信息、身体的位置,然后对推荐的服饰进行合成。因此,检测是大多数后续工作的基础。在这一章节中,我们主要关注时尚检测任务,从三个方面对其进行介绍:特征点检测,时尚解析和条目检索。每一个方面都会介绍先进的方法,基准数据集以及方法之间的比较。

3.时尚分析

时尚不仅仅是关于人们应该穿什么而且还反应了人们的性格特点,会流露出其他社会线索。智能时尚分析在时尚产业、精准营销、社会学分析等领域有着巨大的发展潜力,因此,对人们选择穿什么款式的衣服进行推荐的智能时尚分析近年来受到越来越多的关注。在这一章节,我们主要关注时尚分析领域中的三个领域:属性识别,款式学习和流行预测。对于每一个领域,我们都会介绍该领域中的先进方法,基准数据及和方法之间的比较。

4.时尚合成

给出一个人的照片,我们要能够想象这个人喜欢什么样的打扮风格和服饰穿着。我们可以通过一张现实生活中的照片进行综合分析。在这一章节中,我们回顾了这项任务的发展历程,包括风格转换、姿态转换和物理模拟。

5.时尚推荐

尽管不是每个人天生就是一个时尚家。根据自身的需求,时尚推荐已经吸引了越来越多的关注。和时尚推荐相关的文献可以被分为三个主要的类别:时尚搭配,服装搭配和发型建议。

成为VIP会员查看完整内容
0
20

【简介】近些年来,可解释的人工智能受到了越来越多的关注。随着人工智能模型变得越来越复杂和不透明,可解释性变得越来越重要。最近,研究人员一直在以用户为中心研究和处理可解释性,寻找可信任、可理解、明确的来源和上下文感知的可解释性。在这篇论文中,我们通过调研人工智能和相关领域中有关可解释性的文献,并利用过去的相关研究生成了一系列的可解释类型。我们定义每种类型,并提供一个示例问题,来阐述对这种解释方式的需求。我们相信,这一系列的解释类型将有助于未来的系统设计人员获得可靠的需求和确定各种需求的优先级,并进一步帮助生成能够更好地符合用户和情景需求的解释。

介绍

人工智能(AI)领域已经从单纯的基于符号和逻辑的专家系统发展到使用统计和逻辑推理技术的混合系统。可解释性人工智能的进展与人工智能方法的发展紧密相关,例如我们在早期的论文“可解释的知识支持系统的基础”中所涉及的类别,涵盖了专家系统、语义web方法、认知助手和机器学习方法。我们注意到这些方法主要处理可解释性的特定方面。例如,由专家系统产生的解释主要用于提供推理所需的痕迹、来源和理由。这些由认知助理提供的模型能够调整它们的形式以适应用户的需求,并且在机器学习和专家系统领域,解释为模型的功能提供了一种“直觉”。

成为VIP会员查看完整内容
0
62

【简介】近些年,将计算智能应用于金融业已经引起了学术界和金融界的广泛关注。研究人员发布了大量的研究成果和各种各样的模型。同时,在机器学习领域,深度学习在近期也引起了大量的关注,主要是因为这些经典的深度学习模型表现优于传统模型。金融是深度学习模型开始受到关注的一个特殊领域,然而,这个领域非常开放,仍然存在很多研究机会。在这篇综述中,我们尝试着提供一个已经开发好的,可用在金融应用当中的深度学习模型。我们不仅根据模型的实现进行了分类,还对这些深度学习模型进行了分析。此外,我们还旨在确定未来深度学习模型在金融领域有可能的实现,以及强调了该领域正在进行的研究。

原始链接:

https://arxiv.org/abs/2002.05786

介绍

股票市场预测、算法交易、信用风险评估、投资组合配置、资产定价和衍生品市场都是机器学习研究人员关注的领域,他们致力于开发出能够为金融业提供实时工作解决方案的模型。因此,目前文献中存在大量有关的出版物和实现。

然而,在机器学习领域中,深度学习是一个新兴的领域,并且每年都在快速增长。结果越来越多的深度学习金融模型开始出现在会议和期刊上。我们在这篇论文中关注的是目前在金融领域深度学习模型之间的不同之处。在这种方式下,依据各自的兴趣点研究人员和从业者可以决定他们应该走哪条路。

在这篇论文中,我们尝试着为下列研究中的问题提供答案:

  • 有哪些金融应用可以用到深度学习?
  • 当前在这些应用领域中的研究现状如何?
  • 从学术/工业研究的角度来看,哪些领域有很大的潜力?
  • 在不同的应用环境中哪些深度学习模型表现更好?
  • 深度学习模型和传统的机器学习技术相比如何?
  • 在金融领域深度学习研究的未来方向是什么?

金融领域中的机器学习

早在40年前,金融就一直是最受机器学习关注的应用领域之一。到目前为止,在金融的各个领域已经发表了成千上万的研究论文,整体的兴趣似乎不会很快消失。尽管这篇调查论文仅仅关注于深度学习的实现,但是我们希望通过引用过去20年的相关调查,为读者提供一些以前在金融领域关于机器学习研究的见解。

深度学习

深度学习是一种特定类型的机器学习,由多个ANN层组成。它为数据建模提供了高级别的抽象。目前,主要的深度学习模型有以下几种:

DMLP(深度多层感知机)、CNNs、RNNs、LSTM、RBMs(受限波兹曼机)、DBNs(Deep Belief Networks 和自编码器(AEs)。

成为VIP会员查看完整内容
0
78

可解释推荐尝试开发模型,不仅生成高质量的推荐,而且生成直观的解释。解释可以是事后的,也可以直接来自可解释的模型(在某些上下文中也称为可解释的或透明的模型)。可解释推荐尝试解决为什么的问题:通过向用户或系统设计者提供解释,它帮助人们理解为什么算法推荐某些项目,而人既可以是用户,也可以是系统设计者。可解释推荐有助于提高推荐系统的透明度、说服力、有效性、可信度和满意度。

在这次调查中,我们回顾了在2019年或之前可解释的建议的工作。我们首先通过将推荐问题划分为5W来强调可解释推荐在推荐系统研究中的地位。什么,什么时候,谁,在哪里,为什么。然后,我们从三个角度对可解释推荐进行了全面的调查:1)我们提供了可解释推荐的研究时间轴,包括早期的用户研究方法和最近的基于模型的方法。2)我们提供了一个二维分类法来对现有的可解释推荐研究进行分类:一个维度是解释的信息源(或显示样式),另一个维度是生成可解释推荐的算法机制。3)我们总结了可解释推荐如何应用于不同的推荐任务,如产品推荐、社交推荐和POI推荐。我们还专门用一节来讨论更广泛的IR和AI/ML研究中的解释视角。最后,我们讨论了未来可解释推荐研究领域的发展方向。

成为VIP会员查看完整内容
0
76
小贴士
相关资讯
2019->2020必看的十篇「深度学习领域综述」论文
极市平台
16+阅读 · 2020年1月2日
DL | 语义分割综述
机器学习算法与Python学习
51+阅读 · 2019年3月13日
推荐系统资源(文献、工具、框架)整理
专知
15+阅读 · 2019年2月4日
AI综述专栏 | 基于深度学习的目标检测算法综述
人工智能前沿讲习班
11+阅读 · 2018年12月7日
AI综述专栏 | 人脸检测算法综述
人工智能前沿讲习班
6+阅读 · 2018年9月10日
AI综述专栏|多模态学习研究进展综述
人工智能前沿讲习班
54+阅读 · 2018年7月13日
AI综述专栏 | 跨领域推荐系统文献综述(上)
人工智能前沿讲习班
13+阅读 · 2018年5月16日
综述 | 知识图谱发展概述
PaperWeekly
60+阅读 · 2017年11月3日
如何做文献综述:克雷斯威尔五步文献综述法
清华大学研究生教育
13+阅读 · 2017年7月10日
相关VIP内容
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
59+阅读 · 2020年6月26日
专知会员服务
62+阅读 · 2020年3月19日
专知会员服务
78+阅读 · 2020年2月27日
专知会员服务
59+阅读 · 2020年2月8日
专知会员服务
123+阅读 · 2020年1月23日
专知会员服务
198+阅读 · 2020年1月1日
可解释推荐:综述与新视角
专知会员服务
76+阅读 · 2019年10月13日
相关论文
Directions for Explainable Knowledge-Enabled Systems
Shruthi Chari,Daniel M. Gruen,Oshani Seneviratne,Deborah L. McGuinness
15+阅读 · 2020年3月17日
Anomalous Instance Detection in Deep Learning: A Survey
Saikiran Bulusu,Bhavya Kailkhura,Bo Li,Pramod K. Varshney,Dawn Song
21+阅读 · 2020年3月16日
Qingyu Guo,Fuzhen Zhuang,Chuan Qin,Hengshu Zhu,Xing Xie,Hui Xiong,Qing He
70+阅读 · 2020年2月28日
Pan Li,Alexander Tuzhilin
5+阅读 · 2019年10月11日
Taking Human out of Learning Applications: A Survey on Automated Machine Learning
Quanming Yao,Mengshuo Wang,Yuqiang Chen,Wenyuan Dai,Hu Yi-Qi,Li Yu-Feng,Tu Wei-Wei,Yang Qiang,Yu Yang
10+阅读 · 2019年1月17日
Abhishek Gupta,Benjamin Eysenbach,Chelsea Finn,Sergey Levine
6+阅读 · 2018年6月12日
Han Zhu,Xiang Li,Pengye Zhang,Guozheng Li,Jie He,Han Li,Kun Gai
7+阅读 · 2018年5月21日
Yongfeng Zhang,Xu Chen
10+阅读 · 2018年5月13日
Xu Chen,Yongfeng Zhang,Hongteng Xu,Yixin Cao,Zheng Qin,Hongyuan Zha
7+阅读 · 2018年1月31日
Shuai Zhang,Lina Yao,Aixin Sun
4+阅读 · 2017年8月3日
Top