机械工业出版社计算机科学丛书推荐系统:原理与实践

本书特色

[

本书介绍当前推荐系统领域中的经典方法。不仅详细讨论了各类方法,还对同类技术进行了归纳总结,这有助于读者对当前推荐系统研究领域有全面的了解。书中提供了大量的例子和习题来帮助读者深入理解和掌握相关技术。此外,本书还介绍了当前新的研究方向,为读者进行推荐系统技术的研究提供参考。本书既可以作为计算机相关专业本科生和研究生的教材,也适合开发人员和研究人员阅读。

]

前言

[

前言Recommender Systems: The Textbook大自然呈现在我们面前的只是一头狮子的尾巴。但不要怀疑狮子的存在,尽管它因为身型巨大不能马上现出全身。

——Albert Einstein随着Web成为商务和电子交易的重要媒介,推荐系统在20世纪90年代变得越来越重要。人们很早就认识到Web为个性化服务提供了空前的机会,这是其他渠道是不可能做到的。特别是Web为数据收集提供了便利,并且提供了一种非侵入式地推荐物品的用户界面。

自此以后,在公众眼中,推荐系统已经得到了显著的发展。这一事实的证据是,有许多会议和研讨会专门探讨该领域。会议ACM Conference on Recommender Systems特别值得一提,因为它为该领域定期贡献了许多前沿工作。推荐系统领域非常多样化,因为它能够使用各种类型的用户偏好数据和用户需求数据来做推荐。推荐系统中*著名的方法包括协同过滤方法、基于内容的方法和基于知识的方法。这三种方法构成了推荐系统研究领域的基本支柱。近年来,已经设计了一些专门的方法来针对不同的数据领域和上下文,例如时间、位置和社会信息。针对专门的场景提出了大量高级的方法,这些方法可以调整用于不同的应用领域,例如查询日志挖掘、新闻推荐和计算广告。本书的结构安排体现了这些重要的话题。本书的章节可以分为三类:

1)算法和评估:这些章节讨论了推荐系统中的基本算法,包括协同过滤方法(第2和4章)、基于内容的方法(第4章)和基于知识的方法(第5章)。这些方法的混合在第6章中讨论。第7章讨论了推荐系统评估。

2)特定领域和上下文的推荐:推荐系统的上下文在提供有效推荐方面扮演了至关重要的角色。例如,一个用户想要用其位置作为附加的上下文(context)来查找饭店。推荐的上下文可以被看作是影响推荐目标的重要辅助信息。不同类型的域,例如时间数据、空间数据和社会数据,提供了不同类型的上下文。相关的方法在第8~11章中讨论。第11章也讨论了利用社会信息来增加推荐过程可信度的话题。*近的话题(如分解机和可信推荐系统)在这些章节中也有涉及。

3)高级话题和应用:在第12章中,我们将从各个角度讨论推荐系统的健壮性,例如欺诈(shilling)系统、攻击模式及其防御。此外,近期的一些话题,例如排名学习、多臂赌博机、组推荐系统、多标准推荐系统和主动学习系统,将在第13章中讨论。该章的一个重要目标是向读者介绍当前研究的基本思想和原则。虽然不可能在一本书里对当前所有的研究技术细节进行讨论,但我们希望*后一章能够在高级话题方面为读者“破冰”。在这一章中,我们也研究了推荐技术的一些应用环境,例如新闻推荐、查询推荐和计算广告。本章还讨论了如何将前面章节中介绍的方法应用于各个不同的领域。

尽管本书是作为教科书来编写的,但仍有很多来自于工业界和学术界的读者。因此,我们也从应用角度和文献角度来撰写此书。书中提供了大量的示例和习题,使得它可以被用作教科书。由于大部分推荐系统课程只涵盖基础话题,因此有关基础话题的章节和算法着重于课堂教学。另一方面,工业界人员也许发现讨论上下文敏感的推荐系统的章节很有用,因为在许多真实的应用中会有大量可用的上下文辅助信息。第13章的应用部分是特别为工业界人员编写的,不过教师也许会发现它在推荐课程中也是有用的。

*后,我们对所使用的符号进行简要的介绍。本书中一直使用一个m×n的评分矩阵,记为R,其中m是用户的数量,n是物品的数量。矩阵R是不完整的,因为只有一部分项是已观测的。R的第(i,j)项表示用户i对物品j的评分,当它是已观测项时,被记为rij。当项(i,j)是由推荐算法预测得到(而不是用户指定)时,被记为带“帽子”符号(即抑扬符号)的r∧ij,表示它是一个预测的值。向量用“上划线”来表示,例如X或y。

致谢Recommender Systems: The Textbook感谢在撰书期间妻子和女儿给予我的爱和支持,感谢父母给我持续的爱。

本书得到了很多人直接和间接的帮助,我很感激他们。在撰写本书时,我收到了许多同事的反馈,他们是Xavier Amatriain、Kanishka Bhaduri、Robin Burke、Martin Ester、Bart Goethals、Huan Liu、Xia Ning、Saket Sathe、Jiliang Tang、Alexander Tuzhilin、Koen Versetrepen和Jieping Ye。感谢他们所提供的建设性反馈。这些年来,我从大量合作者那里受益良多。这些见解直接或间接地影响了本书。首先感谢多年来与我合作的Philip S. Yu。其他重要的合作者还包括Tarek F. Abdelzaher、Jing Gao、Quanquan Gu、Manish Gupta、Jiawei Han、Alexander Hinneburg、Thomas Huang、Nan Li、Huan Liu、Ruoming Jin、Daniel Keim、Arijit Khan、Latifur Khan、Mohammad M. Masud、Jian Pei、Magda Procopiuc、Guojun Qi、Chandan Reddy、Saket Sathe、Jaideep Srivastava、Karthik Subbian、Yizhou Sun、Jiliang Tang、Min�睭suan Tsai、Haixun Wang、Jianyong Wang、Min Wang、Joel Wolf、Xifeng Yan、Mohammed Zaki、ChengXiang Zhai和Peixiang Zhao。我也要感谢导师James B. Orlin在早期对我的指导。

还要感谢我的经理Nagui Halim在我撰写此书时所提供的巨大支持。他的专业支持对我过去和现在的许多书都起着重要的作用。

*后,感谢Lata Aggarwal用微软PowerPoint软件帮我绘制了一些图片。

]

内容简介

[

本书介绍当前推荐系统领域中的经典方法。不仅详细讨论了各类方法,还对同类技术进行了归纳总结,这有助于读者对当前推荐系统研究领域有全面的了解。书中提供了大量的例子和习题来帮助读者深入理解和掌握相关技术。此外,本书还介绍了当前新的研究方向,为读者进行推荐系统技术的研究提供参考。本书既可以作为计算机相关专业本科生和研究生的教材,也适合开发人员和研究人员阅读。

]

目录

第1章推荐系统概述1.1引言1.2推荐系统的目标1.2.1推荐系统应用范围1.3推荐系统的基本模型1.3.1协同过滤模型1.3.2基于内容的推荐系统1.3.3基于知识的推荐系统1.3.4人口统计推荐系统1.3.5混合集成的推荐系统1.3.6对推荐系统的评价1.4推荐系统领域特有的挑战1.4.1基于上下文的推荐系统1.4.2时间敏感的推荐系统1.4.3基于位置的推荐系统1.4.4社交信息系统1.5高级论题和应用1.5.1推荐系统中的冷启动问题1.5.2抗攻击推荐系统1.5.3组推荐系统1.5.4多标准推荐系统1.5.5推荐系统中的主动学习1.5.6推荐系统中的隐私问题1.5.7应用领域1.6小结1.7相关工作1.8习题第2章基于近邻的协同过滤2.1引言2.2评分矩阵的关键性质2.3通过基于近邻的方法预测评分2.3.1基于用户的近邻模型2.3.2基于物品的近邻模型2.3.3高效的实现和计算复杂度2.3.4基于用户的方法和基于物品的方法的比较2.3.5基于近邻方法的优劣势2.3.6基于用户的方法和基于物品的方法的联合2.4聚类和基于近邻的方法2.5降维与近邻方法2.5.1处理偏差2.6近邻方法的回归模型视角2.6.1基于用户的*近邻回归2.6.2基于物品的*近邻回归2.6.3基于用户的方法和基于物品的方法的结合2.6.4具有相似度权重的联合插值2.6.5稀疏线性模型2.7基于近邻方法的图模型2.7.1用户物品图2.7.2用户用户图2.7.3物品物品图2.8小结2.9相关工作2.10习题第3章基于模型的协同过滤3.1引言3.2决策和回归树3.2.1将决策树扩展到协同过滤3.3基于规则的协同过滤3.3.1将关联规则用于协同过滤3.3.2面向物品的模型与面向用户的模型3.4朴素贝叶斯协同过滤3.4.1处理过拟合3.4.2示例:使用贝叶斯方法处理二元评分3.5将任意分类模型当作黑盒来处理3.5.1示例:使用神经网络作为黑盒分类器3.6潜在因子模型3.6.1潜在因子模型的几何解释3.6.2潜在因子模型的低秩解释3.6.3基本矩阵分解原理3.6.4无约束矩阵分解3.6.5奇异值分解3.6.6非负矩阵分解3.6.7理解矩阵因子分解方法族3.7集成因子分解和近邻模型3.7.1基准估计:非个性化偏倚中心模型3.7.2模型的近邻部分3.7.3模型的潜在因子部分3.7.4集成近邻和潜在因子部分3.7.5求解优化模型3.7.6关于精度的一些观察3.7.7将潜在因子模型集成到任意模型3.8小结3.9相关工作3.10习题第4章基于内容的推荐系统4.1引言4.2基于内容的系统的基本组件4.3预处理和特征提取4.3.1特征提取4.3.2特征表示和清洗4.3.3收集用户的偏好4.3.4监督特征选择和加权4.4学习用户画像和过滤4.4.1*近邻分类4.4.2与基于案例的推荐系统的关联性4.4.3贝叶斯分类器4.4.4基于规则的分类器4.4.5基于回归的模型4.4.6其他学习模型和比较概述4.4.7基于内容的系统的解释4.5基于内容的推荐与协同推荐4.6将基于内容的模型用于协同过滤4.6.1利用用户画像4.7小结4.8相关工作4.9习题第5章基于知识的推荐系统5.1引言5.2基于约束的推荐系统5.2.1返回相关结果5.2.2交互方法5.2.3排序匹配的物品5.2.4处理不可接受的结果或空集5.2.5添加约束5.3基于案例的推荐系统5.3.1相似性度量5.3.2批评方法5.3.3批评的解释5.4基于知识的系统的持久个性化5.5小结5.6相关工作5.7习题第6章基于集成的混合推荐系统6.1引言6.2从分类角度看集成方法6.3加权型混合系统6.3.1几种模型组合的方法6.3.2对分类中的bagging算法的调整6.3.3随机性注入算法6.4切换型混合系统6.4.1为解决冷启动问题的切换机制6.4.2桶模型6.5级联型混合系统6.5.1推荐结果的逐步优化6.5.2boosting算法6.6特征放大型混合系统6.7元级型混合系统6.8特征组合型混合系统6.8.1回归分析和矩阵分解6.8.2元级特征6.9交叉型混合系统6.10小结6.11相关工作6.12习题第7章推荐系统评估7.1引言7.2评估范例7.2.1用户调查7.2.2在线评估7.2.3使用历史数据集进行离线评估7.3评估设计的总体目标7.3.1精确性7.3.2覆盖率7.3.3置信度和信任度7.3.4新颖度7.3.5惊喜度7.3.6多样性7.3.7健壮性和稳定性7.3.8可扩展性7.4离线推荐评估的设计要点7.4.1Netflix Prize数据集的案例研究7.4.2为训练和测试分解评分7.4.3与分类设计的比较7.5离线评估的精确性指标7.5.1度量预测评分的精确性7.5.2通过相关性评估排名7.5.3通过效用评估排名7.5.4通过ROC曲线评估排名7.5.5哪种排名方式*好7.6评估指标的局限性7.6.1避免评估游戏7.7小结7.8相关工作7.9习题第8章上下文敏感的推荐系统8.1引言8.2多维方法8.2.1层级的重要性8.3上下文预过滤:一种基于降维的方法8.3.1基于集成的改进8.3.2多级别的估计8.4后过滤方法8.5上下文建模8.5.1基于近邻的方法8.5.2潜在因子模型8.5.3基于内容的模型8.6小结8.7相关工作8.8习题第9章时间与位

封面

机械工业出版社计算机科学丛书推荐系统:原理与实践

书名:机械工业出版社计算机科学丛书推荐系统:原理与实践

作者:[美]查鲁·C. 阿加沃尔

页数:374

定价:¥129.0

出版社:机械工业出版社

出版日期:2017-05-01

ISBN:9787111600329

PDF电子书大小:140MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注