推荐系统 技术、评估及高效算法 PDF
资源名称:推荐系统 技术、评估及高效算法 PDF
作者简介:
弗朗西斯科·里奇(Francesco Ricci),意大利博尔扎诺自由大学计算机科学副教授。目前他的研究兴趣包括推荐系统、智能接口、移动系统、机器学习、案例推理、信息和通信技术在旅游中的应用。他是《Journal of Information Technology and Tourism》杂志的编委,还是ACM和IEEE会员。他还是ACM会议推荐系统分会的指导委员会成员。
利奥·罗卡奇(Lior Rokach),以色列本-古里安大学信息系统工程系助理教授。他是智能信息系统方面公认的专家,在这一领域处于世界领先地位。他的主要研究领域包括数据挖掘、模式识别和推荐系统。他的70篇论文被主流期刊、会议和书籍等引用。
布拉哈·夏皮拉(Bracha Shapira),以色列本-古里安大学信息系统工程系助理教授。目前她的研究兴趣包括推荐系统、信息检索、个性化、用户建模和社交网络。她是本-古里安大学德国电信实验室研究项目负责人,并且还是ACM和IEEE会员。
保罗 B. 坎特(Paul Kantor),罗格斯大学通信与信息学院情报学教授,兼任计算机科学系和RUTCOR中心运筹学教授。目前他的研究兴趣包括协作信息发现、文本分类、文本或图像索引和检索。他是美国科学促进会会士,ACM、IEEE和ASIST会员。他的研究得到了美国NSF和国土安全部等机构的支持。
资源目录:
推荐序一
推荐序二
译者序
前言
第1章 概述 1
1.1 简介 1
1.2 推荐系统的功能 3
1.3 数据和知识资源 5
1.4 推荐技术 7
1.5 应用与评价 10
1.6 推荐系统与人机交互 12
1.6.1 信任、解释和说服力 13
1.6.2 会话系统 13
1.6.3 可视化 14
1.7 推荐系统是个交叉学科领域 15
1.8 出现的问题和挑战 16
1.8.1 本书对出现的问题的讨论 16
1.8.2 挑战 18
参考文献 20
第一部分 基础技术
第2章 推荐系统中的数据挖掘方法 28
2.1 简介 28
2.2 数据预处理 29
2.2.1 相似度度量方法 29
2.2.2 抽样 30
2.2.3 降维 31
2.2.4 去噪 33
2.3 分类 34
2.3.1 最近邻 34
2.3.2 决策树 35
2.3.3 基于规则的分类 36
2.3.4 贝叶斯分类器 36
2.3.5 人工神经网络 38
2.3.6 支持向量机 39
2.3.7 分类器的集成 40
2.3.8 评估分类器 41
2.4 聚类分析 42
2.4.1 k-means 43
2.4.2 改进的k-means 44
2.5 关联规则挖掘 44
2.6 总结 46
致谢 47
参考文献 47
第3章 基于内容的推荐系统:前沿和趋势 51
3.1 简介 51
3.2 基于内容的推荐系统的基础 52
3.2.1 基于内容的推荐系统的高层次结构 52
3.2.2 基于内容过滤的优缺点 54
3.3 基于内容的推荐系统的现状 55
3.3.1 物品表示 56
3.3.2 学习用户特征的方法 62
3.4 趋势和未来研究 65
3.4.1 推荐过程中用户产生内容的作用 65
3.4.2 超越特化:惊喜度 66
3.5 总结 68
参考文献 68
第4章 基于近邻推荐方法综述 74
4.1 简介 74
4.1.1 问题公式化定义 75
4.1.2 推荐方法概要 76
4.1.3 基于近邻方法的优势 77
4.1.4 目标和概要 78
4.2 基于近邻推荐 78
4.2.1 基于用户评分 79
4.2.2 基于用户分类 80
4.2.3 回归与分类 80
4.2.4 基于物品推荐 81
4.2.5 基于用户和基于物品推荐的对比 81
4.3 近邻方法的要素 83
4.3.1 评分标准化 83
4.3.2 相似度权重计算 85
4.3.3 近邻的选择 89
4.4 高级进阶技术 90
4.4.1 降维方法 90
4.4.2 基于图方法 92
4.5 总结 95
参考文献 96
第5章 协同过滤算法的高级课题100 5. 1
简介 100
5.2 预备知识 101
5.2.1 基准预测 102
5.2.2 Netflix数据 103
5.2.3 隐式反馈 103
5.3 因子分解模型 104
5.3.1 SVD 104
5.3.2 SVD++ 105
5.3.3 时间敏感的因子模型 106
5.3.4 比较 111
5.3.5 总结 112
5.4 基于邻域的模型 112
5.4.1 相似度度量 113
5.4.2 基于相似度的插值 113
5.4.3 联合派生插值权重 115
5.4.4 总结 117
5.5 增强的基于邻域的模型 117
5.5.1 全局化的邻域模型 118
5.5.2 因式分解的邻域模型 122
5.5.3 基于邻域的模型的动态时序 126
5.5.4 总结 127
5.6 基于邻域的模型和因子分解模型的比较 127
参考文献 129
第6章 开发基于约束的推荐系统 131
6.1 简介 131
6.2 推荐知识库的开发 133
6.3 推荐过程中的用户导向 137
6.4 计算推荐结果 142
6.5 项目和案例研究的经验 143
6.6 未来的研究方法 144
6.7 总结 147
参考文献 147
第7章 情境感知推荐系统 151
7.1 简介 151
7.2 推荐系统中的情境 152
7.2.1 什么是情境 152
7.2.2 在推荐系统实现情境信息的建模 155
7.2.3 获取情境信息 158
7.3 结合情境的推荐系统形式 159
7.3.1 情境预过滤 161
7.3.2 情境后过滤 163
7.3.3 情境建模 164
7.4 多种方法结合 167
7.4.1 组合预过滤器案例研究:算法 168
7.4.2 组合预过滤器案例研究:实验结果 168
7.5 情境感知推荐系统的其他问题 170
7.6 总结 171
致谢 171
参考文献 172
第二部分 推荐系统的应用与评估
第8章 推荐系统评估 176
8.1 简介 176
8.2 实验设置 177
8.2.1 离线实验 178
8.2.2 用户调查 180
8.2.3 在线评估 182
8.2.4 得出可靠结论 182
8.3 推荐系统属性 185
8.3.1 用户偏好 185
8.3.2 预测准确度 186
8.3.3 覆盖率 191
8.3.4 置信度 192
8.3.5 信任度 193
8.3.6 新颖度 194
8.3.7 惊喜度 195
8.3.8 多样性 195
8.3.9 效用 196
8.3.10 风险 197
8.3.11 健壮性 197
8.3.12 隐私 198
8.3.13 适应性 198
8.3.14 可扩展性 199
8.4 总结 199
参考文献 199
第9章 IPTV服务提供商推荐系统:一个大规模真实产品环境的应用203 9.1 简介 203
9.2 IPTV架构 204
9.3 推荐系统架构 206
9.3.1 数据搜集 206
9.3.2 批处理和实时阶段 207
9.4 推荐算法 208
9.4.1 推荐算法概述 209
9.4.2 基于内容隐语义分析算法 210
9.4.3 基于物品的协同过滤算法 213
9.4.4 基于降维的协同过滤算法 214
9.5 推荐服务 215
9.6 系统评价 216
9.6.1 离线分析 218
9.6.2 在线分析 220
9.7 总结 223
参考文献 223
第10章 走出实验室的推荐系统 225
10.1 简介 225
10.2 设计现实环境中的推荐系统 225
10.3 理解推荐系统的环境 226
10.3.1 应用模型 226
10.3.2 用户建模 230
10.3.3 数据模型 233
10.3.4 一个使用环境模型的方法 235
10.4 在迭代设计过程中理解推荐验证步骤 236
10.4.1 算法的验证 236
10.4.2 推荐结果的验证 237
10.5 应用实例:一个语义新闻推荐系统 240
10.5.1 背景:MESH工程 240
10.5.2 MESH的环境模型 240
10.5.3 实践:模型的迭代实例化 243
10.6 总结 244
参考文献 244
第11章 匹配推荐系统的技术与领域 247
11.1 简介 247
11.2 相关工作 247
11.3 知识源 248
11.4 领域 250
11.4.1 异构性 250
11.4.2 风险性 251
11.4.3 变动性 251
11.4.4 交互风格 251
11.4.5 偏好稳定性 251
11.4.6 可理解性 252
11.5 知识源 252
11.5.1 社群知识 252
11.5.2 个人知识 253
11.5.3 基于内容的知识 253
11.6 从领域到技术 254
11.6.1 算法 255
11.6.2 抽样推荐领域 256
11.7 总结 257
致谢 257
参考文献 257
第12章 用于技术强化学习的推荐系统 261
12.1 简介 261
12.2 背景 262
12.2.1 TEL作为上下文 262
12.2.2 TEL推荐的目标 263
12.3 相关工作 264
12.3.1 自适应教育超媒体 264
12.3.2 学习网络 265
12.3.3 相同点与不同点 267
12.4 TEL推荐系统调查 268
12.5 TEL推荐系统的评估 271
12.5.1 对组件的评估 272
12.5.2 评估TEL推荐系统时需要考虑的问题 273
12.6 总结与展望 274
致谢 274
参考文献 275
第三部分 推荐系统的影响
第13章 基于评价推荐系统的进展 282
13.1 简介 282
13.2 早期:评价系统/已得益处 282
13.3 评价系统的表述与检索挑战 283
13.3.1 评价表述的方式 283
13.3.2 基于评价的推荐系统中的检索挑战 289
13.4 评价平台中的交互研究 293
13.4.1 扩展到其他评价平台 294
13.4.2 用户直接操作与限制用户控制的比较 295
13.4.3 支持性解释、置信和信任 296
13.4.4 可视化、自适应性和分区动态性 297
13.4.5 关于多文化的适用性的差异 298
13.5 评价的评估:资源、方法和标准 298
13.5.1 资源和方法 298
13.5.2 评估标准 299
13.6 总结与展望 300
参考文献 301
第14章 构建更值得信任和具有说服力的推荐系统:特性对评估推荐系统的影响 305
14.1 简介 305
14.2 推荐系统作为社交角色 306
14.3 来源可信度 306
14.3.1 可信度 306
14.3.2 专业能力 307
14.3.3 对来源可信度的影响 307
14.4 人际交互中信息特性的研究 307
14.4.1 相似度 307
14.4.2 喜好度 308
14.4.3 权威的象征 308
14.4.4 演讲的风格 308
14.4.5 外在吸引力 308
14.4.6 幽默 309
14.5 人机交互中的特性 309
14.6 用户与推荐系统交互的特性 309
14.6.1 推荐系统类型 310
14.6.2 输入特性 310
14.6.3 过程特性 311
14.6.4 输出特性 311
14.6.5 内嵌的智能体特性 312
14.7 讨论 312
14.8 影响 313
14.9 未来研究方向 314
参考文献 314
第15章 设计和评估推荐系统的解释 321
15.1 简介 321
15.2 指引 322
15.3 专家系统的说明 322
15.4 定义的目标 322
15.4.1 系统如何工作:透明性 324
15.4.2 允许用户告诉系统它是错误的:被理解 324
15.4.3 增加用户对系统上的信任:信任度 325
15.4.4 说服用户尝试或购买:说服力 326
15.4.5 帮助用户充分地决策:有效性 327
15.4.6 帮助用户快速制定决策:效率 328
15.4.7 使系统的应用愉悦:满意度 328
15.5 评估解释在推荐系统的作用 329
15.5.1 精准度 329
15.5.2 学习效率 329
15.5.3 覆盖度 330
15.5.4 接受度 330
15.6 用推荐设计展示与互动 330
15.6.1 展示推荐 330
15.6.2 与推荐系统交互 331
15.7 解释风格 332
15.7.1 基于协同风格 333
15.7.2 基于内容风格 334
15.7.3 基于案例风格 334
15.7.4 基于知识/自然语言风格 335
15.7.5 基于人口统计风格 335
15.8 总结与展望 336
参考文献 337
第16章 基于实例评价研究的产品推荐系统的可用性准则 340
16.1 简介 340
16.2 预备知识 341
16.2.1 交互模型 341
16.2.2 基于效用的推荐系统 342
16.2.3 准确率、信任度和代价的框架 344
16.2.4 本章结构 344
16.3 相关工作 345
16.3.1 推荐系统分类 345
16.3.2 基于评分的推荐系统 345
16.3.3 基于案例的推荐系统 345
16.3.4 基于效用的推荐系统 345
16.3.5 基于评价的推荐系统 346
16.3.6 其他设计指导准则 346
16.4 初始偏好提取 347
16.5 通过实例激励用户表示偏好 349
16.5.1 需要多少实例 350
16.5.2 需要哪些实例 350
16.6 偏好修正 352
16.6.1 偏好冲突和部分满足 352
16.6.2 权衡辅助 353
16.7 展示策略 354
16.7.1 一次推荐一项物品 354
16.7.2 推荐k项最匹配的物品 355
16.7.3 解释界面 355
16.8 准则验证模型 357
16.9 总结 359
参考文献 359
第17章 基于示意图的产品目录可视化 363
17.1 简介 363
17.2 基于图的可视化方法 364
17.2.1 自组织映射 364
17.2.2 树图 365
17.2.3 多维缩放 366
17.2.4 非线性主成分分析 367
17.3 产品目录图 367
17.3.1 多维缩放 368
17.3.2 非线性主成分分析 369
17.4 通过点击流分析决定属性权重 370
17.4.1 泊松回归模型 370
17.4.2 处理缺失值 371
17.4.3 使用泊松回归选择权值 371
17.4.4 阶梯式泊松回归模型 371
17.5 图像购物界面 372
17.6 电子商务应用 373
17.6.1 使用属性权值的基于MDS的产品目录图 373
17.6.2 基于NL-PCA的产品目录图 375
17.6.3 图像购物界面 377
17.7 总结与展望 379
致谢 380
参考文献 380
第四部分 推荐系统与群体
第18章 个性化Web搜索中的群体、协作与推荐系统 384
18.1 简介 384
18.2 网络搜索历史简介 385
18.3 网络搜索的未来 387
18.3.1 个性化网络搜索 387
18.3.2 协同信息检索 390
18.3.3 向社交搜索前进 392
18.4 案例研究1:基于群体的网络搜索 392
18.4.1 搜索群体中的重复性和规律性 392
18.4.2 协同网络搜索系统 393
18.4.3 评估 395
18.4.4 讨论 396
18.5 案例研究2:网络搜索共享 396
18.5.1 HeyStaks系统 397
18.5.2 HeyStaks推荐引擎 399
18.5.3 评估 400
18.5.4 讨论 402
18.6 总结 402
致谢 403
参考文献 403
第19章 社会化标签推荐系统 409
19.1 简介 409
19.2 社会化标签推荐系统 410
19.2.1 大众分类法 410
19.2.2 传统推荐系统范式 411
19.2.3 多模式推荐 412
19.3 现实社会化标签推荐系统 413
19.3.1 有哪些挑战 413
19.3.2 案例BibSonomy 413
19.3.3 标签获取 415
19.4 社会化标签系统的推荐算法 416
19.4.1 协同过滤 416
19.4.2 基于排序的推荐 418
19.4.3 基于内容的社会化标签推荐系统 421
19.4.4 评估方案和评估度量 423
19.5 算法比较 424
19.6 总结与展望 426
参考文献 427
第20章 信任和推荐 430
20.1 简介 430
20.2 信任的表示与计算 431
20.2.1 信任表示 431
20.2.2 信任计算 433
20.3 信任增强推荐系统 436
20.3.1 动机 436
20.3.2 进展 437
20.3.3 实验比较 441
20.4 进展和开放性挑战 445
20.5 总结 446
参考文献 446
第21章 组推荐系统 449
21.1 简介 449
21.2 应用场景和群组推荐系统分类 450
21.2.1 交互式电视 450
21.2.2 环绕智能 450
21.2.3 基于场景的推荐系统 451
21.2.4 基于分类的群组推荐 451
21.3 合并策略 452
21.3.1 合并策略概览 452
21.3.2 合并策略在相关工作中的应用 453
21.3.3 哪种策略效果最好 454
21.4 序列顺序的影响 455
21.5 对情感状态建模 456
21.5.1 对个人的满意度进行建模 457
21.5.2 个人满意度对群组的影响 458
21.6 情感状态在合并策略中的使用 459
21.7 对单个用户进行组推荐 460
21.7.1 多准则 460
21.7.2 冷启动问题 461
21.7.3 虚拟组成员 462
21.8 总结与挑战 462
21.8.1 提出的主要问题 463
21.8.2 警告:组建模 463
21.8.3 面临的挑战 464
致谢 464
参考文献 465
第五部分 高级算法
第22章 推荐系统中的偏好聚合468 22.1 简介 468
22.2 推荐系统中的聚合类型 468
22.2.1 协同过滤中的偏好聚合 470
22.2.2 CB与UB推荐中的特性聚合 470
22.2.3 CB与UB的配置文件构建 470
22.2.4 物品和用户相似度以及邻居的形成 471
22.2.5 基于实例推理的连接词在推荐系统中的应用 472
22.2.6 加权混合系统 472
22.3 聚合函数概论 472
22.3.1 定义和属性 472
22.3.2 聚合成员 475
22.4 聚合函数的构建 479
22.4.1 数据收集和处理 479
22.4.2 期望属性、语义、解释 480
22.4.3 函数表现的复杂度及其理解 481
22.4.4 权重和参数的确定 482
22.5 推荐系统中的复杂聚合过程:为特定应用定制 482
22.6 总结 485
22.7 进阶阅读 485
致谢 486
参考文献 486
第23章 推荐系统中的主动学习 488
23.1 简介 488
23.1.1 推荐系统中主动学习的目标 489
23.1.2 例证 490
23.1.3 主动学习的类型 490
23.2 数据集的属性 491
23.3 主动学习在推荐系统中的应用 492
23.4 主动学习公式 493
23.5 基于不确定性的主动学习 495
23.5.1 输出不确定性 495
23.5.2 决策边界不确定性 496
23.5.3 模型不确定性 497
23.6 基于误差的主动学习 498
23.6.1 基于实例的方法 498
23.6.2 基于模型的方法 500
23.7 基于组合的主动学习 501
23.7.1 基于模型的方法 501
23.7.2 基于候选的方法 502
23.8 基于会话的主动学习 504
23.8.1 基于实例的评论 504
23.8.2 基于多样性的方法 504
23.8.3 基于查询编辑的方法 505
23.9 计算因素考虑 505
23.10 总结 505
致谢 506
参考文献 506
第24章 多准则推荐系统 510
24.1 简介 510
24.2 推荐作为多准则决策问题 511
24.2.1 决策目标 512
24.2.2 准则簇 512
24.2.3 全局偏好模型 513
24.2.4 决策支持流程 513
24.3 推荐系统的MCDM框架:经验教训 515
24.4 多准则评分推荐 517
24.4.1 传统的单值评分推荐问题 517
24.4.2 引入多准则评分来扩展传统推荐系统 518
24.5 多准则评分推荐算法综述 519
24.5.1 预测中使用多准则评分 519
24.5.2 推荐中使用多准则评分 524
24.6 讨论及未来工作 526
24.7 总结 527
致谢 528
参考文献 528
第25章 具有健壮性的协同推荐 533
25.1 简介 533
25.2 问题定义 534
25.3 攻击分类 536
25.3.1 基础攻击 536
25.3.2 非充分信息攻击 537
25.3.3 打压攻击模型 537
25.3.4 知情攻击模型 538
25.4 检测系统健壮性 539
25.4.1 评估矩阵 539
25.4.2 推举攻击 540
25.4.3 打压攻击 541
25.4.4 知情攻击 542
25.4.5 攻击效果 543
25.5 攻击检测 543
25.5.1 评估矩阵 544
25.5.2 单用户检测 544
25.5.3 用户组检测 545
25.5.4 检测结果 548
25.6 健壮的推荐算法 548
25.6.1 基于模型的推荐 548
25.6.2 健壮的矩阵分解算法 549
25.6.3 其他具有健壮性的推荐算法 549
25.6.4 影响力限制器和基于信誉的推荐 550
25.7 总结 550
致谢 551
参考文献 551
本书贡献者名单 554
翻译团队名单560
资源截图: