Solr权威指南(上卷)_服务器教程
资源名称:Solr权威指南(上卷)
内容简介:
本书以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。
资源目录:
序言
第1章 初识Solr 1
1.1 Solr是什么 1
1.2 Solr的历史 2
1.3 为什么要选择Solr 2
1.4 Solr功能预览 3
1.5 Solr下载 3
1.6 Solr学习资源 5
1.7 Windows平台下部署Solr 7
1.7.1 部署Solr至Jetty 7
1.7.2 部署Solr至Tomcat 13
1.8 Linux平台下部署Solr 16
1.9 玩转post.jar 20
1.10 在Eclipse中编译Solr源码 25
1.11 本章总结 27
第2章 Solr基础 28
2.1 Solr Core 28
2.1.1 Solr Core简介 28
2.1.2 Core的基本管理 30
2.1.3 Core Http接口 35
2.1.4 添加索引至Core 36
2.2 Solr DIH 38
2.2.1 索引文件夹下的文本文件 38
2.2.2 索引JSON/XML/CSV文件 42
2.2.3 使用Tika索引Word/Excel/PDF 45
2.2.4 索引网络上的远程文件 52
2.2.5 索引XML文件 55
2.2.6 从数据库中导入数据至Solr 57
2.2.7 Solr DIH总结 62
2.3 Solr Full Import全量导入 78
2.4 Solr Delta-import增量导入 80
2.5 Solr索引 85
2.5.1 Lucene索引原理 85
2.5.2 Lucene中常见术语详解 87
2.5.3 创建Solr索引 98
2.5.4 Solr Cell 99
2.5.5 Solr索引去重检测 102
2.5.6 Solr更新请求处理链 104
2.5.7 Solr原子更新 105
2.5.8 使用Luke查看索引 107
2.6 本章总结 109
第3章 Solr配置 110
3.1 solr.xml配置详解 110
3.2 solrconf?ig.xml配置详解 112
3.3 schema.xml配置详解 139
3.3.1 Solr Schema设计思想 139
3.3.2 Solr眼里的世界 139
3.3.3 域分词 140
3.3.4 Solr的schema文件 140
3.3.5 Solr的域类型 141
3.3.6 Solr的域 153
3.3.7 Schema API 157
3.3.8 Schemaless Mode 165
3.4 data-conf?ig.xml配置详解 167
3.5 zoo.cfg配置详解 169
3.6 本章总结 169
第4章 Solr分词 170
4.1 分词的基本概念 170
4.1.1 理解Analyzer 170
4.1.2 理解Tokenizer 171
4.1.3 理解TokenFilter 172
4.2 Solr分词器 172
4.2.1 Analyzer 173
4.2.2 Tokenizer 174
4.2.3 TokenFilter 182
4.2.4 CharFilter 202
4.2.5 Solr自定义分词 206
4.3 中文分词器 217
4.3.1 IK分词器 217
4.3.2 Ansj分词器 223
4.3.3 MMSeg4J分词器 233
4.3.4 Paoding分词器 240
4.3.5 Jcseg分词器 245
4.3.6 Ictclas分词器 258
4.3.7 FudanNLP 259
4.3.8 HanLP 262
4.3.9 Jieba分词器 266
4.3.10 分词器使用建议 268
4.4 本章总结 270
第5章 Solr查询 271
5.1 Solr查询概述 271
5.2 Solr查询相关度简述 273
5.3 Solr的查询语法解析器 275
5.4 Lucene的基本查询语法 283
5.5 Solr的标准查询语法解析器 287
5.6 Solr DisMax 288
5.7 Solr eDisMax 291
5.8 Solr的其他查询语法解析器 298
5.9 Query VS Filter Query 305
5.9.1 fq VS q 306
5.9.2 Filter Query缓存 307
5.9.3 Filter Query执行顺序 308
5.9.4 Post Filter 308
5.10 Solr返回结果 309
5.10.1 设置响应输出格式 309
5.10.2 选择返回域 310
5.10.3 分页查询 312
5.11 Solr排序 313
5.11.1 根据域进行排序 313
5.11.2 缺失值处理 314
5.11.3 排序的内存占用 315
5.12 调试查询结果 315
5.12.1 返回调试信息 315
5.12.2 开启调试模式 316
5.13 本章总结 316
第6章 Solr Facet 317
6.1 理解Facet 317
6.2 Facet简单示例 319
6.3 Query Facet 326
6.4 Range Facet 328
6.5 FacetFilter 330
6.6 Multiselect Faceting 335
6.6.1 key 335
6.6.2 tag 336
6.7 本章总结 339
第7章 Solr高亮 340
7.1 什么是Solr高亮 340
7.2 Solr高亮的工作原理 342
7.2.1 Fragmenter 348
7.2.2 Scorer 349
7.2.3 Encoder & Formatter 349
7.3 Facet & Highlighting 350
7.4 高亮多值域 351
7.5 高亮参数 352
7.6 FastVectorHighlighter 355
7.7 PostingsHighlighter 356
7.8 本章总结 358
第8章 Solr Query Suggestion查询建议 360
8.1 Spell-Check 361
8.1.1 Spell-Check简单示例 361
8.1.2 Spell-Check查询组件 362
8.2 Autosuggest 366
8.3 基于N-Gram实现Autosuggest 369
8.4 基于用户行为实现Autosuggest 371
8.5 本章总结 375
第9章 Solr Group分组 376
9.1 Result grouping VS Field collapsing 377
9.2 按照指定域分组 377
9.3 每个分组返回多个文档 381
9.4 按照Function动态计算值分组 382
9.5 按照任意Query分组 383
9.6 Group的分页与排序 383
9.7 Group& Facet 384
9.8 Group分布式查询 387
9.9 Group缓存 388
9.10 使用Collapsing Query Parser实现高效的Field Collapsing 388
9.11 Solr Group VS SQL Group by 389
9.12 本章总结 390
第10章 Solr企业级应用 391
10.1 Solr源码编译与补丁应用 391
10.2 部署Solr 396
10.2.1 构建你自己的Solr发布版本 397
10.2.2 Embedded Solr 397
10.3 Solr硬件要求与系统配置 397
10.3.1 内存和SSD 397
10.3.2 JVM配置 398
10.3.3 思考Solr索引与查询性能 401
10.4 Solr数据批量导入 405
10.5 Solr Shard与Replication 406
10.5.1 Shard 406
10.5.2 Replicate 408
10.6 Core管理 410
10.7 Solr集群管理 412
10.7.1 Solr Ping健康检测 412
10.7.2 Solr配置文件管理 413
10.8 如何与Solr交互 414
10.8.1 使用REST API与Solr交互 415
10.8.2 使用SolrJ与Solr进行交互 415
10.9 监控你的Solr 418
10.9.1 Solr的性能统计 418
10.9.2 Solr的缓存性能 419
10.9.3 Solr JMX 419
10.9.4 Solr日志 424
10.9.5 Solr负载测试 424
10.10 Solr版本升级 428
10.11 本章总结 428
资源截图: