Elasticsearch搜索集群系统在生产和生活中发挥着越来越重要的作用。本书介绍了Elasticsearch的使用、原理、系统优化与扩展应用。本书用例子说明了Java、Python、Scala和PHP的编程API,其中在Java搜索界面实现上,介绍了使用Spring实现微服务开发。为了扩展Elasticsearch的功能,本书以中文分词和英文文本分析为例介绍了插件开发方法。本书介绍了使用Elasticsearch作为数据管理平台的日志监控与分析方法,介绍了使用OCR从图像中提取文本以及问答式搜索的开发方法。

作者

罗刚 

猎兔搜索技术创始人

曾经担任

国防大学科研处 技术顾问

工信部 舆情开发顾问

东南大学 社会导师

首都师范大学 金融课程讲师

北京石油化工学院 社会导师

北大光华管理学院 技术顾问

蓝汛公司搜索集群技术咨询顾问

新东方 创新研究院 研究员


查看全部
目录

前言

第1章 使用Elasticsearch

1.1 基本概念

1.2 安装

1.3 搜索集群

1.4 创建索引

1.5 使用Java客户端接口

1.6 RESTClient

1.7 使用Jest

1.8 Python客户端

1.9 Scala客户端

1.10 PHP客户端

1.11 SQL支持

1.12 本章小结

第2章 开发插件

2.1 搜索中文

2.2 搜索英文

2.3 使用测试套件

2.4 本章小结

第3章 管理搜索集群

3.1 节点类型

3.2 管理集群

3.3 写入权限控制

3.4 使用X-Pack

3.5 快照

3.6 Zen发现机制

3.7 联合搜索

3.8 缓存

3.9 本章小结

第4章 源码分析

4.1 Lucene源码分析

4.2 Gradle

4.3 Guice

4.4 Joda-Time

4.5 Transport

4.6 线程池

4.7 模块

4.8 Netty

4.9 分布式

4.10 本章小结

第5章 搜索相关性

5.1 BM25检索模型

5.2 学习评分

5.3 本章小结

第6章 搜索引擎用户界面

6.1 JSP实现搜索界面

6.2 使用Spring实现的搜索界面

6.3 实现搜索接口

6.4 实现相似文档搜索

6.5 实现AJAX搜索联想词

6.6 推荐搜索词

6.7 查询意图理解

6.8 集成其他功能

6.9 查询分析

6.10 部署网站

6.11 本章小结

第7章 OCR文字识别

7.1 Tesseract

7.2 使用TensorFlow识别文字

7.3 OpenCV

7.4 JavaCV

7.5 本章小结

第8章 问答式搜索

8.1 生成表示语义的代码

8.2 信息整合

8.3 自动问答

8.4 本章小结

第9章 Elastic系统监控

9.1 Logstash

9.2 Filebeat

9.3 消息过期

9.4 Kibana

9.5 Flume

9.6 Kafka

9.7 Graylog

9.8 物联网数据

9.9 本章小结

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400