部分 Elasticsearch 前传
2 }( p& r2 ~& T1 l. S" H3 p9 N第1 章 搜索技术发展史 2$ G; P2 q" b* c4 {! x2 L
1.1 正说搜索技术发展史 2
* J5 o/ n- u6 K5 G( N1 x1.2 Elasticsearch 简介 . 5
7 X+ D R3 P) @1 |1.3 Lucene 简介 . 5/ x8 a0 C( [3 G2 m. s
1.4 知识点关联 . 7+ e# \3 p, \0 | O; y" W
1.5 小结 . 15
7 ?/ ]. _, {; W$ a5 N4 S7 Z
Y# a- b" B& k2 f) z第2 章 搜索技术基本知识 166 V7 X' [) y1 A. R
2.1 数据搜索方式 . 16
* Y }# q3 z$ _/ d" ~2.2 搜索引擎工作原理 17
( e$ F4 Y* G4 U+ n( G* N$ i2.3 网络爬虫工作原理 18
1 p9 w, U- V+ ?5 C) }: W2.4 网页分析 . 20
1 E* z0 B3 x% [2.5 倒排索引 . 23
/ x' O0 h3 W* l3 Q( G. L) V2.6 结果排序 . 26
, Q- ~4 U$ |+ a' q1 _2.7 中文分词实战 . 27* d3 r N/ \# p" V I8 o3 r% R
2.7.1 Ansj 中文分词 . 27
2 x/ V: Y, H! S4 n" x6 Z+ l2 X2.7.2 Jcseg 轻量级 Java 中文分词器 . 30$ N+ H6 l5 Y2 I. Y6 \& R
2.8 知识点关联 . 387 F3 w6 ^2 T; h6 O
2.9 小结 . 39/ l$ M& @: z1 g" i3 e) ~
' B" T0 F6 o I4 ?第二部分 Elasticsearch 实战
+ M5 h* s' F3 ?1 }/ C( P第3 章 初识Elasticsearch 42
: V5 A1 @- G/ b4 M# e% V3.1 Elasticsearch 简介 . 42
. I, o) ~& o& k6 c! R3.2 Elasticsearch 的安装与配置 43- b& m* _2 E, p8 r
3.2.1 安装Java 环境 . 43
. [& o8 s, f# S2 N5 W. Z3.2.2 Elasticsearch 的安装 47* \; ^+ A1 e* h# s9 a. e. \
3.2.3 Elasticsearch 的配置 52
7 {4 ]* x# T* T' K" j( o3.3 Elasticsearch 的核心概念 . 60
0 L) Y. N" `$ j9 K- X; P2 [) R3 ~3.4 Elasticsearch 的架构设计 . 620 H2 u( ^, O$ r& R0 q1 A# [
3.4.1 Elasticsearch 的节点自动发现机制 644 p) A8 D/ L2 b1 C
3.4.2 节点类型 66
7 s( i: i h/ X' q9 o8 j0 m3.4.3 分片和路由 66: q0 U8 t" s3 o# U
3.4.4 数据写入过程 67
- Y. }9 I3 s% x3.5 知识点关联 . 70- c- Q1 T. X3 |) _
3.6 小结 . 753 J5 P) [& E4 t3 h. F1 f" e$ j
- b0 ~( \# |9 I( x7 p
第4 章 初级客户端实战 76. M2 } S# u9 v
4.1 初级客户端初始化 76
9 a- J& s2 {9 ^4.2 提交请求 . 83& }$ \5 s0 e! D8 ?
4.3 对请求结果的解析 89 X8 u* h) E' [* Y* _3 i/ \
4.4 常见通用设置 . 91
5 l: M; I, ?! O5 y) s4.5 高级客户端初始化 95
8 g8 R% b, o; x" h4.6 创建请求对象模式 981 r1 z+ ], ]/ L) s1 c
4.7 知识点关联 . 98# T6 N6 y3 o l" Z0 w
4.8 小结 . 100
4 c( T# J5 C y" C! t1 K% \/ A* J5 e/ P+ U; M7 k. ~
第5 章 高级客户端文档实战一 . 101
7 {) s1 c! D- @4 {# A o5.1 文档 . 102( y9 J4 e) u" A5 F! L4 N
5.2 文档索引 . 103
" I2 @) L( ^" u) [5.3 文档索引查询 . 1147 e- `8 V, P: p `- w2 m. b
5.4 文档存在性校验 . 118" o5 A% z$ h8 e& E
5.5 删除文档索引 . 121
8 [5 C* U" o3 e0 O. q2 [) b, M/ r5.6 更新文档索引 . 125- m, W0 a6 U, g7 p% q% k9 {
5.7 获取文档索引的词向量 131
- q% u5 K3 H' ]0 D: u( A5.8 文档处理过程解析 138
0 S' i4 _1 q0 }5.8.1 文档的索引过程 138
q6 Q, [5 }! e" e0 O5.8.2 文档在文件系统中的处理过程 140- n# e3 ?. ^2 Z( Q
5.9 知识点关联 . 145
6 S3 d$ e; w/ k5 |5.10 小结 . 1463 O# e5 y5 B7 v
) @) K9 S2 H7 Q" ~' A$ Y! `
第6 章 高级客户端文档实战二 . 147
& b8 O, _- @2 n) Y6.1 批量请求 . 148
/ q% N& Q- F+ D/ p M' B7 d* N2 w6 ]6.2 批量处理器 . 154
" [% r7 L' C) b3 }/ V6.3 MultiGet 批量处理实战 1581 n, g# ~0 B* @2 ?: J. X% l
6.4 文档ReIndex 实战 164$ n+ [5 F- D) q- d
6.5 文档查询时更新实战 171
# k M/ B8 H" H6.6 文档查询时删除实战 176
& V4 s2 y* t. b# z3 Z% _: h! ^6.7 获取文档索引的多词向量 1805 h' ?: m3 }& E) |5 a
6.8 文档处理过程解析 185& E" j' x# x( P7 @5 p3 f$ b
6.8.1 Elasticsearch 文档分片存储 185/ b4 T% G' }$ G$ m8 j2 m8 `& N
6.8.2 Elasticsearch 的数据分区 187
( G6 X* H* p) ]1 Z3 `( |2 m6.9 知识点关联 . 188
% o9 |$ V O" Z$ z* i4 R2 e6.10 小结 . 189
7 J: z) ~0 C6 C* h7 M2 Q
" z) `+ t D# |) m( g5 g第7 章 搜索实战 . 190
! e. ^) D& D/ s+ f# Q7.1 搜索API 1919 |3 }$ N1 d% R6 v& ^
7.2 滚动搜索 . 2089 D% H5 G K. q, r9 h
7.3 批量搜索 . 220
3 |. v4 E& O& V7.4 跨索引字段搜索 . 228& c/ s; y$ c8 }
7.5 搜索结果的排序评估 235
# J* R3 D8 m0 a7.6 搜索结果解释 . 243
2 a" j, A- u }% q9 t* }7.7 统计 . 251
9 @! U/ }* @% W" _7.8 搜索过程解析 . 258
( w/ G7 N- D/ J* [) _7 k% i' u7.8.1 对已知文档的搜索 258
7 j0 [3 I& g6 Y$ i" N" |) l7.8.2 对未知文档的搜索 259' Z/ J5 l) j( @6 z5 m2 b5 {8 ]1 X
7.8.3 对词条的搜索 260
: i& F; m8 F9 o7.9 知识点关联 . 262
. l1 k1 Q# y: d. k5 j/ F$ e7.10 小结 . 262 @5 u3 Q, |. f) a( \; p% g
- p! z2 M0 t/ A. [1 L j l
第8 章 索引实战 . 2635 a$ U1 H1 D, ~! [5 m/ F# i- R% p
8.1 字段索引分析 . 2647 a3 s2 |3 b4 i5 L/ v# T& p$ R& b
8.2 创建索引 . 271
, v4 S1 B" ~0 L2 _: ^! R! m5 H1 e& a8.3 获取索引 . 277
- r& N) N1 Y8 K2 A/ X8.4 删除索引 . 2827 o( M/ ]' S" f. @8 Q L: _
8.5 索引存在验证 . 285
C$ Z( l% V/ I( U1 j( j8.6 打开索引 . 2891 T; e3 o' ~4 b( [( z/ A6 s# K) ^5 D
8.7 关闭索引 . 292+ u# I& ~7 e' e6 V( S
8.8 缩小索引 . 296
' ]) U1 O O6 e% G4 X1 ^+ d8.9 拆分索引 . 299
% Y& ~2 ]! X$ X4 Y- V( b0 D8.10 刷新索引 . 303( n& f' S" F, N" d5 s
8.11 Flush 刷新 306
% R6 r# s* ?. `9 X2 ]7 G8.12 同步Flush 刷新 . 310- f0 O7 S1 E* Q' y F8 j, @4 `% k
8.13 清除索引缓存 . 314$ h* ~3 g Z! B, ~' ]
8.14 强制合并索引 . 317, o7 X, l: R' C) `' c
8.15 滚动索引 . 322
; f P+ t9 o2 t/ o1 \4 l) n( O8.16 索引别名 . 326
# `* V# y# H( {% v; Y8.17 索引别名存在校验 330
# y$ x# W+ [9 F- j1 N$ X' j9 C [! k5 ]8.18 获取索引别名 . 333; y3 Z$ i% W+ Q; z
8.19 索引原理解析 . 337
# j& P; |( M$ l- i/ z3 B8.19.1 近实时搜索的实现 337
* w. _+ H3 p8 e% F; R. A8.19.2 倒排索引的压缩 337
, P3 P" @* V# }! i; L1 T x: s2 ^8.20 知识点关联 . 3381 z9 l! ~, _8 U% p; F
8.21 小结 . 339
8 I4 k9 P8 E' r3 ?) D( }3 \2 n O6 N/ l5 D0 A
) f6 k+ T9 |0 Z) L7 S8 u: }
第三部分 Elasticsearch 生态
$ q( j% l. _) a3 n0 W: v1 {5 n( }第9 章 Elasticsearch 插件 3423 c: W: W `$ X( n L3 L
9.1 插件简介 . 3420 v' k6 w2 `& ], @! I7 |8 F
9.2 插件管理 . 343
3 z8 j; v4 L* K" p! S9.3 分析插件 . 3462 W( j2 U0 g z' ?: y
9.3.1 分析插件简介 346
: B1 }! q7 s% }4 Y$ ~) b& J3 O9.3.2 Elasticsearch 中的分析插件 347
. i8 d# q6 v; n% G, w$ j" _* ?. T8 N9.3.3 ICU 分析插件 349) g: i# D. S' H: Q2 {& d4 G
9.3.4 智能中文分析插件 360- w+ p" ?6 m* j" v- Q$ r
9.4 API 扩展插件 367
% v3 |, z' g* ]& m" b0 q) A9.5 监控插件 . 368! d, Y D* L' S5 `' d' B y
9.6 数据提取插件 . 3682 \+ |4 v3 @+ r) {9 x$ E
9.7 常用插件实战 . 369
6 P2 s% p! D. }: }5 B' l9.7.1 Head 插件 369" K4 d* n6 y5 m3 p
9.7.2 Cerebro 插件 385/ q) A0 q% q* i6 a, B. Z' a
9.8 知识点关联 . 393, `4 @8 N% C! J$ C* D" z
9.9 小结 . 394
% P+ \4 N+ d+ q5 e0 F4 `0 B0 n k& U; @; R% e3 d2 \" h
第10 章 Elasticsearch 生态圈 395
2 h n2 L! w) V: V- ~# A( O# G7 j3 ?10.1 ELK 3955 X6 ^ u6 c) K# L+ `
10.1.1 Elastic Stack . 395: |1 k% t8 Y6 X8 _, f" P
10.1.2 Elastic Stack 版本的由来 396
6 A9 m& T6 B& @* f; U8 U" T# ~& a9 r10.1.3 ELK 实战的背景 . 397
{1 ]. W+ I4 ]10.1.4 ELK 的部署架构变迁 . 397
3 W2 s' C1 Q+ S10.2 Logstash . 400
" A1 |! q( H, X1 A5 r10.2.1 Logstash 简介 400+ T! H0 Q y) E7 ?
10.2.2 Logstash 的输入模块 402
7 [/ Q" j: R, I) c2 h1 q10.2.3 Logstash 过滤器 403
: g0 i' O3 }7 J# [1 N# [$ l Z+ T10.2.4 Logstash 的输出模块 404
) o1 U! e+ y; W$ M6 I2 H10.3 Kibana 405 java8.com1 I8 w3 z8 ^) J- S8 i p7 {7 V
10.3.1 Kibana 简介 . 405
. ?5 z8 l, w$ v9 J; y2 x10.3.2 连接Elasticsearch 406/ R$ ]: o" J& E4 _/ e, U7 d
10.4 Beats 410
0 A, ^3 ?0 D# i; _ K& d, K+ e10.4.1 Beats 简介 410+ { ^: S& F0 x
10.4.2 Beats 轻量级设计的实现 412
$ ?4 W0 S! v$ c10.4.3 Beats 的架构 412
# s! d7 z5 x$ v. [# Q0 ?10.5 知识点关联 . 413
' F$ \ Y6 w: b; v: F) [10.6 小结 . 414! c, F! N; n/ \% j* c1 o
- y' D* N4 V: n5 t& [1 D- }
- y9 P8 j# \; x- A' l/ x( W