19回答

0收藏

动手学深度学习 PDF 电子书

电子书 电子书 1196 人阅读 | 19 人回复 | 2023-09-01

Java电子书:动手学深度学习 格式 pdf 电子书 PDF 电子书 Java吧 java8.com0 E, S: b" n8 a* f& E: h6 J9 R
8 n- D; M% Y% r# l; D

5 l0 v" O! u# r, ]7 r) R
编号:mudaima-P0253【Java吧 java8.com】
1 q; R+ a0 A( |/ q: M) i& R# {
& s$ M/ O2 A: x' p" w

/ H: w6 H& O, V4 V3 H! C0 q
1 {* r' E2 S! c* Q" O; o# }Java电子书目录:第 1 章 深度学习简介 1, Z8 v( t! G& \( B1 K

# Y0 A+ }# E& [( Z( q! D, b/ U1.1 起源 2; V4 V# {3 K6 K1 }

( U0 W2 ~7 }9 p6 s3 F1.2 发展 4. F. k" t' Z8 W7 {

5 E3 r' f# A2 u1.3 成功案例 6
$ l- b8 k/ f/ K/ Z" H9 ]) O
' N! y; L: ~6 |1.4 特点 7
3 @9 k! w; c+ F8 t% s6 E# j7 o3 o! h7 M
小结 8
* M9 F4 g' B& q, M$ \0 H% W$ H! X0 z; ~! r: z' U. E! {/ d
练习 8
9 U- L2 a: R' T4 Y! D$ V9 K
) ?% v6 P; I* x8 d第 2 章 预备知识 9, S: {/ c. B" z3 w
! v8 G" k& N7 }) V( T4 \$ ^
2.1 获取和运行本书的代码 9
' T! H( F! V& l( v# _2 F
# p; h8 N* J% p  E1 S- k. w2.1.1 获取代码并安装运行环境 9& Y0 J. |! \0 M/ c) t, A' i" G; `/ Z

6 a# Y1 R: I2 R7 M  o2.1.2 更新代码和运行环境 11" B" D5 s: W; S3 h/ `

4 f. w; ~7 T, J  u3 K2.1.3 使用GPU版的MXNet 114 M3 ^7 W0 u9 f4 Z

5 u! n2 {; t& q+ u# V# c小结123 d' g9 R7 d/ o$ W% }2 z

5 X, ~7 r) n( P8 H练习12" v4 q' ?. L+ h. W0 R* d+ t3 s# [
6 v7 `% ?# N( S5 F* K7 q
2.2 数据操作 12+ `$ w' L+ [) R. l5 h- ^* R
+ h9 S; |6 t/ F3 D& V9 G- w1 r5 N! E! x( u
2.2.1 创建NDArray 12
/ R. g, i+ N$ \, M& q! h4 i' W! l# p0 u5 }: U
2.2.2 运算 14: G! b0 A. e6 R  x5 W4 S* F
* P9 ]" I4 G( [4 }+ n
2.2.3 广播机制 16
$ o# e, y# _% q. x* s) _* m% M7 s/ ~' m
2.2.4 索引 17
- U) r( x6 }9 _( x* h/ |$ e1 D3 [" S6 p1 b) Q0 |3 O
2.2.5 运算的内存开销 17) B+ U' ?! X) E& `4 D, a$ ]* ^

3 J8 F( E+ x, Y  ^" d7 J& ~: q1 S2.2.6 NDArray和NumPy相互变换18, D) B) c  T/ @- g& q4 e
9 a" H, L/ }5 ]- {0 F: X
小结19
7 m% R4 ~- J" c5 V0 a' [: B/ w2 x' M! P
练习19) t; W$ r- ?: x; T/ U$ a' R
4 }1 C7 [& t5 `' }
2.3 自动求梯度 19( O# b# P2 d2 X+ v

. Y# Q. y/ L- n& S! H& R2.3.1 简单例子 193 N9 v' L5 Q! }+ D; e" ~
; R' u* q1 B8 U, X: H( K
2.3.2 训练模式和预测模式 20
$ L$ k1 H) s% z0 |$ {5 I. \. k: z. r, T' v) S' y
2.3.3 对Python控制流求梯度 204 p- K$ g' |5 O4 u4 ~1 C: _
8 d$ K* y/ e" b. p- x$ }1 z
小结210 G) U: o+ L0 R. W; S

! {* o$ u! @  j3 b# P7 F+ ~' e练习21
5 N: V' d3 H) Q. b+ V' q+ F9 J' M& ]; q
2.4 查阅文档 21
' p# |8 `1 B( L- h- L  Q: J+ Z. q; F6 L' c
2.4.1 查找模块里的所有函数和类 21( I. ^3 R0 ^1 i% U* n* x

! u2 u# P1 Y* C) V$ }2.4.2 查找特定函数和类的使用 224 k  T0 g5 d2 T$ P
! d$ W. ^9 L  ]/ G9 ?
2.4.3 在MXNet网站上查阅 23
* b& ~( I0 ]( {+ _8 q3 g# I; ~
" a0 Q. R  T' P8 f小结 24
! M$ x# g8 ?" f# Y3 f( e& d/ L/ o2 V
练习 24
9 S. {7 u4 i6 M% E
7 @% c( H/ ?, R1 K* Y4 g% Z) z第3 章 深度学习基础 25
" j: a7 U& s% D* S$ s0 [$ e, R, _. Y5 w5 A/ S/ ]: X
3.1 线性回归 250 k0 F! ~3 e: f" G) s+ Q8 K
6 v) ?6 x" F9 a; G' k( X
3.1.1 线性回归的基本要素 250 _1 X0 J; V5 W; N' _0 a- H
3 q" N+ L/ ^& {- O% X
3.1.2 线性回归的表示方法 28
0 \; O7 Z! |; t$ J" K
  i, ]! {5 j4 G+ o# V7 i小结 30
6 z# `; u7 e% M
# w& u5 ]8 ]# I练习 30
; E4 r: X) z& S$ T; N7 u3 v+ j" _% w! ]
3.2 线性回归的从零开始实现 30+ V* d5 j* Y6 N6 L/ [
+ u* O4 M: W, ~" x& O
3.2.1 生成数据集 30
2 w) N; _5 E& C, x
  h; [, z% ?  y' _3.2.2 读取数据集 32
% S, L9 e( F! i+ e$ g7 s$ e, X" F* s  F# X: w% R5 j& U" s0 A
3.2.3 初始化模型参数 329 N& C- w: e! ?
6 X, X( [* o6 }1 J7 Q( l, r! H
3.2.4 定义模型 33
* [9 s0 i4 _) Y) d% ~) q
- E2 T# }/ I1 C7 J9 ^  ^/ ^3.2.5 定义损失函数 33
: z6 x7 \: m1 P) N
) W- c' |" J; |1 @! d3.2.6 定义优化算法 33' P* s" L5 W: s6 Z. N8 U* i
) {% }" {0 m# b: V& W
3.2.7 训练模型 335 Y0 a$ {: \' k/ [1 {% o0 ~
; e1 d  d+ T1 X$ d  V, w4 q" A
小结 34/ T& H* [+ V4 b4 k* G/ l
6 k1 W- S6 \5 \: Y4 P& I
练习 341 H) u. R. _2 V

( c7 B1 B- e0 W" z$ s3 B3.3 线性回归的简洁实现 35
) a7 C# z' `3 O$ ]7 t, x6 T) k2 P- W1 K0 Q! @7 _
3.3.1 生成数据集 35* N7 @! I' x% D8 l
& |5 ]1 S: x' e  J$ m9 R# i5 {! J
3.3.2 读取数据集 35
6 \1 f" _  J: Q( q8 _/ d2 B3 b2 N5 a: o
3.3.3 定义模型 36
# t& O7 x% P5 g, v  `5 F( ]1 g+ k+ _5 ?6 O6 L8 Q
3.3.4 初始化模型参数 36
. K" [- D2 y+ e* J% O8 P" w5 c/ O+ r5 F# L' ^
3.3.5 定义损失函数 37' v% c* F% @- t; m

2 C; F4 a% y. k& a9 ]) c, ?8 Q3 f% u3.3.6 定义优化算法 37
) M; q# ]5 C* _3 S7 M* t( U
# y' ^4 [; W; y2 {3.3.7 训练模型 37
* f: ?2 y4 X+ s3 T8 j) S8 C: Z5 ^
/ w# `5 K& ~; {% ?' G( H; p' B小结 38) ]1 h% ^) F9 X& b: `5 M
. Q2 M& J5 b/ `$ ^- \+ ]6 A5 M% A. }% }
练习 38
) g& P0 n! Q. J, Q6 m
9 m/ X+ C  G$ P7 i; }: f5 [3.4 softmax回归 38+ D$ A8 O& X. l7 L/ j
8 H* O2 K; G, E; [6 \6 S
3.4.1 分类问题 38
! l1 O. I, v0 C4 F5 f# `1 a
6 I( d6 F9 K( Y) i, x" [3.4.2 softmax回归模型 39
1 \9 w" i2 }6 F# f2 W& f6 f. G& Z; V$ W$ S9 ]; H
3.4.3 单样本分类的矢量计算表达式 40
' o. f, k8 l. b# \: i
# X$ o8 ?& Z7 F3 U; a  @) a3 i3.4.4 小批量样本分类的矢量计算表达式 40; V5 v( s) \0 N/ k) f2 l/ r

( Q/ t) h% W# J7 k- R3.4.5 交叉熵损失函数 413 U! {8 `# d+ r
$ r8 `% J. _6 M, P+ S
3.4.6 模型预测及评价 42
% G" @- o7 }# w* x8 Q- V7 a' r* `8 K5 e% A* k( ^
小结 42
7 M3 l# O+ P0 Y; C% n8 c
4 t  l4 P  o' Y4 B练习 42
# w% z) ~; H- q6 u5 B; H
) I+ b3 I/ [1 r" K" I: O3.5 图像分类数据集(Fashion-MNIST) 42
5 [; G- p- h2 {+ V0 c5 z2 n! `! I# L; y7 I& G
3.5.1 获取数据集 42
$ {* U2 e& ]; t, F1 N
4 F9 u8 f0 U2 A3.5.2 读取小批量 44
7 o' i5 V2 H* t, i) t& ~0 b; g
. B. L+ S2 L4 W# T; G小结 45
3 j0 O% J* z6 y1 E8 ?
$ D& B; c. x) N' F* B5 C2 |5 `练习 45
& u  H& u/ O# v5 Q' z' M' }' k9 R: B" f
3.6 softmax回归的从零开始实现 45. `, M4 |; w& R+ |3 M' ]5 f3 E
1 g. W/ c$ ^. F$ H* m' ?& G5 \( l( i
3.6.1 读取数据集 45
0 L" z5 Q. f' ^7 U% o( Q; r
, R2 E9 B* P& v& m3.6.2 初始化模型参数 455 T# W3 P. n  B2 a

+ W( t5 T' [4 z3 S" {* o" I3.6.3 实现softmax运算 46
1 L- _1 u: W" O2 g0 O" ^% I- k: |- d! t3 [' N
3.6.4 定义模型 460 P3 }* s( M/ F/ _) S
2 i6 b+ V  V! ?6 |/ e
3.6.5 定义损失函数 47
  T' A, F9 _% Y7 V/ q/ g7 y) f7 \. W! ~+ |  M, S
3.6.6 计算分类准确率 47
# I+ V/ d  G, ?/ @
& l+ I1 D4 m# \$ l3.6.7 训练模型 484 r8 a/ ~/ ^" r4 D  h1 @; |

0 j4 [0 s- t) j; h. s, l: t3.6.8 预测 484 W( U, n. g& e3 q$ l2 f
# a4 H0 V: H7 p- M4 B! D6 L* e% G# D
小结 49
! {2 }- Y- W6 w  n+ m- C2 d5 h% ~$ v
/ W3 V8 L  o/ K" F$ M, t" U+ }练习 492 m1 z) l7 Y/ w8 N$ \

; r3 _3 K6 v0 E) J. S5 l  V0 e3.7 softmax回归的简洁实现 497 A0 |' {0 N" b* [" E  n2 I6 ?

0 K  J! z* f- Q9 R% ~, k% N3.7.1 读取数据集 49
3 [( F) Y( a; r% Y3 x' t) p
5 G: T, e4 h; h6 M! A3.7.2 定义和初始化模型 50
! A) v* _. _7 _0 w' a! B
, h5 r" l1 r! N5 B* R' e4 L2 J, Q3.7.3 softmax和交叉熵损失函数 50- @: r" T1 p' |4 y+ r1 e! B  d

9 b( h+ q* b6 U# ~3.7.4 定义优化算法 50
6 B2 p& h9 c: f, s; ^, `) ]: l- ?- D( F2 J* S
3.7.5 训练模型 505 m% j- C9 M& T0 p! _+ K% z

  e1 r& k, M6 C+ ?小结 50. g( D2 A6 ~" @8 R' Z

. m$ D+ N5 _. i练习 50, r0 N+ l- K" H! O3 s( ~
8 z( w$ T2 \7 G9 q% L
3.8 多层感知机 51
% g7 x" q2 o1 p, v4 H6 \, R8 v$ C( {, g
3.8.1 隐藏层 51' C1 R9 d: [4 g! ?8 n
* S+ W2 ]) p  _8 Z( G* Q5 [
3.8.2 激活函数 527 K! k8 I2 m: j0 Z
( q/ Z! }3 Y% C' C) X, X
3.8.3 多层感知机 55
* T' N3 @% j4 P' X
; u. a; t! m  U5 b, }! k* U; x5 i小结 55; a: G* A' |/ K1 z" v8 m+ d' r
+ A3 d; m5 U3 g! e' ]; m! e/ [) g
练习 55$ ~- a1 i' B, P
9 S4 [1 {$ w! Z1 H* _% Y
3.9 多层感知机的从零开始实现 56  h1 _" W6 Z* N+ s* [
3 {& ^, G4 S; G
3.9.1 读取数据集 56
/ w4 z# A6 C' c0 a/ d8 y' C' w; Q* S
# l' O. H, B4 @/ e3.9.2 定义模型参数 562 S# A8 e( ]3 v9 _. C9 }; ^8 Q

4 |) A; i5 f( J/ F. q! Q/ `/ ?0 F3.9.3 定义激活函数 56
& g5 G) z; Y+ U. h7 i
. F0 D( x( f9 A6 y5 H- `3.9.4 定义模型 56
4 X, d& R; N1 }# _3 Q3 H9 c6 N7 e  k2 s# \/ j
3.9.5 定义损失函数 57
5 _! z6 _" I4 V" }8 R- S# G7 h8 m. v- f) `/ K
3.9.6 训练模型 57
0 b/ t& _9 [, }0 o+ t9 U0 ?) T: d$ H8 q: U! q0 w4 D0 G! |
小结 57/ {" K2 D$ A1 N! E" ^. y, t

; i& S9 v+ M7 u$ H5 U! u: C2 |0 X练习 57- K1 E# H) R, k8 M

: U( h/ c: o7 V3.10 多层感知机的简洁实现 57
1 U4 I- r5 \1 Z5 |+ g$ G$ j- y9 k7 x2 Y
3.10.1 定义模型 58
! l& x+ B! l# c7 y5 X! Y$ l  N0 x2 l& L2 f: _
3.10.2 训练模型 58' {# Q, }8 G4 ~# D- k& C8 @
# e3 g: u3 M, @/ g+ D$ t
小结 58
' L1 u3 N/ f! H; I9 ^9 l! m9 P' ]
5 j  [# C0 N( C- k练习 58
3 J4 k, z! e4 c" s- f4 f- {6 X0 H- i6 \2 x8 p
3.11 模型选择、欠拟合和过拟合 58" M! t7 d' z6 i" _
! O6 X3 U7 ], Y5 ]$ _% d9 F( u
3.11.1 训练误差和泛化误差 59
3 R( t) }; u: Q& {. c4 U1 d$ E
- V9 |$ @6 p; E0 h4 c& x( j; }6 W3.11.2 模型选择 59
$ p6 P9 m4 w) R9 q9 q2 R; G. [% }4 m5 b; d, b; t; S* h
3.11.3 欠拟合和过拟合 60
* m6 l8 A$ Y5 v2 c0 ^( l4 C$ L( y
3.11.4 多项式函数拟合实验 61: r6 J2 B6 x0 A1 X* h
& a& v' ]. [5 i8 y
小结 65* a- C. s7 V7 B7 f+ Q: d

- n) u. l5 b! D/ b9 k; U( T- K- x& U练习 65
4 ?$ j6 d( d; m/ |$ z$ x
; b7 ?8 q, M  b; i  F% s3.12 权重衰减 65: ?% }9 x& [0 U& c4 n; e

$ z: I! a# ]' e, V3.12.1 方法 65
- W* s) K  Z( @  Y$ [2 n# G- _6 z# \; ?5 G
3.12.2 高维线性回归实验 66) d9 o* [9 Y+ }8 ^
4 Y8 u. z4 v7 s& V5 m! T8 T# U, f
3.12.3 从零开始实现 669 t& }- J0 Q1 y: ~. w

. ~7 Z8 M3 v5 j* ?0 z# _3.12.4 简洁实现 689 j5 Y+ X( d9 Q3 R6 l- g
( P6 u( n& B9 K9 C1 c( n
小结 70  E% z& c' L0 Y5 r

; g1 W: s" J# C" s$ Y( g练习 705 l7 _/ g* S" z. s6 W$ g9 S

4 p. G8 w; a9 i, C1 T3.13 丢弃法 70  y2 Y, ?' i- I

; }. z( B( H9 U* T$ w2 V3.13.1 方法 70% I& j' D$ h8 L5 V

/ G$ t7 o; \/ s" r& y3.13.2 从零开始实现 71
9 ~' x% S" E  _  F
# W  S2 i# x8 |  p3.13.3 简洁实现 73! V. m4 _# e! T& u
5 W3 J% ?6 k5 P' v9 Z$ Y  M
小结 74
& H0 \, y$ n2 V8 i3 Q5 _' w5 d) W1 }/ C
  y3 n* X& s/ B练习 74# P% s2 O4 B; j  r6 D. a+ x
5 g* F3 r: L$ q3 j9 W" ~
3.14 正向传播、反向传播和计算图 74( |6 A% L8 L' z8 F

/ V! D# Q4 i$ u+ j8 S6 y3.14.1 正向传播 749 E6 L$ U' {$ A6 L! O0 [2 b7 h0 i
0 Y$ k+ h5 E8 A4 P" m  M* e- x
3.14.2 正向传播的计算图 75* v1 t* ]/ X; K  n+ ~; W
' c+ I( Y7 K6 ]* U
3.14.3 反向传播 75
3 Z6 K9 {' Z0 I* O* C, W
" ?, E3 n$ c% m/ k- S( o0 \3.14.4 训练深度学习模型 76
4 D" p- d& m% f) E; N
( D! M8 @9 F3 N, ]( q小结 77
9 P) n4 u' k. d8 ?1 [  @* H: I0 w+ t9 a/ u* i
练习 77
* ~8 C& H7 R2 u$ w/ g0 v! u/ W; s6 [' ^
3.15 数值稳定性和模型初始化 77
* J2 m: k3 d1 h6 H2 u. c4 h+ s
7 G9 ]) I5 P' Z  X# M) A3.15.1 衰减和爆炸 77
+ j/ ]4 {) x; Y0 ^/ K' L0 n, t6 D% o2 N1 g: \% W( V
3.15.2 随机初始化模型参数 78% X" B9 V. A& d& }5 }1 |
  `! _+ J, x* o# n$ K
小结 787 L: b0 Z0 Q( @# U& h* v! {
, B$ [4 [7 U0 y5 O) F' d( J. N
练习 79
% m- M4 h3 }6 v
! P% Z" B7 B; n. H' j, l3.16 实战Kaggle比赛:房价预测 79
/ R5 {& h$ S" w5 F, O# Q* Z) j' |, z
3.16.1 Kaggle比赛 79
7 N7 f! g. E" p3 V% x* f0 y8 Y& S$ u% _/ P8 {7 X# }
3.16.2 读取数据集 80
9 c( ]8 b. h# v3 K6 s9 c
! P% C7 @& z1 p& V% e- w0 b  ]3.16.3 预处理数据集 81
" x4 A6 W6 p" j# B) U; f+ K& Q0 t7 E( g
3.16.4 训练模型 82
2 a3 \. I- t. r. u! J% a6 M' O! q! T" Q1 {8 R1 u
3.16.5 k 折交叉验证 82  F& A' z% H& H( K0 U9 L' D
: w3 F& a* b! D% Y% j7 a- ?
3.16.6 模型选择 83. J4 ~/ S- Z0 W9 U

& U3 g4 g1 {# n7 H6 J! A5 e/ f3.16.7 预测并在Kaggle提交结果 84: z* \! n9 ]/ W+ b0 u

! [0 k* C2 s" K+ |' d! ?! |, ^小结 85( S/ K! T0 A4 s6 \$ R' [& {

8 b2 l# |- y8 |5 F" k8 @6 I2 N练习 85
4 B( e& n" _& E, x$ A  ?0 |1 @2 l# Y. y0 d
第4 章 深度学习计算 86
/ p6 Y/ D  l& |) ]6 A' u; u1 k* ]8 ]9 j
4.1 模型构造 86
% ]/ l* p2 y  t$ \* `. x  u) c4 V4 E$ r
# u# V& k' G& m5 V4.1.1 继承Block类来构造模型 86# F! K& d0 |) i; `% o. ?

5 m/ w3 m; s& b4.1.2 Sequential类继承自Block类 87
) A# i* M# z9 `' D4 W+ O! M9 g5 k% v1 i$ O
4.1.3 构造复杂的模型 88
3 S" H! ]& S0 h( s- ]1 ^. N9 D& K, c$ o8 R
小结 895 b8 y" u6 `; c/ J3 y4 k
% F7 ]3 E6 R+ J* y! ?8 p9 B5 V2 ~
练习 90
8 ]4 w$ f0 G  e0 r8 C4 w- C% q2 Y
: v/ q* o6 i5 J0 P4.2 模型参数的访问、初始化和共享 903 o9 z7 I: @/ n4 p$ ?! R  D
* P5 U, S7 p8 O  M, A/ m
4.2.1 访问模型参数 90  ?# V; T- M$ T

+ h, f/ d9 [4 B  L4.2.2 初始化模型参数 92
* x3 F% |4 {! U4 l, n
  `- r. T4 W3 T% s% \! I4.2.3 自定义初始化方法 93
3 {6 T) V1 F3 }! I1 u9 f' o6 {6 A# U0 ~% C; T. s6 I
4.2.4 共享模型参数 94
+ U3 y4 ^' g& o: \- c* e8 K: o& H3 H4 a
小结 94* T/ `9 |+ y  E# C

2 d0 C: Q1 y# M$ q( t( }/ o. Y& X- U练习 94& ?+ P; n3 [  r8 k

: u1 W) e! S. I2 L# [! M0 ?; C4.3 模型参数的延后初始化 95, s& }; a" N: R" ^
8 l8 N  n4 V. A. |5 `
4.3.1 延后初始化 95, q( k6 Y$ k3 Y7 I. \/ G
8 q* N; B) B8 r; U5 W
4.3.2 避免延后初始化 96
/ |9 u6 F, `* C$ l6 o7 J( n; Q! m* H3 d2 w
小结 96
* v  _+ I. u" k+ m: U: n
* g2 }. c5 n) a" J3 o7 V1 @% r练习 97
6 `$ D( R- T3 H' e' F6 A, q" }/ h! w: d, I# @
4.4 自定义层 97
% d+ D9 Z* X8 _
: a: I+ q. L1 g2 \/ a1 O! ?4.4.1 不含模型参数的自定义层 97
/ Z; |4 G0 b- J, z" C. i4 H9 U4 ^, n/ q5 [3 ]
4.4.2 含模型参数的自定义层 98
% @* W' j5 Z- W0 X( A1 r3 {' D7 N8 O; x: v) d- I
小结 99' a7 J2 V' ]0 A
; r5 a( _4 L; L/ B5 g1 x" \
练习 997 Q2 [& u  b; g) u9 S) Q# k) j! c. S

8 L5 r$ \4 g& m- X2 C4.5 读取和存储 99
. {  \' A4 G; s7 f: P* w! J4 u8 m* h2 x- j
4.5.1 读写NDArray 99: e- m7 `. q: D

- D, \' J2 w  j$ n4 u+ k4.5.2 读写Gluon模型的参数 100" x  R8 j' j5 L' ?0 _

0 K6 z' v8 Z' }; U: P小结 101! z9 F8 F3 e2 U! a& j  r
$ e. X! b! M6 u5 M
练习 101' z: ]# `) a; o7 M
% J% S, N& m0 C5 w
4.6 GPU计算 1015 W9 b6 X# W: ?1 r5 p* g# ^& k

/ ]9 n7 ]" m  M2 B5 F. p4.6.1 计算设备 102: _- y6 }4 t( z" e: ]# x

& c$ o3 S% @# h( R& u- z* h6 E4.6.2 NDArray的GPU计算 1027 \. Q" B% l, L  |# O
6 g6 R* s$ S& X/ F& ~0 a
4.6.3 Gluon的GPU计算 104
" V3 z6 a* d3 \, @4 P) h6 V1 D$ P, {' y
小结 1059 l7 e( @! O" j! A3 Z2 ?( n
! a) K* x' P. g1 p/ a6 r$ f
练习 105, K% H8 `" ~! d3 I9 H) w

5 H3 |/ q2 u2 I# [. j" Q6 v+ @" E第5 章 卷积神经网络 106( w1 m5 T2 B) F7 p6 g- K. r6 b( r
- T& p, \0 _9 o' {9 T$ ~' T
5.1 二维卷积层 106
5 v/ T) h' O8 F2 z4 u' A: t1 Z$ r3 g
5.1.1 二维互相关运算 106
/ e) C) _( r9 ?; P$ M' X: q# ~$ W$ ?, {) v
5.1.2 二维卷积层 107$ _# S9 O/ n1 b3 p" {( W$ }# t

, N- z" k, a3 O& B. r4 \& X. Q5.1.3 图像中物体边缘检测 108
1 x' n/ T  T+ |2 p" p6 A% t5 T0 r' W* s% z( C- X! ^* E+ u/ k
5.1.4 通过数据学习核数组 109* C$ o3 S" Q* j% N2 T

! F% s8 B7 e& r; r5.1.5 互相关运算和卷积运算 109
6 |6 \/ f; P! P6 e  {3 k- S! w( u  E1 ?
5.1.6 特征图和感受野 110: ]6 y' @8 Z5 J) z+ V% ]& y; B
' C1 }; @5 u, F
小结 1101 C) Z7 Z, f! n7 d9 W& Z7 }1 H
- \. H3 D% ^) Y0 x2 ?- f
练习 110
0 w: m) S, s: |4 \/ l% ^- R2 E3 w, k+ m/ X
5.2 填充和步幅 111: O! [: Z. u' D3 Z7 Q- q

- q: I5 n. N$ ]5.2.1 填充 111
9 o: t6 p6 m4 N( q# p, W' a7 q9 v1 w0 Z# y' d- m
5.2.2 步幅 112( C+ w, t& b  L6 \6 L8 x1 p
& e' i/ ]$ n- N- L5 c0 Q
小结 1131 B9 w4 m  x% z, ~# v

/ U2 t: Y" O; ~9 }7 j" @. n$ R/ F练习 113/ j8 L/ A; S1 O5 M3 D, _8 i
; e- Q5 P9 _# {" P
5.3 多输入通道和多输出通道 114
  `" |5 B& p; ^& [8 r; x8 Z9 L2 r+ j
5.3.1 多输入通道 114* A' r/ d5 T1 K' `9 C8 I! l5 j
6 {$ u. ^0 `: Z6 P2 \8 P
5.3.2 多输出通道 115
( ?  P6 k- c" a/ h7 K
4 ?+ C  n8 s. Y: V1 ~0 i/ p5.3.3 1×1卷积层 116% o: e' q# B) k3 Z6 g; y% K; i

6 v2 D% z+ i9 b( N小结 117
) Y* Q3 c; h: O3 P" x4 y
2 k  a& ?" O+ T9 J8 W2 d4 n1 Z练习 117( Y. |! g0 Q; [$ l$ Q

4 Y- N- t& f5 I% l" h& {! {6 D5.4 池化层 117
0 X6 I7 ]8 u4 }' ]6 Y7 j1 }" n1 n  U# r0 H
5.4.1 二维池化层和平均池化层 117- Q- l' e4 x9 b5 e- \
7 c5 A" ^6 `# {8 u
5.4.2 填充和步幅 119
# H2 b% u; P4 D( G3 i* Q9 a  R) d
5.4.3 多通道 120
" o! ^3 T$ k) V# p" P! [6 _- _  @: ]5 `3 L
小结 120
$ J0 \3 R! u- y: ?2 D1 H. _7 T6 ^' j0 a. r1 S
练习 121# R9 w- r9 z; z% F6 p

1 n0 S% E, i( O5.5 卷积神经网络(LeNet) 1214 Q& H% Y# O4 A- J0 K: k9 G. k* K

. K! d  g6 P6 U& n3 H+ }. u5.5.1 LeNet模型 121) z8 L7 _/ I1 H  _; q: \- y/ s

/ h/ X  P3 p0 I( [8 z5.5.2 训练模型 122
. [7 w9 U5 Z/ H/ A0 @
; I7 |# I- G7 I; X5 d. [' i9 g9 Z" k小结 124
( l$ H- ~0 _1 O
% F' e+ N  l2 z9 t5 w. ~! P( ]7 u练习 124
, ^4 b/ {. T, ~
, j! g2 d: T4 y5 T5.6 深度卷积神经网络(AlexNet) 124: e: o% h; q+ l' V2 Z2 R

. M% Z( e4 J2 v" P  C) L9 r5.6.1 学习特征表示 125
2 O4 v/ D) l- o, m9 x5 F9 e9 O* I8 S  E
5.6.2 AlexNet 126' C4 ^' \  {! M6 [5 Q

" B5 [7 C5 o, y! u5 l9 b8 f' q5.6.3 读取数据集 127- G" {8 j' {, w2 n9 Y

& N; q/ R: [; Y+ z: b9 i* X8 Q5.6.4 训练模型 128
: g/ Z2 d- q2 a9 S5 \# E# h/ \% w; E8 C4 _
小结 1287 F4 x7 X; d! b! M) ]

6 t4 _1 h# {" `6 ]' P2 a0 A- a练习 129
5 c+ @" ~8 R) G4 q; R2 j
  a  {9 L2 @4 n  }5.7 使用重复元素的网络(VGG) 129
& W: [0 c1 y5 O- L" Y
3 [) T; B3 [1 s* x! H5.7.1 VGG块 129$ F2 l' @& }  B* Y! E

0 \, h' d1 P# p+ v/ f% z5.7.2 VGG网络 129) M2 w. ?- C+ x, d- ~

5 H4 k$ {7 _$ j) q6 [6 b5 `) W5.7.3 训练模型 1301 w& z, C+ N  \3 f

) A0 b7 f  u/ m小结 131. L- V/ M7 [! D3 @" |( g1 B
" Z& u: k" \- ~! l; D$ z  D
练习 131& q) [( ?/ H' \: h3 i& E8 E: |/ U
; ?' o0 g* ?6 w/ _  h. v! ?* i; S
5.8 网络中的网络(NiN) 131
) k* h6 V4 |$ m1 }/ ]( \5 z; ~4 u8 [6 O4 r4 Q" @0 O
5.8.1 NiN块 131; r) N) k; C0 y  w0 v2 k

' D+ s# c$ T+ j) X, Q5.8.2 NiN模型 1328 w$ i. N' A7 g5 z9 U) I, L% U

; s0 }* k( D9 k2 i* b5.8.3 训练模型 133
9 o1 g; ~9 ]: q; [8 t. ]+ M% k8 S  Z! B' Z3 \
小结 134
4 E: a5 p- O1 ?9 X- `1 Y% ^, {! z  }6 z6 S' d
练习 1349 d: r; L0 s9 K7 F
7 U6 a8 m9 z& g  u
5.9 含并行连结的网络(GoogLeNet) 134
! N* W3 ^1 s9 y% |* Q) V
1 K  q  {3 q4 W6 K5.9.1 Inception块 134
9 m8 Z: U7 V5 N( ^. ^+ W. ^( A8 h; k. Q5 }# q, B  i4 h
5.9.2 GoogLeNet模型 135* s/ b) [, t) d; m$ u. s! V
: T- A; a! S7 T% O
5.9.3 训练模型 1377 v9 `  ~& z/ p! w1 z5 O# |

+ z; x+ q+ {6 v" N小结 137
! F  U: R' X# w6 H- ~, n8 ]: F0 [' ]6 ?$ d9 u1 C9 @
练习 137
5 Q2 i+ A' C, Z9 c3 N( H8 e$ ?7 C, f8 q" j. Y, h: b4 |! S
5.10 批量归一化 138
! v$ s( @2 r& v6 D3 \8 @& @0 ]% E5 i
5.10.1 批量归一化层 138+ D: d4 i1 }( k2 K2 t! C( H7 J
( |% T8 ?9 w0 }5 q: p) p+ z& _
5.10.2 从零开始实现 139+ v0 _. K  v# J* |* p6 V* T

/ e; a) `" k  E8 ^5 H, a; L. U5.10.3 使用批量归一化层的LeNet 140
; t( p- h8 ^+ p4 D( f, H' E/ d$ u6 b0 N' r, A3 e  ?3 {: C$ m
5.10.4 简洁实现 141: Q6 m* G3 |! d9 W2 Z) @0 N% c
. r* ^2 y' N; J9 Y6 X
小结 142
! v+ L; a4 H' q1 o* X
# `1 D/ n: F; _练习 142
3 P* f3 `2 P' ~. t  V- u
$ _% c5 w5 D, M) Z$ E3 [) \5.11 残差网络(ResNet) 143
% T( {0 @/ C2 T3 `& C! C. I
9 I: l. ?* t1 w  O3 ]5.11.1 残差块 143
2 J) l' X) v0 ~$ Y$ Z* E/ g3 i0 m( F; W- u6 e
5.11.2 ResNet模型 145  ~% V4 F! s" `2 l: I% [1 e
! S, D$ k! x* |5 N) g, D. G
5.11.3 训练模型 146
! p+ A$ N! L# W$ O$ N  Q! m5 j) n  ^3 }. J
小结 146/ m, x6 X9 ?: r' B

" y+ u0 Z$ d! X* \, a) q练习 146
1 [! Z, l8 o+ ~' M4 u3 _* x& q2 h+ ^4 h/ O
5.12 稠密连接网络(DenseNet) 147# z5 y& c+ L# P2 o

) D/ B) e5 A( ?( D% x5 d5.12.1 稠密块 147/ p! {$ W+ e7 ~+ k

% V' j9 Q' k4 d" x- F  H5.12.2 过渡层 148
. {* G% o9 h$ d% `3 [9 C/ ~
' i& r( h) o; }& G: I7 J5.12.3 DenseNet模型 148) ?' p/ i, k$ m* G; d* J

6 N0 s' i9 d) C2 Z8 B' k5.12.4 训练模型 1492 P6 P7 i0 Q! P7 U; T
) Z& {; E2 T( N7 ^4 R2 l# @
小结 1494 M) o! a7 ~+ J
0 R$ q" ?+ S* n( s" }
练习 1495 Q6 X$ U  F, y) \9 A8 B, s; E( L. D, @

- w; c# @, c7 ^9 V8 B. v+ @第6 章 循环神经网络 150
& B, ~- e5 Y' W" W# ?% m5 x' M5 j7 p- I" n, [) F
6.1 语言模型 150: y0 P+ O* Y) O/ q. v
' g( e7 C/ A+ B! _+ l4 c7 Y5 G4 G
6.1.1 语言模型的计算 151
( M7 ~7 |  F7 l
1 K( \5 Z: W, ~5 y: }. U5 P6.1.2 n 元语法 151
  r, Q9 ^3 K, u9 o4 w5 v1 z1 h- x! P- C: k- c
小结 152
" s- Z9 G: {* F8 Q
. c$ m' j& d) r5 o' ^3 j练习 152
1 y; h7 p& m+ v
: n4 ^, E- W8 F% n6 @6.2 循环神经网络 1526 p/ A! ]; b$ @+ G# G; K
" G8 T+ u) U' R' D" C. A
6.2.1 不含隐藏状态的神经网络 152
9 r8 B/ A% O$ ?+ N# v& M5 |7 B4 |. u: U/ B
6.2.2 含隐藏状态的循环神经网络 1526 _5 E0 L% \3 h6 l* B3 j+ A
6 `) h6 F. F& r3 e& P
6.2.3 应用:基于字符级循环神经网络的语言模型 154
. ~7 e0 u# ]/ h2 W. b  t- \, J, R4 k
小结 155
9 |1 z. l! |; R- W; R, G! `9 K  D4 d+ p9 \* \/ L/ r% k! C- t: G, [
练习 155
: a9 S1 o) d/ B* I; f: E1 I' d% r" a) z6 P& s4 I/ ~. m
6.3 语言模型数据集(歌词) 155
4 d: P; K; X! w( p% G1 J& b6 c: D/ ~+ |5 B. f4 m. _7 N
6.3.1 读取数据集 155
* j' X/ \3 {9 @$ V" K' s* K1 L& g4 r  f, q& S* e! h
6.3.2 建立字符索引 156* Y6 d6 V; |3 m
! g6 ?8 h: h" S3 D% L: _+ K
6.3.3 时序数据的采样 1563 C9 h9 @6 D( \

5 e& @  F$ u1 V/ U! a小结 1580 a( d; x2 t! m% c

8 D* f5 m  q' S8 R0 D8 N% \9 P练习 159% u- y* `% [( f7 I$ e; ^

* N1 ^( j  i/ u  r6 e6.4 循环神经网络的从零开始实现 159- _6 L- m! a- j. b4 e, Q( i% w4 b
) @9 {+ j& M3 a8 c4 S
6.4.1 one-hot向量 1596 y" t; W6 ?5 _

. x' n7 A% `0 l, ?2 f7 V6.4.2 初始化模型参数 160( {0 n% v* V" [4 s! m- ?' z

# R7 g$ t: t, W1 C# g6.4.3 定义模型 160: k  H( e4 L2 H0 j, {
" S3 P. F$ ~5 l- X: `# y% x
6.4.4 定义预测函数 161* ~' S/ e0 S5 F0 w# s, p3 p9 d
3 D  R) J; \$ [1 {$ ~" n% C0 s6 q
6.4.5 裁剪梯度 161
) A6 f2 q, R: N# O) o6 ~, y( `1 B2 D, V4 N- B8 P
6.4.6 困惑度 162
; i" H4 U( Y, A8 z8 v- Y6 s2 P+ A/ O+ f
6.4.7 定义模型训练函数 162
0 I$ x1 @1 }" p/ y6 G9 f1 y' G" c1 j" ?8 q( A2 P
6.4.8 训练模型并创作歌词 163
. C/ |9 n" L: h
  W: o% F( r2 v小结 164
4 `. n4 K) p1 ^% o, x0 v" b( E7 l% b9 E3 j$ G% v/ p" K( a) J
练习 164
5 C" T9 X4 b* J# E
8 i0 x2 ^& G/ E6.5 循环神经网络的简洁实现 165& E+ ?- P% b5 _# I! e; h

. n7 ]7 y9 _/ `: D6 S& j2 d6.5.1 定义模型 165
+ F& e5 F- U; P) n. h1 Y' \+ R* j. B5 W7 a) Z8 ?$ O- V# q
6.5.2 训练模型 1660 w4 U. W/ O* P2 b+ J; s' y

# `, |& L  j; ^" x小结 1689 C5 Q$ s- ~. @* q( _' L
% I: D( b5 c0 q" c& \
练习 168( R& b9 q" \0 M% M; x

) ^6 A/ I, l' W( ^1 R* `5 ?/ e6.6 通过时间反向传播 168
# n# l. o3 T$ l/ r# Z/ d
5 ]1 \5 h$ Q& L% r# X& L6.6.1 定义模型 168
# j+ V+ S: q3 @6 _: _9 ]/ G$ ?0 l$ x$ M' C
6.6.2 模型计算图 169. h) b* b! B( r4 G  C1 k
( [5 H; n/ W7 ]7 W" _& \2 P! C' K
6.6.3 方法 169" c$ P& H: r, f& k5 a
- g( S9 L6 i7 m& i& [
小结 170: y2 @7 ?1 u3 n8 G

. E, M6 g6 i) t1 L练习 1706 j- S3 t0 r4 A4 R1 T
( x9 q2 y- j6 U8 l
6.7 门控循环单元(GRU) 170
- S2 t: k* a2 I4 Q8 I
$ _0 i( @: Z) v6 h) o7 t6.7.1 门控循环单元 171
! k& H4 V3 T1 `( Z9 ~  t% H  N# T: y7 X  W. c' I/ b
6.7.2 读取数据集 173
* q, q! ^2 g% ~, N) h! K6 ]0 Z) y! ~7 r& a; L: g
6.7.3 从零开始实现 173* S& M7 J2 Q$ Z: b# t# F

( D( L; G$ x0 [2 L2 ~6.7.4 简洁实现 175
6 U$ l; a5 z* L. r1 l& o! |. h. F) p( {8 @& T( \
小结 176
- ]7 W! e& O5 W" i" Y/ v" ~5 d- k: [3 s! B5 I, G; R8 y
练习 176. o% T6 v6 U4 @" J4 V

5 Q" u: d( \! V' A1 M' W7 x  e6.8 长短期记忆(LSTM) 176  N# H1 U% h; y, p( ]; s+ Q4 {% J

6 }) l. E$ [6 K/ F( o6.8.1 长短期记忆 176) O! T. v# P8 p9 U7 L

, Z, {: ]1 T6 }4 @4 S' U, ?6.8.2 读取数据集 179, m1 @" w" x+ u- F$ v' c
# ]% C+ w, {" [; l" k, S! E
6.8.3 从零开始实现 179$ {6 J, T# d- u% x* c

) e9 d) l3 o0 d+ H6 I: H1 f6.8.4 简洁实现 181: s  W, W( c& d8 o* c6 E+ O

8 ]5 I0 I/ @% a: v; |小结 181( W" W& F1 r4 v- Y! I8 h% t- K

5 n* j" v" r# ]! s, C2 J) k1 k; c7 e练习 182
8 @. ^7 @8 Y& _4 L4 W/ K- S/ e8 ]' r$ d- l8 B' H
6.9 深度循环神经网络 1829 ?- G6 j4 p5 Q0 J2 I* }, |  R
! L/ Q2 h6 K. ~
小结 1836 a9 R# c; z0 R9 W% B9 ?- h) N8 z+ z
$ ^( G5 L- A+ {* v7 _
练习 183
( N0 N$ C. W! y  M4 f; q9 R6 W2 g
7 x$ `, ~% u; X3 l, N! o6.10 双向循环神经网络 183+ f$ X) u/ ]' c: h
2 T0 o7 u' n1 m: s1 e& J
小结 184# S  _1 W' k# q! y3 ~, ]( d" m
) e$ N/ s) A6 V: M5 x- y
练习 184) o" b' f; V* c% m
8 U# A, i% D+ v) I1 Y9 j
第7 章 优化算法 185
* |, v& Q0 K2 Z8 ]0 |! H
* A4 a; n. @% J2 g- G; d9 o  s6 U7.1 优化与深度学习 185
+ B6 r4 W: s( P9 ?  b9 i1 p0 d2 |
3 D; Q; ~& U# H7.1.1 优化与深度学习的关系 185$ c3 [& q7 ]# E
) l4 D) ]1 u/ _+ f1 m1 @) x, }
7.1.2 优化在深度学习中的挑战 186+ f! i" Z+ _. I
+ F% w8 G  U( B- g7 j2 ^! a: F
小结 188
. H7 ]% s2 _# |
% O7 K' S3 G5 U6 ]( p( K5 f2 F练习 189
; n  _' B& _' ~" M; m$ j0 A0 L; Z- M" Q/ I3 V# Y0 C- M. S3 N
7.2 梯度下降和随机梯度下降 1895 A9 D0 _: W; i9 p; I

( H+ p; u# p/ e0 `# G$ Z7.2.1 一维梯度下降 1893 W0 C' B+ c+ t$ k
- U- F* r! c* H' A; S2 r
7.2.2 学习率 190' ?/ |3 K& {2 L$ p* b

5 w  r7 `: z5 L$ R2 e3 @5 t7.2.3 多维梯度下降 191% f0 q" j, W! E. R6 z1 |2 x

+ C& q1 M" _) {/ E0 O7 j' ~7.2.4 随机梯度下降 193+ T9 Z! k, q2 G0 h* w- B+ ~
+ s" F, u5 W3 h* K# s' P4 k- B3 s# ^
小结 194' G4 u$ l+ {* z5 R1 ?9 O' r
0 g$ `4 j6 `. H$ V7 ~
练习 194
1 H! H2 i; L0 a% l1 R; A: f# L8 F" @- `& P
7.3 小批量随机梯度下降 194
3 T% E% i& f" q' Y& r! Z. b  v# ?  K! v* L9 K9 \" p
7.3.1 读取数据集 1951 H: u4 e  b' I# w  A+ I/ ?6 a

7 j0 s+ J  x) J$ J- p7.3.2 从零开始实现 196
) }' V6 V( E! Y3 K
) L) |; R/ M- f1 `+ a4 X: V7.3.3 简洁实现 198
) r' ?3 T1 J4 m3 d" X
9 n6 U6 c) N3 c: g4 h$ r小结 1991 @% b9 s" v, A2 |: }
% r9 n% Z) K1 ?. }3 c
练习 199
( ~0 ^* Z, }- H5 N1 }* r! M4 t% X3 K: x9 R7 ^4 V  z+ O& M% ]
7.4 动量法 200* X2 `9 P4 o1 f( c: @4 d9 z2 r
7 }: b7 h% B8 k" e8 ^: x3 N+ R, w
7.4.1 梯度下降的问题 200
: G0 D% x. S5 F* I$ y7 i) Z* K3 G. p4 O& ^
7.4.2 动量法 2015 |/ }4 Z! B  b6 B4 Q6 T
' |0 j* i# F5 R, j
·6· 目 录- y/ N, e0 |# D: X

& Y# F  E  D  e) c' Z% z" z7.4.3 从零开始实现 203
8 b4 H. Q' A' F- d3 J/ s
( b; J, Y9 \7 t9 i' P* I* b8 n/ A  p7.4.4 简洁实现 205
" g6 R9 _; Q& i5 _  T0 |. `4 Y% p3 X! G2 Z* _5 }8 \( U
小结 205
* J6 f7 M- b9 H% d; u8 k/ n8 X* ~% p, `: O3 ?: [5 [
练习 205
. B1 E  v2 B6 v3 g& m
) {6 S" ~2 W* w+ _$ }7.5 AdaGrad算法2068 p, g+ R4 Y% G2 S! J: C" n

% j7 k- T" N9 W) |7.5.1 算法 206+ v! d5 P2 f) U) g7 i6 A
+ c# k' i5 M/ d$ X
7.5.2 特点 206
2 _, W0 Y) b- F8 V- }$ _- r' O5 k6 A* X$ b: L! ]) ~5 l6 F  E9 M! G
7.5.3 从零开始实现 208
9 k2 y* I' H; T* f* d
1 B1 d1 K# @: j7 L! r7.5.4 简洁实现 209
3 f9 r: k  k4 D- Y$ }+ k: {7 W. M) D8 q+ m2 v. n. s5 V
小结 209
0 o  [7 n; @4 ^& r, V7 r
4 H" u6 f. }- R. E) ]练习 209
7 j  j3 V$ y; o* U
! C; W" _4 r, @" r9 f6 h7.6 RMSProp算法 209& p6 w! _* w& r7 `/ T0 G
5 C" M8 [) ~1 U4 j( g- P
7.6.1 算法 210
  z- ~+ u+ M& [9 Q. f9 Y0 r, i7 z8 Z' ^
7.6.2 从零开始实现 2116 o; ~$ i7 p0 X' @! O/ K
; r5 M" j6 l8 g$ `/ P) ~* i
7.6.3 简洁实现 212
" I: i0 m9 u" A- E+ d, e6 R% L3 P4 S) ?/ E8 m1 C
小结 212
' i! w9 Z/ ]' B4 \
: {4 ?; w3 r3 w! h% c8 l/ f' p练习 2125 X+ {, E2 L) u
  D0 u! h* _- K: D5 [; m% A3 n
7.7 AdaDelta算法 212
8 s( `# g+ Z. x: P# Q& L- `
8 @3 Z' Y+ w6 Z: D7.7.1 算法 212& G% w2 e8 D' t" M7 {1 E
5 ]( X* s. F2 s, v* F
7.7.2 从零开始实现 2137 J0 g/ X* c" |! M) [, J; y. Y

; U2 g+ ]1 h9 z* I/ ~+ y7.7.3 简洁实现 214% Y: |2 s! m; K( S2 t

2 L; L* }: h0 r7 }1 H小结 214
. N$ }, s% i1 W* l# A  I4 f' B; h3 R! y* I
练习 2141 {6 f+ a/ E. \

: R4 k6 j; g+ `7.8 Adam算法 215
( J& j, r" I% r+ U: u; o; [1 |& \# o1 f+ _% a
7.8.1 算法 215
. N1 e6 }* j2 R1 s3 N; J
  g, P$ p+ ]" B  U7.8.2 从零开始实现 216, w+ G- N7 a* L! w2 L& A3 v

: Z6 y& n& {+ N% Q* H4 S/ o7.8.3 简洁实现 2162 h! t' z, M: C1 G) c
) ]  f4 Q% [( Q2 z* ?% T
小结 217
* D) {5 t7 o5 t/ t" Q4 H2 T. q& x- V  U
练习 2172 E1 A* H/ U5 E8 y3 F0 q2 V
+ V8 \+ K; i2 o4 l
第8 章 计算性能 218" ~. t7 z2 b) _' t
) {9 {8 R* r, M- {. s+ S7 f( F* `! [
8.1 命令式和符号式混合编程 218
$ _: L. Q' M) M9 M  u$ `1 k4 O  q
- H4 U8 h. ]" I8.1.1 混合式编程取两者之长 220
0 p9 q! p0 c$ g* e) u& w$ ~. s% k
8.1.2 使用HybridSequential类构造模型 220
& j* R; g- D$ {6 P
! U% V" T5 p0 T8.1.3 使用HybridBlock类构造模型 222/ g. m! M3 P; Q

& r+ e8 V  c- W1 i) ~. V小结 224& a( a% b% q, h; j. c) \
4 I& d' p& u1 T) B) _
练习 224
. \- F0 C3 G; P5 g" [* |
  l8 I* x" I5 H" Q- y& n8.2 异步计算 2242 }  ~+ [2 b3 V; L; j8 V; P6 x6 Q
6 _' X+ |& ^/ X) h+ l! d( x7 R
8.2.1 MXNet中的异步计算 224: Y' I0 ?1 P9 s: j6 u8 d
* h) T6 J4 L: p+ v6 p; e
8.2.2 用同步函数让前端等待计算结果 2268 ?: L7 Q3 l7 V  G) [/ M" e
- J1 B6 \+ m) o/ Z9 U
8.2.3 使用异步计算提升计算性能 226
' p7 l! f( e/ Y7 i' Y* R. Y4 m8 m: y8 M9 x6 R8 }; Q
8.2.4 异步计算对内存的影响 227; K) h* _8 V0 i' A) O5 \

' C' I, i9 I$ B% V5 e小结 2297 t( c" G+ y" K5 d, l* k2 o/ Q
" ~$ R3 [( @. ^$ h8 C0 a! @
练习 229
8 F1 _. I5 v# e" B. m5 r% W/ j* M0 A* S) x
8.3 自动并行计算 229
& S, _& U: B+ M$ i1 A! I7 q
: K& a) }- ?2 w! N3 Y! r2 e. k2 E7 a8.3.1 CPU和GPU的并行计算 230
1 J0 E; ?; r9 @- F: j( _% r2 E' D6 l8 P
8.3.2 计算和通信的并行计算 231
6 U8 [+ d0 s5 \1 k" R/ f
/ m- I: G6 p* `( T: N小结 2315 Q7 `9 M% m  }' u' Z
* p! B) e6 e& L
练习 231
. x: A- h, \9 r+ t. Y' B, t. \& C' d+ b' u. u& @* M  @& P
8.4 多GPU计算 232
6 J5 s2 ?3 b; T! g' y( d
: {- b/ B9 v( V. X! q8.4.1 数据并行 232  E8 h8 b  F% d/ L) M+ ?

& V8 G# w: N6 W8 A& c$ M0 q8.4.2 定义模型 233
( t. Z7 U% D6 D2 P* Q
# H# L: e8 P% ~' m, t. N8.4.3 多GPU之间同步数据 234  O: [  ?. f% [! Q
' a3 t! W' o& b8 m% p! }6 L8 ^
8.4.4 单个小批量上的多GPU训练 236( U0 Z5 ^4 h5 V1 [6 b9 Z
& ]& M8 L+ E- y+ V! \+ I: c
8.4.5 定义训练函数 236
) S, [+ [0 @4 o) U& I% `$ f' N/ R; o+ J$ C3 {2 j- j  j
8.4.6 多GPU训练实验 2377 ]$ Z; i$ N9 g' G" R: o

8 @* [/ L/ p+ w小结 2371 Q( v8 d! S$ O; [2 y+ H  ?  z

8 r2 z! D* Z1 j2 _# n练习 2371 Y6 l3 H; C9 Y* o) v. X) B: t& ~
5 l# J" g0 [3 M$ X1 r
8.5 多GPU计算的简洁实现 2372 I) q+ D4 {3 z2 X* C/ v! E

5 j1 p: l2 l' }" m8.5.1 多GPU上初始化模型参数 238
& [3 _0 I' \7 Z  s3 n
6 U/ [) v" A' T0 ^8.5.2 多GPU训练模型 239; j: I6 b9 Z5 _2 _( R" U$ C

) O3 e2 P7 S' Z5 `9 I小结 2417 V, D( E6 g: M# f% k% T! Y
2 b- [1 g9 n6 W# h. I0 F2 J
练习 241* M9 |7 [' q" d. k2 p

8 W1 c% N: L) Q& w第9 章 计算机视觉 242+ a" z' R5 ~3 Z1 r4 n

. F& u& }8 h1 d9.1 图像增广242
" a- v- p$ O, o3 d  J+ s* }6 c
6 `" k3 S1 s, ^9 Q: Q& j& c9.1.1 常用的图像增广方法 2436 [% v" z/ d% `& V8 }4 V

( w. B; b% v* n9.1.2 使用图像增广训练模型 2463 P- S; m* n' \- ^1 U

+ I4 a9 E9 T  Y3 Z& @4 C小结 250  S' p& u# y/ Q! D& C! z

0 @! M5 `/ b1 ~: ^' z练习 250
* \# {7 d/ C+ R* ?& K9 W0 ]6 L2 L8 s6 F+ J" s
9.2 微调 250% P; x# B- U" T1 C! l
, Q- J0 E9 ^, S$ D
热狗识别 251
% s/ ~7 g' J/ ?, `' R& M* D/ g7 J* `( ^1 ]/ a/ t! U
小结 255
8 ^6 b1 r$ |0 p0 P! ?9 ?' ^# R4 w4 K9 t, `) _+ A: y! a) L
练习 2557 M& d( b( l- `! R  H5 I

8 r! Z8 m- }! ]" N& C# B, t% J目 录 ·7·, _! I: _& j9 h( p
5 M9 v. C9 I8 Z! d6 |
9.3 目标检测和边界框 255
( m- y7 P+ z3 J8 I0 _
% V; H+ B$ k% E6 N! p" n; E边界框 2568 l1 _& J$ Q. ]& z  ^" y* O) y

" L6 J8 v9 c/ I7 U小结 257: V1 Z  Z1 |! f+ G/ t

3 L+ R4 a7 j- V/ f7 m: w# ]$ P练习 257$ V) E4 h3 X' K: @% E% o2 C) I

& ?* y  r' I+ q5 U2 \! x" ]  F7 N9.4 锚框 257; j' p7 O2 O* y& n0 L
: Q# ^0 l1 q4 w$ u3 l
9.4.1 生成多个锚框 257' b7 M( B: c" N# n. T
+ P5 j1 M; x3 W7 X. {2 R
9.4.2 交并比 259& s* ~0 d% P4 \7 Y& P
) i  z5 n; `8 o( v
9.4.3 标注训练集的锚框 260& ~& v  P4 s3 b, c

4 y/ S. r  d# H3 \9.4.4 输出预测边界框 263
. R- _4 N: L+ J; B. v+ b- x8 b5 X1 G2 C1 q- i
小结 265- |, V: K+ O! X6 K5 @* F0 u

! e) ]3 W4 N% |0 b& n" \4 ]8 n练习 2658 L. X- F" X, X8 K. Z6 K
4 h/ X0 J* n* e6 R1 D2 J1 W
9.5 多尺度目标检测 265* h+ q3 k5 f6 z$ Y
7 w; q' D/ g( G, S0 ?
小结 268
, p, P1 l; Y1 v* S1 b( W' p! r" s% h! R" D
练习 268) g4 s$ r# ]9 y& P. `+ O, k/ b- g
" l: M5 P$ i2 _1 i! z
9.6 目标检测数据集(皮卡丘) 268
" t/ A( I9 ^. p
' s5 F/ V# ~, y' M, R3 O9 X/ @9.6.1 获取数据集 269
4 v  b/ |; E: ?8 C8 \+ t* x+ N; d" j) A) ?+ {& w  V5 B
9.6.2 读取数据集 269: |! U0 E# d& P- V$ P

$ A  m+ k! {9 W6 h( r: V9 {9.6.3 图示数据 270
2 a) p! D% Q: `  n
9 Z5 G, N1 s6 u* U1 q! N* ^- j小结 270- v9 W3 x; c% p% e0 D
) `" s8 B" G( `- Z) C
练习 271
* C/ ^- ~  [5 o; a
" d# D: r* I  m; u. M. [( A9.7 单发多框检测(SSD) 271
2 x4 H- g7 r# L$ I/ t3 |7 q, H2 q3 O+ d# o) E$ S6 m5 y& |- F+ P
9.7.1 定义模型 271
6 F/ N0 u* r4 S8 o" {+ n  H) Y- D# `( j5 g; S' y( X9 H6 N* W
9.7.2 训练模型 275
: n, L( V0 h# |. ^* c6 j. [" m& n, b  X8 [# U
9.7.3 预测目标 277
4 a* g: [- Y& u& _( F/ s) c5 o, e; m
小结 278' P2 U0 ?; G& ?! w; n6 B3 D1 \

/ w( U4 [- v+ `4 U; u练习 278
$ v( o' ?- s" |+ j5 d4 Y+ J: u. M+ Y- A' P( P$ V
9.8 区域卷积神经网络(R-CNN)系列2802 d" [/ G& x0 J( y/ X8 K, U
. r* L9 a% r! [8 N
9.8.1 R-CNN 280/ j1 O; R* R$ W: d8 e# [3 D- e
& d8 m! |7 j$ G) {& X
9.8.2 Fast R-CNN 281( t. ~* \& w# Q

: I9 Q" X7 i( @7 n  w1 Q9.8.3 Faster R-CNN 283  v* ^$ n/ c- z  n
) u- B; W' u. L! f# x# ^1 j
9.8.4 Mask R-CNN 284. q1 z$ t+ i/ X5 H6 l6 h. z7 y
  ]+ g6 J/ C/ W" O, A0 r. ^& [
小结 285
) b1 W+ K7 R: S7 ~7 T- V, F: C5 Y8 a1 v. [  J9 r
练习 285
( N* o+ G4 V* i  @5 \
  z) j5 Z7 Q* S4 Q/ O" v9.9 语义分割和数据集 2859 r* W2 b: j7 }5 N

  s2 _$ F0 H' x- z* P9.9.1 图像分割和实例分割 2858 V6 _. Q  Y; o. r1 N
8 E5 l" I3 v/ w3 @" ~7 I
9.9.2 Pascal VOC2012语义分割数据集 2863 Z: k- P5 h6 e' n" }2 p0 G
: v$ ^; r9 F- K7 r* u) N
小结 290! j- I9 |7 A. E! ^3 v

4 X  L- Z" W. |5 z0 J( N练习 290
$ B0 S+ y7 }( `; e9 U
9 s- Y  H) z5 @# M' R5 H9.10 全卷积网络(FCN) 290! ]. }. u8 [! s  H9 k8 ~, a
, D+ W% `( b$ l. o, ~
9.10.1 转置卷积层 291" z: v) i$ Z8 d8 h: D

8 `* o6 l# G, P( s9.10.2 构造模型 292
* W1 Q3 [$ w* l5 Q; E" z# I
+ t5 R' M. G+ o2 q4 q9.10.3 初始化转置卷积层 294
( |9 g  M/ ~# @; c; j1 e
* z. V" ^% _6 t9.10.4 读取数据集 2954 S" g+ c2 `6 `0 P
/ a0 z# a9 Q! b
9.10.5 训练模型 296
( i6 j9 z" K( z1 _2 A2 v3 ?9 T- T* \# V
9.10.6 预测像素类别 296; P0 V. L! s9 ]
. x8 M) b# w. ]
小结 297
( d0 s4 o1 `1 S8 E$ y7 H4 T/ S6 s
- [( i) x3 h0 g练习 297
+ N8 _1 O' @( X6 I
& k/ A9 _2 v1 m  L! _) f' B' i9.11 样式迁移 2989 Z: K3 V. j3 Y4 ~: S  G( X
" O9 I/ h1 k2 ~2 z! u7 i# ?
9.11.1 方法 298* X# Q2 ^& s1 J* G

" c* a1 ?# ?1 h' I' S9.11.2 读取内容图像和样式图像 2995 g, Z4 e; T/ u$ E7 v, \
1 U! G0 F1 {$ v9 f3 i/ G+ v" K% g
9.11.3 预处理和后处理图像 300. ~2 e$ ?1 i2 p. C

& B$ h; F' {& }; v0 s9.11.4 抽取特征 301. y- \% Q+ r: O% }  g4 D0 E
: @9 ^" O/ L* m) g' i3 O( ?
9.11.5 定义损失函数 3023 ^0 \1 B3 H  n) I: K

- Z- k6 H$ b. ?  A& q1 `9.11.6 创建和初始化合成图像 303/ }. F! X( W# g, M; ~: V
! t2 ?* ~* D- i' y( n
9.11.7 训练模型 304
1 V* i7 r# s" L. k- X7 u/ G+ [( ?0 n+ B: ^# {% }& B& N. d  R  F
小结 306- p1 T4 ~; Z$ q

3 L3 s) \# L  R4 F" h练习 3060 X9 f) O% I$ x

2 ~8 Z2 f/ W, V/ r$ f4 f2 i9.12 实战Kaggle比赛:图像0 p  t& j2 V& k5 e- ?5 t( j% S+ F

% u" v1 B* J* ]3 b7 |分类(CIFAR-10)3061 r3 P) E) x# e% c& V. q: L
4 l4 b( b* e# h1 k
9.12.1 获取和整理数据集 307
5 f/ x& Y* U4 E2 A" C* j$ T" H% _
9.12.2 图像增广 3104 H; U& J4 b4 @3 E1 W

- a* R7 _/ y; v/ a. u  T9.12.3 读取数据集 310
/ t+ H) ]9 R( j# R5 b8 y
+ d+ `$ G1 v, d! H5 c' L9.12.4 定义模型 3116 R8 {# y5 o/ d0 m
8 r, Z3 X, \7 X
9.12.5 定义训练函数 312
# }2 ]% m# w8 h5 d( s( {
# d& h* I5 `/ f" Z+ l1 B9 a  G9.12.6 训练模型 3120 O2 Y& T" C; g2 h
" P9 }7 T6 o5 r6 x4 K' u! s" h% r
9.12.7 对测试集分类并在Kaggle
! P* R9 G9 Y2 H1 _/ S1 F
. R9 F0 N1 c; ~/ v! ?& p' ^提交结果 313/ B# i4 u5 H* |& R. m, ~! ?7 o
, @2 c5 a3 c. g2 }! n
小结 3138 Z7 k7 E! S0 `: H6 r* I
/ A: s. X/ ?- K/ h3 q2 |
练习 313
; V- X' m( D1 y/ G6 t' A% H/ |8 @3 g5 Z3 T, h0 y
9.13 实战Kaggle比赛:狗的品种* i4 X0 t* w$ w% r
& P7 K/ z1 D; q/ ]$ Y( t, Q% P
识别(ImageNet Dogs) 314
! x) B; V9 y+ e
) r7 |3 @0 z2 \: b% {+ i0 l0 ]8 \( |6 M9.13.1 获取和整理数据集 315
' J* r. A; N0 G$ ^$ e; s, K. D" x* p8 o2 g+ f7 Z" Y  w6 ]
9.13.2 图像增广 316
8 {0 r, }: f  M% A2 ]" G$ Z% o4 D! ~, G' j
9.13.3 读取数据集 317
% l9 |& M/ t" w# j! O8 P% J$ `
7 p7 x% E8 h( T8 M9.13.4 定义模型 318
8 c6 i" f( N7 C. G: d- P, w& o
* Y0 Y% D; c1 {& F/ r1 W9.13.5 定义训练函数 318$ z# {% Z2 g5 h) D- h! q2 }

: }2 F/ s% f) `/ s3 m2 d4 k9.13.6 训练模型 3194 x* R  N" q% f; I
( u( H+ {" h  ~
·8· 目 录( j  s5 N6 y0 ~* Q1 ~! B

1 S: l* [, ?- D6 z% N9.13.7 对测试集分类并在Kaggle提交结果 319
3 t& ?3 L: N  t7 s. {
! F" i7 X% b  }小结 320
4 Y8 [- F: w. _/ ]7 r$ n, j) o) F! L0 N( L  C5 ~% p3 P- Z
练习 320
, U# e$ d' a+ s% O# t0 E- v2 ]
) H0 r( ?5 N' T- f第 10 章 自然语言处理 321" S3 P* |' E- g) b- O1 Q2 N
4 p! O1 V+ X% U3 Y8 |5 P: Q
10.1 词嵌入(word2vec) 321$ f2 U( Y% l; Z3 o7 Z% _4 I) C6 B
+ R5 H8 X4 I* N/ ~! r
10.1.1 为何不采用one-hot向量 3217 [8 F& \0 G3 q& }6 o/ ^/ _
5 M& b1 s/ W3 p; [/ D' a0 l/ e
10.1.2 跳字模型 322* b  Y1 f  _7 D: z) ^  ^  R

2 V4 o7 K' f4 ]; C: b# u/ x10.1.3 连续词袋模型 323* c; }# T* A5 w( B

9 r: H. O9 ^' p# z8 g1 K2 u: R% v小结 325
3 Z  _* b8 W4 [( A; n# h
9 Q  C; `9 p5 R4 u" ~: C" O练习 325& H- S0 N3 ~5 D# p( H
4 j8 G; ^. G* S: ~
10.2 近似训练325
% k- E" R( Q& M5 @" r- c4 s7 p" }8 j
/ i& Y/ f) T# c2 x  S10.2.1 负采样 325
4 C  c) R6 }. Y. p3 z# R* h3 a" D8 g* m0 s( F( T2 s
10.2.2 层序softmax 326( [- E8 _- V, N+ Y3 }

2 U7 a) t; I' A. \小结 327" c) h0 f0 R4 ]1 j
- {  D. L* v; z. A7 c
练习 328
: r& a) L4 b* ^1 J! N0 x
( P% F9 p: G7 C8 _! G! @5 k9 `10.3 word2vec的实现328
. K) Y0 q" B8 {: o( L# N0 i# n/ Y) T+ p1 r2 {3 W/ L
10.3.1 预处理数据集 328
: U  Z  k5 o& X; S" H# o- X/ u% ~3 I- r/ v& x% d8 N9 F" z
10.3.2 负采样 331% L, q; J8 x; A1 f4 a, C* _/ J6 k2 V
$ V' \3 E$ |; t
10.3.3 读取数据集 331+ f! Z4 U0 o+ g

' `8 P0 V& |  X& y- q# v( v/ f10.3.4 跳字模型 332
$ i' J1 f) R: J5 K( _. s7 ]0 a; {* c9 v$ B
10.3.5 训练模型 333
( s- ?6 f2 q; ~2 }! U3 w, \8 {) m0 C% B" b
10.3.6 应用词嵌入模型 335
! b/ x. h6 l* O2 z7 c  Z
9 p1 R2 k% R' ?* D小结 3365 d1 A! o% J+ i9 |* Y  o1 ?) b
; A* x& Z$ b* i) v6 I* t- n9 J
练习 3365 B; B  R0 P7 T1 }+ y0 x6 R

$ Y' N$ x  \6 F' Z- S; h10.4 子词嵌入(fastText) 336
7 V' a) \/ l7 K1 X. U" [3 r
* R5 @7 O! F4 q7 O& K* `小结 337, U/ G3 u7 @) t$ r+ `$ `, C! y

: n; @3 ~% \+ K练习 337
4 u7 F2 ~; m( D7 b
+ c, I* C, L( t( p10.5 全局向量的词嵌入(GloVe)337
9 q1 G% `" u8 ^  I9 S0 ?$ N
; ]/ }, M& A, }) J- {10.5.1 GloVe模型 338
+ C* H/ ^! T+ f9 q& \  F
% g! @$ `8 q8 J; i10.5.2 从条件概率比值理解GloVe模型 339) z/ E2 T4 b5 E, D7 Z

' t& E2 Q' L# e7 e小结 340
, f' w. B4 Q8 b: H2 l' }* \: b/ S; H& e) v6 H8 X/ t* Q  h2 P
练习 3408 @3 C8 {1 g# P# Y" o, |+ g9 E0 [5 ?
7 f$ w4 K) O% {( B1 j! O
10.6 求近义词和类比词3404 [2 E& a; p) K, U
5 m/ n' r& R, r' |6 J0 e/ j
10.6.1 使用预训练的词向量 340; Q) X# d4 a' H7 f# Q

5 |6 }, w( m4 h  s6 F8 q) d10.6.2 应用预训练词向量 3419 u4 x9 O, B( _( w

' b. h, y  H: j& x4 b小结 343& E; h- v0 W) Z( V6 m: P$ c
" C  t9 H2 a1 U# u' ^% X
练习 343& P* \  z2 j5 S7 @8 C& G
' i3 X2 {6 {+ c& Z
10.7 文本情感分类:使用循环神经网络 343& G) P' W8 A5 Y2 m9 _3 J! K  q1 ?

, S4 g9 }# {$ i. [10.7.1 文本情感分类数据集 343
" e) Z8 V1 t2 V' B" @5 |4 f9 d, _3 N
10.7.2 使用循环神经网络的模型 3452 b1 Z# B) l. Z! g$ _

- B% P2 `5 S' m2 ~9 j  g小结 3477 b7 O! Q) H5 T, o0 |- d
$ j) c* P- }& n6 [# ~! ^3 a; l( O
练习 347( h& x' `6 z5 S5 ]5 Y" `: A

3 X- b* A4 d  l4 k/ P$ w3 N  _" o10.8 文本情感分类:使用卷积神经网络(textCNN) 347
8 e/ j, G0 k) d& D" v# _# X2 t
  ~3 W7 B5 w& Z# O' R3 Z) I10.8.1 一维卷积层 348+ I7 L' E, t& P; _8 K* l% e
' p! T  O; u( o
10.8.2 时序池化层 349
- V% F) f+ F! y: w  Q0 T8 V7 Y* d& }
" g- B! G+ M* b2 J7 Y' F10.8.3 读取和预处理IMDb数据集 350  `& v. }' o" r2 ?- c" I

8 t# I! C2 N+ h+ N10.8.4 textCNN模型 350% n+ o+ c1 [3 O- B9 s2 |
0 E; h, I; V$ x
小结 353; C- k6 u! e" |) I5 N+ x

, M, g5 i( r5 K% e' g9 f7 J练习 353
0 G5 G: r, }" E5 e/ Z# c# E
' ]6 Z7 v8 D+ ]! ^: L+ z% }10.9 编码器-解码器(seq2seq)353
0 ~% c7 K0 ?/ x% s" T9 w# Q& \" g: z9 T9 M6 c; f* S. O
10.9.1 编码器 354, n; y6 B% t/ i

+ x' d# Y( d& a' q& J10.9.2 解码器 354
" r- ?) Y2 H7 I
, q* n9 K; S4 f, E1 a6 Z7 M# m10.9.3 训练模型 3557 R6 J2 W! G. s

" [7 `6 [& F  _# \3 K: {! w: R小结 355
$ k+ I/ L$ q  {: W0 V- d1 y/ D; I: G8 h3 i* U/ e7 v6 h" F% V' D
练习 355
/ F# f3 Q$ y6 B( I8 Z$ y3 o4 u& Q( i
10.10 束搜索 355
( h# o& M; I0 y. g
& W) ^+ \& `, c7 `: `. h10.10.1 贪婪搜索 356! q* f* l- ~+ k( j
  i% N/ X& O' D: v; o1 M: {
10.10.2 穷举搜索 357  b' F9 J/ q3 V' K3 C5 Q" `$ R

6 z' j4 L; n7 I9 U1 W6 M10.10.3 束搜索 357
: D8 e0 h5 h7 u0 M2 B
5 v; S7 r9 B1 \$ Y. O# F" s: Q7 v小结 358
& ~, O& V, \" f2 j- g' @
- N8 ]) g+ g* h2 E8 s练习 358/ X9 x% C' @/ Y+ D  L
8 h. ]. {- k3 I& J- d4 ^0 A# G
10.11 注意力机制 3588 S: ^- Y- Y$ S0 P/ O% b; \7 Z

+ _8 a% w* m) o10.11.1 计算背景变量 359% J3 T5 U; [! |3 W# V

) m5 a+ k) V4 d( e0 n10.11.2 更新隐藏状态 360
7 v& n, K/ O7 V) L1 t2 l, b5 m8 P- I; p
10.11.3 发展 361
- \% K- b( p1 w/ B- g5 I) H+ R+ B
7 i- i  s6 z5 U' I1 S# c小结 361) N8 S: G( X! C# ?9 }0 I, B* c: l

3 V. C" `  H  n$ ~" z/ w练习 3612 C  i' \4 i4 V

" b/ K/ Y: B+ j10.12 机器翻译 3613 J8 }% _# M4 {7 ?

& A6 B% E6 h( V3 j; y5 [10.12.1 读取和预处理数据集 361
' [, S* p, I1 x- p4 A) I, a' v) l! H7 H, O# X7 v% o" \$ U' x
10.12.2 含注意力机制的编码器-解码器 363
0 m+ k& j: G2 a; @* p
: D' B- l7 V; R1 e1 m3 Z. B0 b5 w10.12.3 训练模型 365
" E4 G, m& O+ Z+ f# M* |, r
4 N9 J: Y9 u3 K10.12.4 预测不定长的序列 367& e9 T; S0 s+ i. x4 x2 `
3 r/ S$ s' G) E
10.12.5 评价翻译结果 367
; s5 i. y  n' @- E
$ h6 {  T8 w% m* z小结 3697 g: \' X; F, y8 I5 j$ {- c7 M) Y

1 G  ]! N- j9 t' n! c练习 3698 l+ M3 G1 {9 N2 r. c; Q8 V8 Y( S
0 A) a1 m0 A- Z$ C6 Y
附录A 数学基础 3701 M$ h$ H+ S: K" l# u" {4 D

$ I3 J! z) S8 `5 }) y9 W附录B 使用 Jupyter 记事本 376
  L8 ~' t7 n  }3 C+ c8 c
; M  `, r6 W- W+ s附录C 使用 AWS 运行代码 381- A& `" p. o# V7 E: {

4 X, e$ l) i/ O# w$ N1 d" N附录D GPU 购买指南 388
0 {3 r6 B% a8 m( y
% I8 }3 {" b- x& g附录E 如何为本书做贡献 391) o0 j# |- V. ^9 D
0 R  _6 i& u3 i& L0 }( H
附录F d2lzh 包索引 395
4 _$ L7 K8 K- M% r: z" Q' g5 Q
附录G 中英文术语对照表 397' o1 {. W! I; l' g! |- ~

) _2 y# u  u( P& C. U6 l* J! D参考文献 402' M3 S) K" z  Q0 O' e
% ~- Q$ m( s" g4 c4 f
索引 407
! G. [3 h" n# C: O2 _" @; t百度云盘下载地址(完全免费-绝无套路):
游客,如果您要查看本帖隐藏内容请回复

8 @% a. V* n! w: ^% {: m

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
关注下面的标签,发现更多相似文章
分享到:

回答|共 19 个

罗翔

发表于 2023-9-22 21:49:12 | 显示全部楼层

路过,收下了,不错的论坛

天箭

发表于 2023-9-24 06:47:33 | 显示全部楼层

学习java,就选java吧了

茶烟袅袅

发表于 2023-9-25 07:35:18 | 显示全部楼层

java吧 真给力

许建林钢筋螺纹

发表于 2023-9-25 17:10:02 | 显示全部楼层

良心网站,力挺

攀帅

发表于 2023-9-26 11:38:15 | 显示全部楼层

良心网站,力挺

山楂汤圆儿

发表于 2023-9-26 14:00:35 | 显示全部楼层

给力,真免费

大海中的鱼

发表于 2023-9-26 15:56:57 | 显示全部楼层

我又来了 白漂开始

方圓

发表于 2023-9-27 23:22:24 | 显示全部楼层

资料免费 给力

一铖

发表于 2023-9-28 12:15:32 | 显示全部楼层

java吧 真给力
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则