从感知机、反向传播、卷积与 LSTM,到 Transformer、预训练、scaling 与推理模型——每章配可运行算法与机制动画。