# transformer
用 Rust 手写 Transformer —— Day 6:多头注意力和因果掩码
2026-05-10
用 Rust 手写 Transformer —— Day 5:给单头注意力增加缓存
2026-05-08
用 Rust 手写 Transformer —— Day 4:Attention 到底在算什么?
2026-05-07
用 Rust 手写 Transformer —— Day 3:Token 怎么变成向量?
2026-05-06
用 Rust 手写 Transformer —— Day 2:反向传播与softmax的理论基础
2026-04-27
用 Rust 手写 Transformer —— Day 1:矩阵运算和梯度验证
2026-04-25
两周从零手写 Transformer:不用任何 ML 框架,只有 Rust
2026-04-23