展平方式:按 行 展平。
可先看作 \( \mathbf{x}^T \in M_{1, 784} (\mathbb{R}) \) 的行向量,再转置为 \( \mathbf{x} \in M_{784, 1} (\mathbb{R}) \) 列向量参与矩阵乘法。
- 随机初始化:用于展示「模型还没学会时」的矩阵乘法效果
- 训练好的权重:用于展示真实识别效果
第一层维度:
\( \mathbf{W}_1 \in M_{16, 784} (\mathbb{R}) \),
\( \mathbf{b}_1 \in M_{16, 1} (\mathbb{R}) \),
激活函数 \( \text{ReLU} \)。
第二层:\( \mathbf{W}_2 \in M_{10, 16} (\mathbb{R}) \),
\( \mathbf{b}_2 \in M_{10, 1} (\mathbb{R}) \)。
\( \mathbf{h}_2 = \mathbf{W}_2 \cdot \mathbf{h}_1 + \mathbf{b}_2\) ,
\(\hat{\mathbf{y}} = \text{softmax}(\mathbf{h}_2) \),
其中 \( \hat{\mathbf{y}} \) 的 10 个分量对应数字 0–9 的概率。