脉动阵列:逐 Cycle 拆解 TPU MXU 的矩阵乘法2026年4月12日·7 分钟TPU TPU MXU Systolic Array用 4×4 的具体数字,逐 cycle 追踪激活值和部分和在脉动阵列中的流动,理解 TPU MXU 如何通过权重固定、激活流过、对角波前推进来完成矩阵乘法