transformer升级之路+1

2025-06-15 00:31:24

拼音 [ 拼音 ]

Transformer升级之路:1、Sinusoidal位置编码追根溯源 - 知乎

对于第一个方程,代入n=m得r_m^2=R_0,即r_m是一个常数,简单起见这里设为1就好;对于第二个方程,代入n=0得\phi_m - \phi_0=\Phi_m,简单起见设\phi_0=0,那么\phi_m=\Phi_m,即\phi_m - \phi_n=\phi_{m-n},代入n=m-1得\phi_m - \phi_{m-1}=\phi_1,那么\{\phi_m\}只是一个
Transformer升级之路:2、博采众长的旋转式位置编码 - 知乎

1} \end{pmatrix} + \begin{pmatrix}-q_1 \\ q_0 \\ -q_3 \\ q_2 \\ \vdots \\ -q_{d-1} \\ q_{d-2} \end{pmatrix}\otimes\begin{pmatrix}\sin m\theta_0 \\ \sin m\theta_0 \\ \sin m\theta_1 \\ \sin m\theta_1 \\ \vdots \\ \sin m\theta_{d/2-1} \...