On rappelle la définition d'une matrice jacobienne d'une fonction :
$$
\begin{align*}
F &: \mathbb{R}^n \longmapsto \mathbb{R}^m \
F &:{\begin{pmatrix}x_{1}\ \vdots \ x_{n} \end{pmatrix}} \longmapsto {\begin{pmatrix} f_{1}(x_{1},\dots ,x_{n}) \ \vdots \ f_{m}(x_{1},\dots ,x_{n}) \end{pmatrix}}
\end{align*}
$$
Les dérivées partielles de ces fonctions en un point
Soit
$$ \begin{align*} M_W(z^{k-1}) &= z^{k-1} \times W \ &= \begin{pmatrix} z^{k-1}{1,1} & z^{k-1}{1,2} & \cdots & z^{k-1}{1, input} \ z^{k-1}{2,1} & z^{k-1}{2,2} & \cdots & z^{k-1}{2, input} \ \vdots & \vdots & \ddots & \vdots \ z^{k-1}{batch,1} & z^{k-1}{batch,2} & \cdots & z^{k-1}{batch, input} \end{pmatrix} \times \begin{pmatrix} w{1,1} & w_{1,2} & \cdots & w_{1, output} \ w_{2,1} & w_{2,2} & \cdots & w_{2, output} \ \vdots & \vdots & \ddots & \vdots \ w_{input,1} & w_{input,2} & \cdots & w_{input, output} \end{pmatrix} \ &= \begin{pmatrix} \sum_{i=1}^{input} z^{k-1}{1,i} w{i, 1} & \sum_{i=1}^{input} z^{k-1}{1,i} w{i, 2} & \cdots & \sum_{i=1}^{input} z^{k-1}{1,i} w{i, output} \ \sum_{i=1}^{input} z^{k-1}{2,i} w{i, 1} & \sum_{i=1}^{input} z^{k-1}{2,i} w{i, 2} & \cdots & \sum_{i=1}^{input} z^{k-1}{2,i} w{i, output} \ \vdots & \vdots & \ddots & \vdots \ \sum_{i=1}^{input} z^{k-1}{batch,i} w{i, 1} & \sum_{i=1}^{input} z^{k-1}{batch,i} w{i, 2} & \cdots & \sum_{i=1}^{input} z^{k-1}{batch,i} w{i, output} \ \end{pmatrix} \ &= \begin{pmatrix} z^{k}{1,1} & z^{k}{1,2} & \cdots & z^{k}{1, output} \ z^{k}{2,1} & z^{k}{2,2} & \cdots & z^{k}{2, output} \ \vdots & \vdots & \ddots & \vdots \ z^{k}{batch,1} & z^{k}{batch,2} & \cdots & z^{k}_{batch, output} \end{pmatrix} \ &= z^{k} \in \mathbb{R}^{batch \times output} \ \end{align*} $$
Pour
$$ \begin{align*} M_W(z^{k-1}) &= z^{k-1} \times W \ &= \begin{pmatrix} z^{k-1}{1,1} & z^{k-1}{1,2} & \cdots & z^{k-1}{1, input} \end{pmatrix} \times \begin{pmatrix} w{1,1} & w_{1,2} & \cdots & w_{1, output} \ w_{2,1} & w_{2,2} & \cdots & w_{2, output} \ \vdots & \vdots & \ddots & \vdots \ w_{input,1} & w_{input,2} & \cdots & w_{input, output} \end{pmatrix} \ &= \begin{pmatrix} \sum_{i=1}^{input} z^{k-1}{1,i} w{i, 1} & \sum_{i=1}^{input} z^{k-1}{1,i} w{i, 2} & \cdots & \sum_{i=1}^{input} z^{k-1}{1,i} w{i, output} \ \end{pmatrix} \ &= \begin{pmatrix} f_{1, w_{, 1}}(z^{k-1}) & f_{2, w_{, 2}}(z^{k-1}) & \cdots & f_{output, w_{, output}}(z^{k-1}) \end{pmatrix} \ &= \begin{pmatrix} z^{k}{1,1} & z^{k}{1,2} & \cdots & z^{k}_{1, output} \ \end{pmatrix} \ &= z^{k} \in \mathbb{R}^{output} \ \end{align} $$
Prenons
Mais ça c'est pour l'écriture réduite du
Or, ici
Ca c'était pour un
Prenons
$$ \begin{align*} J_{M_W}^{z^{k-1}} &= {\begin{pmatrix} {\dfrac {\partial f_{1}}{\partial z^{k-1}{1}}} & \cdots & {\dfrac {\partial f{1}}{\partial z^{k-1}{input}}} \ \vdots &\ddots &\vdots \ {\dfrac {\partial f{output}}{\partial z^{k-1}{1}}} & \cdots & {\dfrac {\partial f{output}}{\partial z^{k-1}{input}}} \end{pmatrix}} \ &= \begin{pmatrix} w{1,1} & w_{2,1} & \cdots & w_{input,1} \ w_{1,2} & w_{2,2} & \cdots & w_{input,2} \ \vdots & \vdots & \ddots & \vdots \ w_{1,output} & w_{2,output} & \cdots & w_{input,output} \ \end{pmatrix} \ &= W^T \end{align*} $$
Ca c'était pour un