tutoriel de décomposition Singular Value (SVD)
Lorsque les colonnes de U sont les vecteurs singuliers gauches (vecteurs de coefficients de gène); S (les mêmes dimensions que A) a des valeurs singulières et diagonales (amplitudes du mode); et V T comporte des lignes qui sont les vecteurs singuliers (vecteurs de niveau d'expression). La SVD représente une expansion des données d'origine dans un système de coordonnées où la matrice de covariance est diagonale.
Calcul de la SVD consiste à trouver les valeurs propres et les vecteurs propres de T AA et AT A. Les vecteurs propres de ATA composent les colonnes du V. les vecteurs propres de T AA représentent les colonnes de U. De plus, les valeurs singulières par S sont les racines carrées des valeurs propres de T AA ou AT A. les valeurs singulières sont les éléments diagonaux de la matrice S et sont disposées en ordre décroissant. Les valeurs singulières sont toujours des nombres réels. Si la matrice A est une matrice réelle, alors U et V sont également réels.
Pour comprendre comment résoudre pour SVD, prenons l'exemple de la matrice qui a été fournie dans Kuruvilla et al:
Dans cet exemple, la matrice est une matrice 4x2. Nous savons que pour une matrice n x n W, puis un x non nul vecteur est le vecteur propre de W si:
Pour certains l scalaire. Ensuite, le l scalaire est appelé une valeur propre de A, et x est dit être un vecteur propre de A correspondant à l.
Donc, pour trouver les valeurs propres de l'entité ci-dessus on calcule les matrices AA T et A T A. Comme indiqué précédemment. les vecteurs propres de AA T représentent les colonnes de U afin que nous puissions faire l'analyse suivante pour trouver U.
Maintenant que nous avons une matrice n x n, nous pouvons déterminer les valeurs propres de la matrice W.
Etant donné que W x = L x puis (W- L i) x = 0
Pour un ensemble unique de valeurs propres à déterminant de la matrice (W- L i) doit être égal à zéro. Ainsi, à partir de la solution de l'équation caractéristique, | W- l I | = 0 on obtient:
0,117 (quatre valeurs propres, car il est un polynôme du quatrième degré). Cette valeur peut être utilisée pour déterminer le vecteur propre qui peut être placé dans les colonnes de U. Ainsi, nous obtenons les équations suivantes:
19,883 x1 + x2 = 14 0
14 x1 + x2 = 9,883 0
Lors de la simplification des deux premières équations, on obtient un rapport auquel se rapporte la valeur de x1 à x2. Les valeurs de x1 et x2 sont choisis de telle sorte que les éléments du S sont les racines carrées des valeurs propres. Ainsi, une solution qui satisfait l'équation ci-dessus x1 = x2 = -0,58 et 0,82 et X3 = X4 = 0 (ce qui est la seconde colonne de la matrice U).
L'autre substituant aux valeurs propres, on obtient:
-9,883 x1 + x2 = 14 0
14 x1 - x2 = 0 19,883
Ainsi, une solution qui répond à cet ensemble d'équations est x1 = x2 = 0,82 et -0,58 et x3 = x4 = 0 (ce qui est la première colonne de la matrice U). La combinaison de ces on obtient:
De même, un T A fait les colonnes de V afin que nous puissions faire une analyse similaire pour trouver la valeur de V.
De même et nous obtenons l'expression:
Enfin, comme mentionné précédemment, le S est la racine carrée des valeurs propres de AA T ou A T A. et peut être obtenu directement en nous donnant:
Notez que: s 1> s 2> s 3> ... qui est ce que le document indiquait par la figure 4 du document Kuruvilla. Dans ce document, les valeurs ont été calculées et normalisées de telle sorte que la plus grande valeur singulière est égal à 1.