Le modèle utilisé en analyse factorielle est un modèle linéaire. Par exemple, dans le cas de l’analyse factorielle exploratoire (AFE), on postule que les variables observées sont des combinaisons linéaires d’un ensemble plus restreint de facteurs latents (ou variables sous-jacentes non observées)
Pour illustrer et comprendre ce principe, imaginons que deux facteurs V et W représentent deux dimensions psychologiques théoriques expliquant les corrélations observées entre cinq mesures (des tests par exemple, X1 à X5). La position d’un individu sur chacun des tests peut alors s’exprimer comme une combinaison linéaire de ses positions sur ces deux facteurs communs, d’un facteur spécifique propre à chaque test (Si), et d’une erreur résiduelle (εi). Cette hypothèse se traduit en algèbre par une équation de décomposition :
Xki = akV i + bkW i + ckSk i + εi
|
avec Xki , le score observé pour le sujet i dans l'épreuve k. Vi et Wi sont les scores du sujet i sur les facteurs communs V et W Ski le score du sujet i pour facteur spécifique à la variable Xk. ak, bk, ck, les poids de ces facteurs pour l'épreuve k (charges factorielles) εi : l'erreur aléatoire de mesure associé au sujet i. |
Cette décomposition traduit le fait, si nous prenons en considération les réponses (plus exactement la variance des réponses) au test Xk, que :
→le facteur V explique une partie de la variance Xk (et ce d'autant plus que ak sera grand)
→le facteur W explique une autre partie de la variance Xk (et ce d'autant plus que bk sera grand)
→le facteur Sk, explique la variance inexpliquée par V et W et qui est spécifique à l'épreuve Xk
Cette équation revient donc à expliquer, en la décomposant, le score observé au test Xk et donc la variance de Xk. Pour un sujet i, on obtient donc pour 5 épreuves, 5 équations :
X2 i = a2V i + b2W i + c2S2 i + εi
X3 i = a3V i + b3W i + c3S3 i + εi
X4 i = a4V i + b4W i + c4S4 i + εi
X5 i = a5V i + b5W i + c5S5 i + εi
Remarque :
▪Pour l'analyse en composantes principales, le principe est légèrement différent. On suppose qu’il existe initialement autant de composantes que de variables et ce sont les composantes qui sont des combinaisons linéaires des variables observées.
Ck = a1kX1 + a2kX2 + ... + apkXp
Dans l'interprétation des résultats, seules certaines composantes extraites, celles qui expliquent le plus de variance, seront cependant pris en compte (voir : fixer le nombre de facteurs).