Skip to main content

Tout d'abord, analysez le facteur atteint dans SPSS

Les principales étapes de l'analyse factorielle sont les suivantes:

    Normaliser les données de l'indicateur (le logiciel SPSS est automatiquement);
    Déterminer l'index;
    Déterminer le nombre de facteurs;
    expressions de points intégrées;
    Chaque nombre d'éléments;

Exemple: Analyse des indicateurs économiques complets de 10 provinces et villes dans les côtes

1, indicateur de principes de sélection

les données sélectionnées dans Cet article est le mot "Statistiques statistiques chinois 2003" en 2002, 10 indicateurs ont été sélectionnés dans le système d'index de 10 provinces et des conditions économiques de la ville sur la côte:

X1 - PIB X2 - PIB PEPORT

x3 - Valeur agricole supplémentaire x4 - Valeur industrielle ajoutée

x5 - La troisième valeur industrielle ajoutée x6 - Investissement d'immobilisations fixes
X7 - Investissement de base de la construction X8 - Compte du PIB pour la gravité privée nationale (%)

x9 - Total des douanes à l'exportation X10 - Revenu financier local




2, analyser les éléments d'opération spécifique


Dans SPSS


    L'analyse des facteurs de 10 indicateurs complets économiques de la province et de la ville de la côte est utilisé. Les étapes spécifiques sont les suivantes:

Analyse du facteur de réduction des données, Dialogue d'analyse des facteurs
Sélectionnez X1 ~ X10 dans la boîte de variable

Description: Coefficient de matrice de bataille Ghost Group Sélectionnez le coefficient et les autres options, puis cliquez sur Continuer, revenir à l'analyse de retour Cliquez sur "OK"



Figure 2: Dialogues d'analyse des facteurs et descriptions biographiques

SPSS lorsque le processus d'analyse des facteurs est appelé, SPSS standardise automatiquement les données d'origine, de sorte que, après avoir suivi les résultats Calcul des variables, reportez-vous à des variables normalisées, mais SPSS ne fournit pas directement de données standardisées, si des données standardisées sont nécessaires, puis appelez le processus de description à T.Calculer les mathématiques. Nous pouvons déployer: Lorsque vous allumez la boîte de dialogue Description, nous sélectionnerons X1 ~ X10 dans la zone Variable, vous devez accrocher la case avant d'enregistrer les valeurs standard à tourner, cliquez sur "OK" et des données standard utilisées automatiquement dans le Fenêtre de données et nommage dans Z. La boîte de dialogue Description






peut être vue à partir de la figure 3 pour augmenter la valeur du PIB et de l'Université de valeur industrielle et industrielle pour augmenter la valeur, Investissement fixe dans les actifs, les investissements de la construction de capital, les ventes au détail total de biens de consommation sociaux, ont une relation significative avec différents indicateurs de recettes financières locales de Phuong et possède une relation importante avec l'exportation douanière totale. On peut constater que la corrélation directe entre de nombreuses variables est relativement forte, prouvant qu'elles ont des informations qui se chevauchent.

Il est connu d'extraire 2 facteurs de la figure 4 (analyse des éléments décomposés différentiels), car le taux de cotisation accumulé est de 84,551%, près de 85%. De la figure 5 (maMatch de chargement initial), PIB, valeur ajoutée à valeur ajoutée, valeur ajoutée par secteur universitaire, investissement dans des immobilisations, investissement de la construction de capital, vente totale de biens de consommation sociale, chiffre d'affaires total, le revenu financier local est le premier élément à télécharger, indiquant que le Le premier facteur reflète les informations de ces indicateurs; Les indicateurs de la valeur ajoutée du PIB par habitant et de la valeur agricole ont une charge plus élevée dans le deuxième facteur, montrant que le deuxième facteur reflète fondamentalement les informations des deux indices du PIB et de la valeur de l'agriculture moyenne des Persians ajoutent de la valeur.

Par conséquent, l'extraction de deux facteurs de base peut refléter des informations sur tous les indicateurs, alors décider de remplacer dix variables d'origine avec deux nouvelles variables. À ce stade, le score de facteur a été automatiquement donné dans la fenêtre. Vous pouvez également choisir de faire pivoter dans le graphique 2 dans la boîte de dialogue, sélectionnez Différentes méthodes de rotation, souvent plus utiles pour faire pivoter.

liés au point d'intégration, il a été obtenu avec le facteurPremièrement, le deuxième facteur moyen a du poids et du poids est tiré de la variance. Tableau 4 7.22 + 1.235 = 8,455 Poids Le premier élément est de 7,22 / 8,455, le deuxième facteur de poids est de 1 2135/8 455 Facteurs totaux = (7,22 / 8 455) * Premier point de facteur + (1 235 / 8,455) * Le score de deuxième facteur


Lundi, la principale analyse des composants dans SPSS



Supposons que le composant d'analyse soit actuellement effectué sur l'exemple ci-dessus. Le logiciel SPSS n'est pas directement fourni avec le coefficient de composant principal, mais la charge de coefficient (Figure 5), nous pouvons diviser le coefficient de charge initial de coefficient (note, le coefficient de charge de coefficient est divisé
, le coefficient de composant principal peut être obtenu.

Le coefficient de composant1 a été divisé par SQRT (7.22) et le coefficient de composant2 divisé par SQRT (1.235), l'analyse d'analyse du composant principal: la méthode de calcul du composant principal considère spécifiquement l'analyse principale du composant. et analyse de coefficient (1) copiesPrenez la composante principale, les méthodes et les étapes d'analyse, avec les mêmes exemples.

1. L'analyse principale des composants et l'analyse de coefficient



L'analyse principale des composants et l'analyse factorielle (analyse de coefficient) sont deux nombres de taille différentes variables pour des méthodes pour décrire, comprendre et Analyser: Une analyse des composants réalistes peut être dit être un facteur d'analyse spéciale de cas. Avant d'introduire l'analyse principale des composants, examinez l'exemple ci-dessous.

Student.sav)



Mathématiques, Physique, Chimie, Chimie, Histoire et Anglais comme suit (partiellement).


Le problème peut être présenté à partir de cet exemple que les six variables de ces données peuvent être exprimées par une ou deux variables intégrées? Combien d'informations originales sont incluses dans ces deux variables intégrées? Pouvez-vous utiliser la variable complète trouvée pour organiser vos étudiants? Les problèmes liés à ce type de données peuvent être élargis pour les entreprises, l'analyse, Classification, distinction et classification des écoles.
2, analysant le composant principal

(1) Théorie de base et méthode d'analyse principale des composants; ce qui signifie la géométrie de l'analyse principale des composants;


Les scores de données sont six-immédiats; C'est-à-dire que chaque observation est un point dans l'espace 6 dimensions. Nous espérons montrer un espace en 6 dimensions avec un espace de faible taille.

La première fois supposait que seules deux manières, c'était, seules deux variables, montrées à Abscissa et sont apparues; Par conséquent, chaque valeur d'observation comporte deux valeurs de coordonnées correspondant aux deux coordonnées. Si ces données forment une matrice de points de l'ellipse (il est possible dans la normalité bidimensionnelle ordinaire de la variable), cette ellipse a un arbre long et un axe court. Dans la direction de l'axe court, les données changent très peu; Dans les extrêmes, si la tige courte est dégradée, la direction de l'arbre long peut expliquer les changements de ces points. De cette façon, il est complété d'une manièreAvec deux dimensions à une dimension.

Lorsque la longueur des coordonnées et des ellipses parallèles, la variable représente l'axe long décrivant le changement principal des données et la variable représentant l'axe court décrit le changement secondaire des données. Cependant, l'axe de coordonnées n'est souvent pas parallèle à l'axe long et court de l'ellipse. Par conséquent, il est nécessaire de trouver l'axe long et court de l'ellipse et de transformer, pour tourner neuf et la longueur elliptique de l'ellipse est parallèle. Si la variable de l'axe long représente la plupart des informations contenues dans les données, la variable est utilisée à la place de deux variables d'origine (舍 次)), la baisse diminuée est terminée. L'axe long et court de l'ellipse (Shadow) est différent, plus le sens.

Pour les cas de variables multidimensionnelles et bidimensionnelles, la hauteur des ellipsoïdes, mais ne peut pas le voir.

Premièrement, l'axe principal de la hauteur ellipsoïde est d'abord, puis utilisez l'axe le plus long montrant la plupart des informations de données sous la forme d'une nouvelle variable; Analyser le composant principal fondamentalement terminé.
Notez que l'axe principal de la taille de haute taille ellipsoïde est également perpendiculaire l'un à l'autre. Ces variables orthogonales sont la combinaison linéaire des variables d'origine appelées composantes principales.

Lorsque les deux axes sont à deux sens, une motivation tridimensionnelle à trois axes, certaines variables sont des composants principaux.

Choisissez un composant moins important, le plus possible possible. Qu'est-ce que Standard? C'est la longueur de la broche principale de ces composants clés sélectionnés, en tenant compte de la majorité de la longueur de la broche. Certaines littératures ont déclaré que la longueur totale de la broche sélectionnée représente environ 85% de la longueur de tous les axes principaux, en fait, il s'agit simplement d'une déclaration générale; Si vous en choisissez quelques-uns, vous devez voir la situation réelle.

(2) Composants principaux, solutions et étapes d'analyse;


Pour nos données, la sortie SPSS est la suivante:



Analyse le composant principal

] pourquoi SPSS Prenez deux composants principaux?

La variance cumulative dans les deux premières caractéristiques des composants représentait 81,142% de la variance totale, appelée taux de cotisation cumulée de 81,142%. La contribution des valeurs caractéristiques suivantes est de moins en moins.


En général, nous pouvons prendre le ratio de contribuer à environ 85% de la variance accumulée, car elles ont des représentants de l'information. Il existe deux façons de sélectionner le composant principal dans SPSS: a Basé sur des fonctionnalités ≥ 1; Un autre est la spécification directe de l'utilisateur des composants sélectionnés. La contribution de la valeur de fonctionnalité peut également être vue du classement de gravier appelé SPSS. Les points des premier et second composants principaux peuvent être dessinés à partir d'une figure 2D pour afficher visuellement comment ils expliquent les variables d'origine.

2, analysez le facteur.

(1) Modèle d'analyse de la théorie et des facteurs de base; L'analyse factorielle est l'analyse principale des composants et le développement. Pourquoi avez-vous une analyse factorielle? Si nous voulons connaître la relationUne variable et un coefficient public, doivent effectuer une analyse factorielle. Le modèle d'analyse d'élément est le suivant:


AIJ est appelé une charge de coefficient (en réalité du poids).


La signification statistique du facteur de charge: le coefficient de corrélation de la I-T e variable et du facteur joint J, ce qui signifie que le poker variable dépend de la quantité de FJ (taux), le centre est appeler le chargement.

2, Solutions pour télécharger facteur de téléchargement, analyse de coefficient;


La cause de la table de variance secondaire: quelle est la taille de l'extrait d'une explication générale de chaque variable?


Tournez l'élément: expliquer de meilleures explications pour les éléments généraux F, une bonne explication peut être prise par une méthode d'éléments tournants. La soi-disant explication des éléments publics consiste à rendre chaque variable qu'une charge importante sur un relatif et une charge sur l'adaptateur populaire restant est relativement faible. La méthode de chargement de ce coefficient de variable est appelée rotation de l'arbre de facteur. Il existe de nombreuses façons de faire pivoter la rotation et on utilise souvent la rotationtort.
Point de facteurs: En analyse, les personnes sont souvent prêtes à refléter les variables initiales des éléments publics, de sorte qu'elle profite aux caractéristiques de l'objet de recherche. Par conséquent, les facteurs communs sont souvent indiqués par la combinaison linéaire de variables (ou d'échantillons), à savoir:

est appelée fonction du score de facteur et peut calculer chaque échantillon. Points de marque. Toutefois, étant donné que le nombre d'éléments communs est inférieur au nombre de variables, il ne peut pas être dérivé du modèle d'analyse des facteurs, de sorte que le nombre de facteurs obtenus en estimant un point de facteur estimé.

SPSS peut directement diffuser des scores de facteurs différents, nous pouvons utiliser le rapport de contribution différentielle de chaque facteur pour effectuer une synthèse pondérée, calculer le score total de chaque élève et file d'attente.


3, certaines précautions pour les composants et éléments clés
peuvent être constatés que l'analyse des facteurs et des composants principaux dépendent de la variable d'origine et ne peut refléter queIl croit la variable d'origine. Par conséquent, le choix des variables brutes est très important.

En outre, si vous apprenez à propos de la variable d'origine, indépendamment de la taille peut échouer, car il est difficile de résumer de nombreuses variables indépendantes avec quelques variables intégrées. Les données sont plus pertinentes, l'effet est réduit le plus possible.


Lorsque les résultats d'analyse sont obtenus, il n'est pas nécessairement clair comme notre exemple. Ceci est lié à la nature du problème, les variables d'origine sont sélectionnées et la qualité des données.

Il est particulièrement prudent lors de la prise en compte avec des scores facteurs, en particulier pour des problèmes sensibles. En raison de la différence entre la variable initiale, la sélection des éléments est différente et le type peut être très différent.

3, Analyse du facteur principal de l'ingrédient et d'analyse

La différence de l'analyse principale de composants et de l'analyse de coefficient

Dans l'analyse facteur, les variables sont indiquées par des éléments. L'analyse linéaire combinaison et composante est laCombiner la linéarité des composants principaux dans chaque variable.
(2) L'ajout de l'analyse principale des composants est d'expliquer la variation totale d'une variable et l'analyse de coefficient est placée dans l'interprétation de la mauvaise direction entre chaque variable.

(3) Il n'est pas nécessaire d'avoir une hypothèse dans l'analyse principale des composants et d'analyser des facteurs nécessitant des hypothèses. Assumer l'analyse des facteurs comprend: des facteurs non liés entre chaque facteur commun, il n'existe aucune corrélation entre les facteurs spéciaux et entre les éléments communs et les facteurs spéciaux.

(4) Dans l'analyse principale des composants, lorsque la valeur de la matrice de correspondance la plus ferreuse ou de la matrice unique est unique, le composant principal est généralement unique; Les facteurs ne sont pas uniques, les facteurs ne font pas tourner.
(5) En analyse des facteurs, le nombre de facteurs nécessite des analystes (SPSS est automatiquement définie dans certaines conditions, à condition qu'il s'agisse d'un facteur entré dans la valeur de fonctionnalité plus grande 1) et du nombre de facteursDésigné est différent. Le résultat est différent. Dans l'analyse principale des composants, le nombre de composants est certainement, et il existe des composantes principales de certaines variables.

Par rapport à l'analyse principale des composants, l'analyse factorielle peut aider à expliquer l'élément, plus favorable à l'explication. En général, lorsque vous devez trouver un facteur potentiel, il a tendance à utiliser l'analyse des facteurs et à mieux expliquer avec la technologie de rotation. Et si vous souhaitez transformer existant en quelques nouvelles variables (de nouvelles variables ont des informations avec des variables racines) pour entrer l'analyse suivante, vous pouvez utiliser l'analyse principale des composants. Bien entendu, cette situation peut également être faite à l'aide des éléments. Par conséquent, cette distinction n'est pas absolue. Dans l'ensemble, l'analyse principale des composants est principalement utilisée comme technique d'exploration. Avant d'analyser l'analyse des données multivariées, l'analyse des données est analysée par les composants principaux, de sorte qu'ils ont des données communes. La compréhension est très importante.La principale composante de l'analyse est généralement rarement utilisé (je pense qu'il n'a pas nécessairement, peut être utilisé séparément): a Compréhension des données (données de dépistage), b, c, c, c et tabouret discrimination de traitement, comme beaucoup Variables, tellement, l'utilisation directe de l'analyse du jugement ne peut pas être résolue, cette fois, vous pouvez utiliser le composant principal pour envoyer une variable simplifiée. (Taille de la taille) D, analysez le composant principal peut vous aider à déterminer si la linéarité populaire (indice conditionnel et peut également être utilisé pour gérer la collimatre. Sur l'algorithme, l'analyse de la composante principale et de l'analyse est très similaire, cependant, les éléments croisés de la matrice de correspondance erratique sont utilisés dans l'analyse facteur n'est plus une variance de variables, qui correspondent aux variables. Point en commun (une partie de la variation variable est expliquée par chaque élément).

Sujets

Catégories