Skip to main content

Deuxième grappe, il peut être résolu parfaitement. Ses avantages sont au moins dans les aspects suivants:
peut être regroupé en fonction des variables de catalogue et des variables continues;
peut automatiquement déterminer le numéro de classification final;


peuvent être des ensembles de données traités;
Le deuxième cluster de cluster ou TwoSstep est souvent appelé grappe en deux étapes, car le nom appelé tout le processus de cluster est divisé en deux grandes zones avant et après.
La première étape a été prise à tous les enregistrements et les caractéristiques de classification CF construites. Enregistrez la similarité dans les mêmes boutons d'arbre et des couleurs similaires est un nouveau nœud. Dans la deuxième étape, sur la base de l'arborescence de classification, le bouton est classé par la méthode de fabrication d'un campus et chaque résultat du cluster est évalué par BIC ou AIC afin de déterminer le résultat final du cluster.
Comme d'autres méthodes statistiques, le deuxième groupe a également une condition applicable stricte, nécessitant des variables indépendantes dans les variables de modèle et de catégorie comme distribution polynomiale et variableLes douanes doivent être une distribution normale.
Regardez un cas.

Par exemple, SPSS Software est livré avec des données de voiture-vente.Sav. Les constructeurs automobiles doivent évaluer efficacement les conditions de marché actuelles, comprendre les demandes du marché, trouver un modèle populaire de compétitivité du marché.


Les cas appliqueront le type, le prix, le modèle de moteur, la puissance, la longueur d'empattement, la largeur, la longueur, la limite, le stockage de l'huile, l'huile totale d'un total de 10 variables 152 Un enregistrement efficace. (Cet exemple affiche principalement le deuxième processus de cluster, ne considère pas les tests d'indépendance)


1. Paramètres des seconde réglages de paramètre de cluster
] 1 Cliquez sur Analyser → Classification → Menu d'orientation du lundi Commande de la boîte de dialogue "Deuxième analyse de grappes" (ou la table principale), comme indiqué ci-dessous:



Déplacez la variable de type unique "Entrée" dans la zone de variable classée et transféré 9 variables continues telles que "prix", modèle moteur "," codeforce "," huile efficace "dans la boîte de transformation continue;

Sélectionnez" LOGARITHM "dans l'onglet Mesure de distance, comme mesure du même niveau de changement;


dans Le groupe "BIC" sélectionné dans l'onglet Tutoriel, jugement du numéro de cluster; autres options par défaut;



[Cliquez sur le bouton "Options" sur la carte principale, apparaît la seconde Boîte de dialogue Option de cluster, comme indiqué ci-dessous:



Ce cas n'est pas un bruit de traitement du son;


Le modèle d'allocation de mémoire maximale est construit Comme 64 Mo;



Concentrez sur la case "En attente" ", le logiciel combine automatiquement neuf variables de grappes continues dans la boîte, ce qui indique que le logiciel standardisera automatiquement ces variables, avec échelle uniforme;


3. Cliquez sur le bouton "Sortie" du panneau de configuration principal pour afficher la boîte de dialogue "Second Cluster Sortie", comme indiqué ci-dessous:


Crochet Select "Pivottable", Rue Cuune sortie principale dans le visualiseur de résultats (principalement forme de formulaire);


Vérifiez que le graphique et la table, le résultat de la sortie apparaît dans la visionneuse de modèle (niveaux élevés);



"Création d'une variable d'élément en cluster" ", il s'agit du résultat final de l'ensemble du cluster, nécessite un logiciel pour chaque ligne correspondant à la sortie;


Ce cas ne montre pas "Exporter XML Model" (facile à mettre à jour, très utile);



renvoie la table principale, cliquez sur "Bouton OK et le logiciel commence à effectuer le deuxième cluster.





































.


La colonne principale du second grappe est une table, la visualisation d'une rotation inférieure, le résultat principal est compris comme suit:

Cluster automatique BIC


L'un des résultats importants. Cette table est principalement utilisée pour comprendre comment le logiciel sera automatiquement évalué à la valeur BIC et la référence principale basée sur "valeur BIC", "au lieu de" changer de BIC ",". changement de vitesse bic, " "vitesse de mesure kPanique "Quatre indicateurs, SPSS logiciel intègre quatre critères, et finalement le meilleur numéro de cluster est automatiquement identifié.
Vous ne devez pas capturer complètement des niveaux spécifiques déterminés, accepter le cluster de quantité en raison du lancé intelligent SPSS. (Particulièrement adapté aux non -statistique majors)
Tableau de distribution du cluster

Donc, ce logiciel est finalement recueilli dans de nombreux types? Comme indiqué dans la table ci-dessus, le logiciel donne des résultats à trois couches et l'annonce de taille de chaque type. Ces trois Les types ne sont pas les plus appropriés et on peut voir spécifiquement s'il existe une signification pratique ou non. III. Expliquez le visualiseur de modèle . Cliquez sur la carte de résumé du modèle, ouvrez le navigateur de modèle, cette partie de cette section Les résultats sont très visibles et plus intuitifs. Le navigateur modèle est divisé en deux zones, le côté gauche est la vue principale. Le côté droit est un secondaire. vue. Les principaux résultats sont compris comme suit.: Résumé du modèle de vue principal Affiche les informations de base du modèle en fonction de 10 variables de cluster pour les seconds clusters et le nombre de clusters rempli est de 3 classes. En général, la qualité de la qualité des grappes est toujours acceptée et il peut toujours être accepté et il n'a pas encore atteint un bon niveau et il doit être testé et optimisé davantage. Taille de l'angle de visualisation se rassemble dans 3. L'échelle du premier cas représente 40,8% et le second type est de 25,7% et 33,6% de la classe 3 est de 33,6%, conformément aux résultats donné par la vue précédente. Décision générale: Trois cas de cas ne sont pas trop petits ou trop petits, et le courage est toujours disponible. Le régime d'observation auxiliaire prédit l'importance des variables "Type" Type ", limitée aux deuxième et troisième positions d'effets d'activité pétrolière dans la distinction entre les catégories différentes. Il peut également être compris comme des espèces, limitées, trois Variables de performance de l'huile jusqu'à trois extrémités. Vue principale Caractéristiques du cluster Le but ultime de l'analyse des grappes est d'avoir des poissonsClasse C et peut décrire clairement les caractéristiques de la classe, la table fournira des variables de variables de classes et de clusters. Chaque classe ou distribution dans différents indicateurs aide le résumé exact des caractéristiques. En cliquant sur l'une des cellules, telle que le type "Effet d'huile" Type ", le logiciel secondaire exportera une vue secondaire, comme suit: Comprend deux graphiques sur, la meilleure deuxième consommation de carburant de deuxième année. est un véritable modèle dans 3 véhicules. Comparaison des grappes Appuyez sur Ctrl dans la vue principale du côté gauche de la soumission parcourant le modèle et sélectionnez deux classes et plusieurs classes et couches ou plusieurs couches apparaissent dans la vue auxiliaire droite. Le contraste du personnage. Obtenez la première catégorie et 3 exemples, deux types de choses différentes différences de prix, des troisièmes types et des prix de la première classe inférieure; longueur de la voiture, la troisième classe est De plus, en outre, peut également voir le troisième modèle beaucoup plus élevé que le nom du premier élément à l'horizon, la largeur, la puissance, le stockage de l'huile,V.v. Après le regroupement, nous devons comprendre la classe correspondant à chaque enregistrement, les variables de la classe de la classe (le résultat de la classe de collecte finale) Il est très important de faciliter Comparaison profonde et analyse future. Le logiciel l'a automatiquement enregistré dans la colonne finale du mode View de données, la nouvelle variable de génération "TSC_N", dans laquelle TSC représente le second cluster, NÓ est l'un des moyens d'entier positif. L'ordre de fonctionnement interne est effectué dans ce processus. Des informations complètes, trois types de modèles peuvent être décrits comme suit: Type 1: bon marché, volume, la limite et la puissance, est un modèle de bas niveau; Grade 2: moyen, volume, poids limité et puissance améliorée de manière significative, faible consommation de carburant, dans des modèles réels; Type 3: prix élevé, volume, poids limité et petite couche petite, mais la puissance est la plus haute cendreNG 3 voitures, et c'est un modèle haut de gamme; Dans trois algorithmes de clustering fournis par SPSS Software, le second grappe est le plus spécial, c'est parce qu'il peut gérer les listes et les variables continues les mêmes en même temps, il y a un peu extrêmement important. et deuxième groupe capable de déterminer automatiquement le nombre de classes finales, calculant la possibilité d'explorer automatiquement les domaines inconnus, il s'agit du cluster décentralisé SPSS par rapport au pot de grappes central. Peut automatiquement s'occuper, permettant aux variables de taper, ainsi que les avantages du traitement de données volumineux, de secondes clusters, peuvent être utilisés dans différentes industries, il est conseillé.

Sujets

Catégories