Comment remplir des valeurs manquantes? Un moyen simple de voir SPSS

devrait résoudre la technologie du manque de valeur.

Dans SPSS, deux menus peuvent finir de remplir. L'un est "Remplacement d'erreur" dans le menu "Conversion" et l'autre est "Analyse analyse" dans le menu "Analyse".

Le précédent est simple et facile, puis caractérisé par une plus grande complexité. Dans la plupart des cas, je pense que je peux utiliser «défaut alternatif» pour répondre aux besoins. Par conséquent, j'introduit principalement la méthode "de remplacement de lacun" dans "SPSS d'entrée à l'entrée à la pratique" des cours de vidéo et cet article.

11 ans de données économiques, dans lesquelles les données de valeur de la troisième industrie sont manquantes, la "racine" doit être donnée à Comparez le cas de la "troisième valeur de l'industrie" de 1162,8.

Remplacement de la valeur forfaite II.SPSS

Menu: "Convertir" → "Remplacer", boîte de dialogue comme suit:
[

SPSS fournit cinq méthodes manquantes manquantes dansC'est:

1. Valeur moyenne de la chaîne

Remplissez la valeur manquante en utilisant la moyenne de la chaîne entière.

2. Moyenne des points adjacents

La valeur moyenne de la valeur de l'efficacité environnante est pleine de valeurs. La gamme de points adjacents est utilisée pour calculer la valeur valide à la moyenne.

3. Valeur moyenne

de points adjacents contenant la valeur manquante en utilisant la valeur moyenne de la valeur autour de l'efficacité. À propos des points adjacents sont utilisés pour calculer la valeur valide pour calculer la valeur moyenne de haut en bas.

4. Interpolation linéaire

Utilisez la permission d'interpolation linéaire pour remplacer la valeur manquante. La valeur finale valide avant la valeur manquante et la première valeur valide est utilisée pour être utilisée comme interpolation. Si le premier ou le dernier cas de la chaîne a une valeur manquante, il n'est pas nécessaire de le remplacer, le même principe de calculComme la moyenne des points proches.

5. La tendance linéaire de ce point

utilise cette tendance linéaire pour remplir la valeur manquante. Raffinant la séquence existante sur l'échelle de la variable d'indexation de 1 à N, avec une valeur anticipée pour remplir les valeurs manquantes. Il suffit de comprendre le système déterminera la valeur de remplacement pour la méthode appropriée linéaire. D'autres variables sont utilisées comme arguments, tournant la chaîne de suppression servant de variable, puis de modélisation prédictive.

Cinq ci-dessus, vous savez que vous ne serez pas empêtré sur le principe de calcul (sans chargement, sélectionner SPSS). En particulier, les plus couramment utilisés sont les deux premières méthodes moyennes, faciles à comprendre.

Mardi. Par exemple

j'ignore la première méthode, la description du texte sera expliquée. "La troisième valeur de l'industrie", à l'exception de 10 numéros externes manques en 2013, la valeur moyenne est de 750,06, qui est la "chaîne moyenne", utilisez donc 750,06 de la valeur totale, que ce soitManquant en 2013.
Transférer la deuxième méthode: Moyenne des points adjacents

Nos données sont des données de série chronologique, observées beaucoup, la "Troisième valeur de l'industrie" augmente chaque année Ainsi, utilisez la moyenne de la séquence entière pour calculer le manque de valeur, il retiendra la situation réelle, évidemment bonne. Travailler dur, en utilisant des données pendant près de 1 an ou près de 2 ans, la moyenne sera plus efficace et proche de la valeur réelle.

Inside "La troisième valeur de l'industrie" dans la case "Nouvelle variable", SPSS créera automatiquement une nouvelle variable à remplir. La valeur de séquence n'est pas directement mentionnée sur la variable racine (pour empêcher le regret). Choisissez la deuxième méthode: moyenne des points voisins.

Indiquez automatiquement le nom de la nouvelle variable: la troisième valeur de l'industrie _1 et distingue la ligne suivante avec des numéros numériques. Ce numéro 1 peut être interprété comme le premier remplissage. Après cela, vous devez vous rappeler que vousVoulez-vous cliquer sur le bouton "Modifier le montant" à droite pour exécuter les paramètres actuels.

Span, le logiciel par défaut 2, Signification 2 Données avant et après la valeur manquante, les deux premières copies de quatre chiffres, cet exemple est 886,5, 1023,4, 1283,3, 1427.5, ils sont moyens quatre données. est 1155.175.

en regardant les résultats. Les résultats offrent le niveau moyen des points adjacents SPSS pour 1155,18, de manière cohérente. Est-ce très bon de comprendre?

Après cela, la tendance linéaire de ce point a été définie comme suit:

Retournons, c'est Un peu de problèmes, je recommande le principe de l'enchevêtrement, de toute façon, le modèle arrière est ensuite prévu, le logiciel de commande Bold donne des résultats.

Nous avons utilisé les deuxième, seconde et 5 méthodes d'abord, puis, évidemment que 1155.18 obtenus à partir de la deuxième méthode est le prix le plus proche de 1162,8, c'est pourquoi la moyenne des pointsPresque cette méthode est plus courante. Sur le visage, il est facile de comprendre que le deuxième aspect ne sera pas trop mauvais.

Sujets

Court

Catégories

Analyse des données