Skip to main content

1. Décrire la méthode statistique


Les statistiques descriptives sont de déterminer si des données sont conformes aux capacités de distribution normales avec le numéro de description ou le graphique ou non. Les méthodes populaires sont des images q-q, p-p, graphique, graphique STEM.

1. Q-Q

Ce QQ-Q n'est pas utilisé pour discuter QQ, q signifie que le score quantitatif, c'est-à-dire. Le nombre de points est d'organiser des données de petites à grandes, puis de couper en 100 copies pour afficher les valeurs dans différentes positions. Par exemple, la médiane est la valeur de la position intermédiaire.

x Axe de l'image Q-Q est le numéro Pizok, l'axe Y est la valeur d'échantillon correspondant au score. X-Y sous la forme d'une cellule dispersée et une ligne droite peut être appliquée par une parcelle dispersée.


La relation entre cette ligne et cette distribution normale est équipée? Pourquoi peut-on déterminer si les données sont conformes à une distribution normale basée sur cette ligne.


Pensez d'abord aux caractéristiques de laCoordination normale, la distribution normale de l'axe X est la valeur de l'échantillon, de gauche à droite x, l'axe Y correspond à chaque valeur d'échantillon. La probabilité apparaît. La valeur de probabilité diminue avant d'augmenter et de plus haute en position médiane.


Les axes de Y dans les cartes QQ peuvent être compris dans une distribution normale et si la ligne droite tirée est de 45 degrés, il peut s'assurer que la distribution du nombre de la face moyenne est la même. C'est-à-dire que la médiane ou la symétrie basée sur la distribution normale.


Le code suivant peut être utilisé en Python pour mapper QQ Carte:



Semblable aux diagrammes QQ sont des cartes PP, les deux différences sont l'ancien axe est une valeur d'échantillon correspondant. à une posture spécifique et plus tard une probabilité cumulative.

2. TÉMENTATION



Le graphique est divisé en deux, l'un est un organigramme de la fréquence, une espèce est la carte de distribution de fréquence. La fréquence est le nombre de valeurs et de fréquences d'échantillon correspond au rapport du nombre de fois la valeur et du nombre total de valeurs d'échantillon. [douzième3]

Dans Python, nous pouvons utiliser le code suivant pour dessiner un tableau de distribution régulier:








peut utiliser le code suivant pour dessiner la division FréquenceLeo Mountain:



similaire au graphique encore disponible Thi tige , le même corps est sous la forme de forme, il indique que la fréquence apparaît dans chaque valeur.





Après avoir décrit la méthode statistique, voir la méthode de test statistique. Les statistiques ont principalement des tests SW, des contrôles KS, des tests de publicité,W. Test

Test SW est un biais, W est le niveau le plus élevé.

1. Cochez la case KS

Cochez la page KS sur la base de la fonction de distribution de l'échantillon cumulatif pour déterminer. Il peut être utilisé pour déterminer si un jeu d'échantillon convient à une distribution connue ou qu'il peut être utilisé pour vérifier des différences significatives entre les deux échantillons.
Si elle détermine un échantillonU convient à la distribution connue, telle que la distribution normale, vous devez calculer la fonction de distribution cumulative de la distribution standard normale, puis calculer les fonctions de distribution accumulées de l'ensemble de l'échantillon. Il existe de nombreuses différences entre les deux fonctions entre différentes valeurs. Il suffit de trouver le plus grand point D. D. D. Différentes valeurs de limites (similaires à la valeur limite du test T) sont trouvées ultérieurement trouvées sur la base du nombre d'échantillons et du niveau d'importance de l'ensemble de l'échantillon. Identifier la relation entre les valeurs marginales et D, si D est inférieur à la valeur marginale, on peut considérer que la distribution de la réponse de la distribution est connue, sinon elle ne le fera pas.


PDF (fonction de densité de probabilité): fonction de densité de probabilité.

Fonction de distribution cumulative: La fonction de distribution accumulée fait partie intégrante de la fonction de densité de probabilité.



Il existe un emballage prêt dans Python à utiliser directement dans le test KS:















  • ] x indique l'échantillon défini tL'expérience et les CDF sont utilisés pour indiquer un type de distribution connu à évaluer, avec: "NORM", "Expon", "Logistique", "GUME_L", "GUME_L", Gumbel_R ", GumBel_R", des valeurs "extreme1" peuvent être sélectionnées. et la norme montre un test de distribution normal. KsTest renvoie deux valeurs: D et la valeur P_Value correspondante. 2. Examen de la publicité Tester des annonces basées sur les tests KS et KS ne considère que la différence entre les deux distributions. Ce point, mais il est facile de recevoir des photos appréciées par anomalie. Le test de la publicité prendra en compte la différence à chaque point de la distribution. Le code suivant peut être utilisé dans Python: . X Pour l'échantillon testé, DIST utilisée pour indiquer le type de distribution connu. Options de valeur correspond à la valeur optionnelle dans le test KS. Le code ci-dessus renvoie trois résultats: Tout d'abord est la valeur statistique, tLa seconde est la valeur de jugement, le troisième est un niveau important correspondant à chaque valeur d'évaluation, quelle est la relation entre le test publicitaire et Anderson? Anderson a inventé le test de publicité. 3. E TEST W Test (Shapiro-Wilk se situe) sur la base de deux distributions et il sera fait semblable à la valeur du coefficient de corrélation Pearson. Plus la valeur est importante, les distributions plus pertinentes sont décrites, plus elle répond à la distribution. Le code déployé dans Python est le suivant: Le code ci-dessus renvoie deux résultats: la valeur correspondante W et P_Value. Shapiro est utilisé spécifiquement pour une inspection normale. Il n'est donc pas nécessaire de spécifier des types de distribution. Et Shapiro ne correspond pas à des tests normaux des échantillons> 5000. III. Traitements de données inhabituelles Les données générales ne sont pas normales, si l'état n'est pas sérieusement converti au fruitl'école.Si c'est très grave, les données peuvent être enregistrées.La méthode de conversion a également été prononcée dans un article extrême.

    Catégories