Cet article est "Statistiques nues" après la lecture, combinant certaines connaissances de l'analyse Internet, a constaté que de nombreux concepts cachés et très intéressants. Recommander la lecture.
Pourquoi voulez-vous en savoir plus sur les statistiques
pour la cocon, les statistiques doivent être un bon sens du sens de chaque personne. Évitez la tromperie de piège plus subtile. Attitude Lorsque vous voyez une variété de ratios et de prix, vous pouvez penser davantage sur leur chemin source et de calcul.
Pour les travailleurs sur Internet, les statistiques de prédire sont sur Internet, ce qui est une méthode liée à la méthode. Exemple: Le test A / B est actuellement populaire est essentiel pour contrôler les méthodes variables. Différentes données de collecte Internet sont plus simples et plus pratiques pour comparer les tests. Ce sera un grand événement en analyse / données statistiques. Imaginez des milliers de ports A / B sur Facebook, appelés une expérience commune simplementAssociation à grande échelle sans précédent.
C'est pourquoi la croissance des hackers, le scientifique des données augmente ces dernières années. Extrêmement facile d'obtenir la quantité de données, calculez le coût du stockage et de l'efficacité de l'analyse, l'analyse statistique des coûts plus faibles, une valeur à grande échelle et une valeur de sortie.
La différence de statistiques et d'analyse
La compréhension personnelle, l'analyse statistique doit être des parties différentes de toute la ligne féroce, que ce soit. Les statistiques sont des outils ou des véhicules, analysant des idées plus importantes. Par exemple, l'analyse de régression est appelée analyse, car elle contenait une partie de la pensée de la pensée. Une châtaigne à nouveau, a décidé de prendre le nombre moyen ou la quantité moyenne de données, qui est des statistiques, comment utiliser c'est une analyse. En tant que "statistiques nues", une analyse statistique est la suivante:
Résumé de grandes quantités de données
Prise de décision précise
pour répondre aux questions de la sociétéNGJe comprends et améliore notre modèle de comportement quotidien
PIT 1: Les indicateurs statistiques ont un inconvénient favorable
Comment sélectionner l'indicateur statistique approprié pour corriger le contenu du contenu. du jeu de données. Il doit également empêcher certains avantages et inconvénients de ces indicateurs de tromper l'opinion publique, affectant votre décision.
1. Moyenne, moyenne, quatrième pénalité
Le nombre moyen est très sensible à la valeur extrême et moyenne n'est pas. Donc, les camarades de classe de Beijing ressentent souvent les sanctions elles-mêmes dans les pattes arrière du collectif ... mais si vous regardez au milieu et au quadrant, ce sera très différent.
2. Valeur absolue, valeur
Le nombre d'enregistrement est une valeur absolue et le taux d'inscription est une valeur de taux. Lorsque la valeur est anormale, faites attention aux molécules et aux dénominateurs. Par exemple, une journée a découvert que le site Web hebdomadaire UV a augmenté de 500% par rapport à la même période et pouvaitTrop bas la semaine dernière. Si vous montez, vous serez décomposé de taille, il est facile de courir.
3. Pourcentage, pourcentage, pourcentage
Le pourcentage est une forme commune d'expressions de données, qui sont plus de graisse. Ces chiffres doivent souvent faire attention à la différence entre les modèles et les molécules. Voici deux exemples communs: 1, une première réduction, il est d'une augmentation de 15% et 15% de prix? 2. Pour le pourcentage et le pourcentage, les taux d'imposition augmentent de 3% à 5% et peuvent dire qu'elle a augmenté de 2 points de pourcentage, ou il peut également dire qu'il a augmenté de 67%, amener les gens à se sentir différents.
4. Données d'index
L'indice est calculé dans de nombreuses données différentes. Toutes les informations sont concentrées sur certaines, faciles à comprendre, mais faciles à supprimer à travers l'impact des données des composants. Mission Mission à emporter a un indicateur très complexe de l'expérience utilisateur urbaine, un exemple typique. À travers l'intégration de nombreuses donnéesNous allons faire l'expérience de cela plus imaginaire pour en faire l'expérience. Cependant, il est important de noter qu'il est plus facile d'écouter sa dépendance excessive.
PIT 2: Les statistiques ne sont pas assez claires
Tout d'abord, vous devriez comprendre: précis et précis est essentiel. Si vous avez un urgent, je vous dis que des toilettes publiques sont de 134,12 m de droite, c'est très précis. Cependant, en fait, les toilettes sont à gauche. La nature exacte est de permettre à l'indicateur de fermer la description.
Cela nécessite l'unification des données pour tout mesurer. S'il y a un débat en 20011: l'industrie manufacturière américaine a diminué? À partir de la production globale, elle a augmenté depuis 2000 et le nombre de production d'emploi a diminué. Par conséquent, un indicateur unifié est nécessaire pour exprimer la prospérité de l'industrie manufacturière.
Comme le commerce électronique, il faut clarifier les seuls indicateurs de base que vous avez actuellementsont intéressés, tels que le nombre de commandes, transactions, v.v. Une attention différente conduira à différentes stratégies d'entreprise.
Après la troisième fois détermine l'indicateur, il est nécessaire d'identifier le corps principal. En outre, le gouvernement dit que nous avons 60% cette année, le prix moyen est inférieur à celui de l'année dernière! Vous avez de l'espoir! Mais en fait, 40% des maisons ont augmenté et se concentraient dans la ville centrale. Le lecteur de mots est toujours incapable d'acheter une maison.
Notez l'arrière-plan de l'ère: «Statistiques nues», un exemple très intéressant: Comment évaluer le film le plus élevé dans les billets de la pièce dans l'histoire. Hollywood est comme 2011, le Top 5 de la boîte est: Avatar, Titanic, Batman, Hai, Star Wars Quatre et Monstres Zaleke II. Cependant, dans la période historique, l'inflation est différente. Après avoir examiné l'inflation, cette liste devrait être mise à jour: de nombreux types d'art, guerre entre étoiles, musique, extraterrestres et dix commandements.
Utilisez les statistiques pour affecter le faitL'explication de chacun: bloquer le temps favorable, l'unité de confusion, V.V.
Pit Troisième: Les indicateurs de statistiques sont également biaisés
lors de la sélection des modèles et de l'analyse statistique, il y aura une variété de préjugés, menant à mille miles de distance.
Préjugé sélectif: sélectionné L'erreur sélectionnée et a conclu que l'analyse était naturellement fausse. Par exemple, à la troisième saison de Silicon Valley, Richard a publié la version bêta des développeurs et des amis, louange. Mais comme il est trop difficile de rencontrer des difficultés, les utilisateurs normaux ne peuvent pas l'utiliser, et enfin que les utilisateurs enregistrés ont des millions de géants, mais les utilisateurs positifs sont très peu. De même, lors de l'analyse des utilisateurs de commerce électronique, le niveau de consommation et des habitudes des villes de première classe et secondaire et deuxième mercredi mercredi mercredi mercredi mercredi mercredi mercredi mercredi mercredi qurès-quatrième ville aura certainement une différence.
préjudicePublié: La recherche académique ou les nouvelles sont plus agréables à exprimer une conclusion positive. Un jeu ne provoque pas la recherche sur le cancer, il est certainement préférable de prouver que le PM mènera à une vie plus courte.
Préjugé de mémoire: tout le monde modifiera sa mémoire en raison du résultat, si de nombreuses personnes qui réussissent vont blâmer un certain facteur après l'échec et donner leur raison principale. Mais en fait, ce n'est peut-être pas le cas.Bisai de survivant: Les données sont contrôlées en sélectionnant le modèle. En bref, le nombre de ses taux d'enregistrement réussis est de 100% pour les personnes qui réussissent. Dans l'analyse quotidienne, il est nécessaire d'être une version d'avertissement de cette variante de biais.
PIT 4: Des expériences statistiques inutilisées
Lors de l'étude de la pertinence des choses, des expériences de test et de contrôle sont une approche plus scientifique. Dans la vraie vie, certaines variables sont difficiles à contrôler et il existe de nombreuses expériences statistiques à environ hEffets cela.Expériences de contrôle aléatoires: extraction randomisée, expérimentants et groupes de contrôle alloués au hasard. Il s'agit d'un test A / B idéal, le noyau est dans la stratégie de Vietis.
Expériences naturelles: Utilisation d'une expérience aléatoire similaire, telle que dans le fonctionnement de la ville d'O2O, il est difficile de contrôler la ville pendant longtemps pour mettre en œuvre les tests de demande de comparaison plus efficacement. Les méthodes appropriées sont une analyse comparative des villes avec différentes activités dans les données existantes.
Différence de différence de test: utilisation du temps et de l'espace pour contrôler les variables, telles que les États-Unis ont étudié les effets de l'ère de l'éducation sur la vie et l'analyse de temps la réforme de l'éducation de Tennessee avant et après les changements et les situations comparatives et adjacentes statut.
Distribution des tests d'analyse: Sélectionnez les mêmes conditions d'échantillon avec d'autres échantillons nHau, analyse comparative.Si vous choisissez une série de mineurs similaires à un groupe criminel, un groupe de besoins est envoyé à des prisons et à d'autres groupes uniquement pour le service de catastrophe, par l'analyse de deux groupes d'analyses de personnes, l'impact du ratio pénal juvénile, après cela.
Dans "Statistiques nues", il existe également une probabilité, une analyse de valeur attendue et une analyse de régression, limite à la limite d'espace, non décrite ici.Les étudiants intéressés recommandent de lire ce livre en détail.Les personnes âgées ont "des statistiques vont mentir".J'espère que cette action peut vous donner un peu d'avantages.