Skip to main content

Cet article est "Statistiques nues" après la lecture, combinant certaines connaissances de l'analyse Internet, a constaté que de nombreux concepts cachés et très intéressants. Recommander la lecture.

1. Pourquoi voulez-vous en savoir plus sur les statistiques

pour le public, les statistiques devraient devenir une conscience commune pour chaque personne, d'éviter les faux pièges numériques de plus en plus délicats. Attitude Lorsque vous voyez une variété de ratios et de prix, vous pouvez penser davantage sur leur chemin source et de calcul.


Pour les travailleurs sur Internet, des connaissances statistiques indiquées sur Internet, une méthode liée à la méthode. Exemple: Le test A / B est actuellement populaire est essentiel pour contrôler les méthodes variables. Différentes données de collecte Internet sont plus simples et plus pratiques pour comparer les tests. Ce sera un grand événement en analyse / données statistiques. Imaginez des milliers de ports A / B sur Facebook, appelé simplementUne expérience sociale à grande échelle sans précédent.

C'est pourquoi la croissance des hackers, le scientifique des données brûle de plus en plus ces dernières années. Extrêmement facile d'obtenir la quantité de données, calculez le coût du stockage et de l'efficacité de l'analyse, l'analyse statistique des coûts plus faibles, une valeur à grande échelle et une valeur de sortie.


Différences statistiques et analytiques
L'analyse personnelle et statistique doit être des parties différentes de l'ensemble du processus de données. Les statistiques sont des outils ou des véhicules, analysant des idées plus importantes. Par exemple, l'analyse de régression est appelée analyse, car elle contenait une partie de la pensée de la pensée. Une châtaigne à nouveau, a décidé de prendre le nombre moyen ou la quantité moyenne de données, qui est des statistiques, comment utiliser c'est une analyse.

En tant que "statistiques nues", une analyse statistique est la suivante:

Résumé des grandes quantités de données

Faire des décisions précises

pour répondre aux questions des ménagesI IMPORTANT

Je connais et améliore notre modèle de comportement quotidien


PIT 1: Toute statistique des favoris


Sélectionnez l'indicateur statistique approprié, déterminez le contenu de l'ensemble de données. Il doit également empêcher certains avantages et inconvénients de ces indicateurs de tromper l'opinion publique, affectant votre décision.
1, Moyen, moyen, quadrant
Le nombre moyen est très sensible à une valeur extrême et moyenne n'est pas. Donc, les camarades de classe de Beijing estiment souvent que leurs revenus salariaux ralentissent la jambe arrière ... mais si vous regardez la position moyenne et le quadrant, cela peut varier beaucoup.
2, valeur absolue, valeur de valeur
Nombre d'enregistrement est une valeur absolue et un taux d'inscription est une valeur de taux. Lorsque la valeur est anormale, faites attention aux molécules et aux dénominateurs. Par exemple, une journée a découvert que le site Web hebdomadaire UV a augmenté de 500% sur la même période et pourrait qBas dans la semaine précédente. Si vous montez, vous serez décomposé de taille, il est facile de courir.
3, pourcentage, pourcentage, pourcentage
est une forme commune d'expression de données, avec plus d'argent. Ces chiffres doivent souvent faire attention à la différence entre les modèles et les molécules. Voici deux exemples communs: 1, une première réduction, il est d'une augmentation de 15% et 15% de prix? 2. Pour le pourcentage et le pourcentage, les taux d'imposition augmentent de 3% à 5% et peuvent dire qu'elle a augmenté de 2 points de pourcentage, ou il peut également dire qu'il a augmenté de 67%, amener les gens à se sentir différents.
4, Données d'index
est calculée dans de nombreuses données différentes, l'avantage est que toutes les informations sont axées sur certaines, faciles à comprendre, mais ignorant facilement la dynamique de coopération des données des composants. Mission Mission à emporter a un indicateur très complexe de l'expérience utilisateur urbaine, un exemple typique. Grâce à l'intégration de nombreuses données, nous allons faire l'expérienceC'est plus imaginaire pour en faire l'expérience plus. Cependant, il est important de noter qu'il est plus facile d'écouter sa dépendance excessive.

PIT 2: Les statistiques ne sont pas assez claires

d'abord comprises: précis et précis est essentiel. Si vous avez un urgent, je vous dis que des toilettes publiques sont de 134,12 m de droite, c'est très précis. Cependant, en fait, les toilettes sont à gauche. La nature exacte est de permettre à l'indicateur de fermer la description.


Cela nécessite l'uniformité de la mesure de tout. S'il y a un débat en 20011: l'industrie manufacturière américaine a diminué? À partir de la production globale, elle a augmenté depuis 2000 et le nombre de production d'emploi a diminué. Par conséquent, un indicateur unifié est nécessaire pour exprimer la prospérité de l'industrie manufacturière.

Comme le commerce électronique, il est nécessaire de clarifier les seuls indicateurs de base que vous êtes actuellement intéressé, tels que des nombresQuantité de commandes, transactions, V.V. Une attention différente conduira à différentes stratégies d'entreprise.


Après avoir déterminé l'indicateur, il est nécessaire d'identifier le corps principal. En outre, le gouvernement dit que nous avons 60% cette année, le prix moyen est inférieur à celui de l'année dernière! Vous avez de l'espoir! Mais en fait, 40% des maisons ont soulevé des prix, et ils se concentrent sur la ville de base. P qui ne peut toujours pas acheter la maison ..
Notez l'ère Contexte: "Les statistiques nues ont un exemple très intéressant: comment évaluer le meilleur film meilleur dans le box-office de l'histoire . Hollywood en 2011, le Top 5 de la Boîte est: Avatar, Titanic, Prequart Deux, Star Wars Quatre et Monstres, Sleck, mais dans la phase historique, l'inflation est différente. Après avoir examiné les facteurs d'inflation, cette liste devrait être mise à jour pour : Chaos, Star Wars Four, Musique, Alien et dix

L'utilisation des mesures statistiques peut affecter les emplois à l'explication de chacun: dans des périodes favorables,Unité de confusion, V.V.


Pit Troisième: Les indicateurs de statistiques sont également qualifiés
dans la sélection de modèles et d'analyse statistique, il y aura un autre type de préjugé, entraînera une perte de résultats,des milliers de kilomètres.
Prejudice sélectif: Choisissez des échantillons, une analyse de conclusion est naturellement fausse. Si la troisième vallée de Silicon, Richard a publié une version bêta de ses amis développeurs, mais qu'il est trop difficile d'avoir des problèmes, les utilisateurs habituels sont essentiellement utilisés, l'utilisateur s'est enfin enregistré. Il existe enfin un million d'utilisateurs géants, mais de manière proactive très différente. De même, dans l'analyse des utilisateurs de commerce électronique, le niveau de consommation et des habitudes des villes des première et deuxième niveaux et de trois visites différentes sont certainement différents. Choisir une seule personne aura une perte.

Publications préjudies: la recherche académique ou la nouvelle est plus agréable à publier une conclusion positive sans refuser. MècheUn jeu ne provoque pas la recherche sur le cancer, il est préférable de prouver que lorsque le PM mènera à de courtes expériences sur la vie plus intéressée.

Préjugés de mémoire: tout le monde modifiera sa mémoire en raison des résultats, tels que de nombreuses personnes qui réussissent à la réussite du fait de faire un facteur après l'échec et de l'agrandir ses principales raisons. Mais en fait, cela peut ne pas être le cas.

Préjugé de survivant: en sélectionnant les échantillons pour contrôler les données. En bref. Des utilisateurs réussis réussis, leur taux de réussite est de 100%. Dans l'analyse quotidienne, il est nécessaire d'avoir le temps d'être vigilant avec cette version de variante biaisée.

PIT 4: Expériences statistiques soigneusement sélectionnées

Lors de l'étude de la pertinence des choses, des tests de test sont une approche plus scientifique. Dans la vraie vie, certaines variables sont difficiles à contrôler. À ce stade, il est nécessaire de se rapprocher de cet effet avec différentes expériences statistiques.


Expérience de contrôle aléatoireTerrasse: groupe d'extraction aléatoire, groupes expérimentaux alloués au hasard et groupes de contrôle. C'est le test A / B le plus idéal, le noyau de la stratégie de la division.

Test naturel: Utilisez des données existantes pour créer une expérience approximative aléatoire, s'il est dans l'opération de l'O2O de la ville, il est difficile de contrôler la ville pendant une longue période. La promotion des exigences de test est plus efficace. La méthode appropriée consiste à comparer les villes créatives dans les données existantes.

Différence de test dans la classification différentielle: utilisation du temps et de l'espace comparables aux variables de contrôle, tels que les États-Unis ont étudié les effets de l'âge de l'éducation pour la vie et l'analyse Changement de Tennessee avant et après la réforme de l'éducation et comparer les pays adjacents.

Analyse des tests d'analyse: sélectionnez les mêmes conditions d'échantillonnage simultanément, une analyse comparative. Si vous choisissez une série de mineurs similaires à un groupe criminel, un groupe de besoins envoyés à des prisons etD'autres groupes ne sont qu'aux catastrophes, en analysant deux groupes de personnes analyses, l'impact des criminels juvéniles après cela.

Dans les "statistiques nues", il existe également une probabilité, une analyse de valeur attendue et une analyse de régression, des limites à la limite spatiale et ne sera pas décrite ici. Les étudiants sont intéressés, vous devriez lire ce livre en détail. Les personnes âgées ont "des statistiques va mentir. "J'espère que cette action peut vous donner un peu d'avantage.


Sujets