Récemment, j'ai pris des livres liés à certaines données. En tant qu'étudiant mathématique, malgré des diplômés pendant de nombreuses années, la connaissance théorique de base de la fondation est essentiellement complétée, mais je suis toujours très bon pour les données. Intéressé, je veux partager certaines de mes opinions ici.
Une entreprise a déclaré que 3003 personnes ont gardé le stock de la société avec une moyenne de 660 actions par personne. [Au premier abord et à l'excellence.
Ne vous inquiétez pas, il y a une autre information derrière cette excellente données. Aucune publication: "La Société a accumulé 2 millions d'actions, des actions de trois principaux actionnaires représentant 3/4, et le reste de 3 000 personnes détient 1/4 des actions
, avant que le drainage populaire précédent ait un salaire mensuel sur la moyenne par habitant de 71 800, est-il trop douté?
Tout d'abord, ces données sont exactement surprenantes; deux, le nombre de notes indiscutables est de jouer de la fraude; la situation est promueO Fox, réputée est également une grande réduction - ce thème est aussi bon que les premiers médias écoutant, c'est vraiment triste.
Mais en fait, les gens sont facilement obsédés par des données.
Les capacités des élèves ne sont pas bonnes, mais les résultats des tests et la certification des qualifications peuvent être des preuves, de sorte que les parents se précipitent pour aider leurs enfants à signaler des cours; Comprendre un étranger est difficile, mais le cercle Facebook fournit une chaîne afin que nous continuions tous à façonner un endroit idéal en ligne.
Voir, nous avons été dans l'explosion des grandes données.Mes amis du collège ont fondamentalement participé à une grande profession de calcul de données, généralement, nous discutons ou plus ou moins soupirera l'épée à double lame de nous.
À l'ère des données complètes et des algorithmes, est-ce pour moi ou suis-je une donnée? Est la donnée avec nous? Cette proposition est trop grande, je ne peux que surveiller les vagues.
Aujourd'hui concerne principalement des discussions strictement. TDes années ronges, vous avez été rattrapé dans des pièges à des données et des actions que nous pouvons faire.
D'abord, les données seront-elles situées?
Les grandes données sont un bon outil, en particulier maintenant, il a été élargi, nous apportant beaucoup de commodité; Vous avez vu quelque chose, ce qui est intéressé, l'algorithme recommandé peut toujours correspondre à votre saveur exacte (ou à dire que les données importantes identifient votre goût). Bien sûr, de nombreuses personnes chantent dans des données: "Les données sont uniquement confirmées sont claires." Beaucoup de gens ont rejeté.
Cependant, certains cas où j'ai vu récemment plusieurs fois, je n'étais pas ridicule: les données ont de nouveau prouvé beaucoup de vérité que nous voulions spéculer et correctement. [12. Mais en fait, il y a un économiste par analyse de données, finissant les films le matinm le lendemain, le taux de crimes a continué de refuser; D'autre part, des films violents permettent à la violence potentielle de quitter la rue et, d'autre part, car le théâtre ne fournit presque pas de boissons alcoolisées, des crimes liés à l'alcool.Les données importantes fournissent aux personnes de nouvelles dimensions, couvrant la couverture, plus pratique, ce qui rend notre conscience du monde.
Exactement à cause de cela, j'ai trouvé des rapports d'enquête que c'est de l'autre côté du couteau à double tranchant et a finalement un véritable visage.
1. Corrélations au lieu de Hypanneror
Les grandes données montrent combien de cygnes blanches ont enlevé une certaine période de temps, selon le cygne ci-dessous, il est blanc .
C'est évidemment trop, mais osez-vous prendre votre poitrine pour vous assurer de ne pas perdre ce cercle?Parfois Parfois, si nous ne pouvons pas prouver ce que vous voulez prouver, certaines choses seront affichées et elles sont faussesfaire semblant; Après tout, les statistiques font maintenant les yeux de chacun, à peine personne ne le sera aura connaissance. Quelle est la différence dedire?
J'ai dit que je dois me réfléchir à ce sujet, non? Ouvrez cette couche embarrassante, franchement, de nombreux cas où j'ai essayé de me battre pour avoir plus de droits et de voix, je n'ai pas aidé à faire un tel tour.
Utiliser des "données apparemment connexes" comme argument ou sans cœurs, ni astuces ordinaires.
Lorsque je suis au milieu du concours de modèles mathématiques, les questions de test nécessitent une tendance à changer de chiffres. J'ai trouvé un "secret" à temps, c'est-à-dire / - vous fournit un groupe de données, vous pouvez utiliser n'importe quel modèle pour trouver un indicateur apparemment bon, mais modifie un groupe de données, cet indicateur a perdu son esprit; Il y a trop de variables, vous pouvez vérifier trop peu, vous pouvez donc facilement trouver cette mauvaise corrélation pour ne pas mentionner si vous ne mentionnez pas que vous voulez avoirÊtre causal en fonction de cette corrélation.
Enfin, même si nous passons le contenu du site à travers une personne qui a souvent visité le site Web, il l'observa avec la promotion des crimes. Ne l'attrapez-vous pas? Si nous ne pouvons pas garantir que vous êtes la justice, nous ne nous soucions pas s'il est mal.
Certaines personnes sont très bonnes à l'utilisation de données existantes pour estimer le prochain changement de données, qui peuvent être des observations multidimensionnelles ou avoir suffisamment d'échantillons de données; Toutefois, les données changeront, nous allons changer si vous êtes des données de superstition, vous ne pouvez pas prétendre à l'anticipation, vous ne pouvez prédire que les prédictions sur l'intention.réaffirme que les données importantes ne peuvent offrir que de pertinence, non causées par des fruits; Il y a très peu de choses qui ont une relation de causalité pure, car maintenant tout devient de plus en plus compliqué et a de nombreux facteurs influents. Les données réelles sont des outils, au lieu de conclusions ou de raisons.
2. Données aussi "minces"
Les gens penseront toujours que la course peut être reflétée indépendamment du nombre de petits échantillons.
Quand j'ai lu Dalle HAV, "Statistiques mentiment", le livre faisant référence à une expérience médicale classique:
450 enfants dans une zone arrangée NHI Khach, 680 enfants n'acceptent pas injecter sous forme de contrôle; Peu de maladies infectieuses se produisent; Il n'y a pas de polio chez les enfants avec des vaccins.
Voir ceci, vous voudrez peut-être faire des conclusions sur l'efficacité de l'engourdissement pédiatrique.Cependant, il reste encore le suivi de cette expérience. En fait, aucun enfant dans le groupe témoin!
Regardez l'incidence de la polio, elle est relativement faible. Il peut y avoir deux cas de patients dans une population si grande taille; Par conséquent, un non-sens commence dès le début de cette expérience; Si vous souhaitez avoir une idée des conclusions, le groupe expérimental doit goûter un enfant de plus de 15 à 20 fois par rapport à ce groupe.En fait, de nombreux rapports de recherche sur le marketing de marchéG que nous avons vu, ne manquez pas d'exemples de conclusions moyennes à travers de petits échantillons, tels que l'analyse du groupe de consommateurs de 90 ans:
[
84% après 90 habitudes finances ";"34% 90 après avoir acheté";
"Plus de 60% 90 90 utiliseront des prêts consommés pour la vie de base et de divertissement" ..
Après cela, j'ai été transféré à la source de données, l'échantillon était de 5 000 personnes, il y en a beaucoup? Et la dernière recherche sur les données est de 362 millions, seul le nombre d'échantillons du test est suffisamment grand et la loi moyenne est une description utile ou devinez.
- Si mentionné ci-dessus est présentée dans les données populaires actuelles, essayez ensuite de voir comment la vérité des données, évitez d'être confondu par quelque chose comme ça, rien; Après tout, les "menteurs" étaient compétents dans ces astuces, les gens n'apprennent pas à protéger?
- "Les statistiques vont mentir" Donne-moi une bonne idée. La prochaine fois que nous pouvons poser des questions lorsque nous entrons en contact avecQuelques données:
1. Qui est-ce que cela dit, comment savez-vous?
Comment conclure cela? Trouver une déviation consciente et inconsciente.
Par exemple, vous distribuez le questionnaire du consommateur à l'aéroport, puis vous pouvez faire une sélection d'erreur, car les personnes de l'aéronef sont relativement comparées aux personnes ordinaires et la consommation sera naturellement plus élevée. Al ou, vous voyez que les gens sont grands dans une maison, puis ouvrent la porte, yao ming est assis; Si vous avez des données trop élevées ou trop bases, l'échantillon n'est pas moyen, ce type d'erreur se produira.
Bien sûr, également capable. Pour vous faire obtenir une conclusion favorable, choisissez vos propres données favorables, modifiez les normes de mesure et utilisez des méthodes de mesure inappropriées; Par exemple, il est plus moyen. Des remarques, mais utilisent des moyens de calculer et d'utiliser finalement "moyenne" pour cacher la vérité.
Ces choses que vous pouvez penser aux astuces, bien sûr nAutres astuces.
2. Qu'as-tu manqué? Lorsque nous lisons le rapport d'analyse, la plupart des cas, nous ne pouvons pas savoir combien de cas contiennent des échantillons; On peut voir qu'un tableau parfait, équipé d'une forte conclusion qu'il semble convaincu.
Toutefois, si une méthode de mesure de confiance, telle qu'une erreur de probabilité, vérifiez l'erreur standard, le prestige est une grande réduction.
En particulier, accordez une attention particulière à la moyenne de ceux qui n'ont pas été décrits, car lorsque, en moyenne et que le nombre moyen a des différences essentielles.
Un rapport a souligné que «le nombre de décès dus à la mort cancéreuse a augmenté au cours des 25 dernières années», c'est très effrayant?Mais nous savons tous que les cas précédents de "raisons inconnues" sont actuellement diagnostiqués avec le cancer, c'est l'un d'entre eux; De plus, les cadavres sont un diagnostic plus fréquent et plus précis; Maintenant que chaque vie capitaine est étirée, tant de gens vivront jusqu'à l'époqueGrand cancer; Enfin, le rapport indiqué par le rapport doit être le nombre total de décès plutôt que le taux de mortalité - Total, la population totale est plus qu'auparavant.
3. Quel est le concept de conversion?
Relation causale du chaos, tirée de l'article Signification, est le moyen de voler le concept. Dès que possible, ces dernières années, les gens croient souvent que l'âge du mariage des femmes est souvent plus académique et que le pourcentage de femmes laissé chez les femmes médecins est également plus élevé; Après cela «la fille quitte les malades, c'est maintenant le titre de« célibataire », il semble être assez avant-gardiste?
Il s'agit d'un concept clair de vol, et ne peut pas transmettre des vues; et plus temps, dans un domaine plus professionnel, vous pouvez rencontrer le concept volé, vous ne pourrez peut-être pas reconnaître un œil.Est-ce raisonnable?
Alors, comment voulez-vous être dupe Conclusions sans signification? Vous ne pouvez pas vous attendre à ce que les gens deviennent statistiques et phoN Données personnelles?
Anti-sablée, vous devez prendre un nombre non enregistré, faites attention à cette section de données, vous pouvez voir ce type de moyen de ce type de moyen.
De plus, la tendance indique à l'étape actuelle qui pourrait être vraie, mais la tendance future n'est que nos prévisions; Vous ne pouvez pas effectuer les tendances actuelles actuelles pour spéculer dans les tendances futures, après tout, tout ne sera pas modifié.
Par exemple, il y a une nouvelle maintenant: dans les semaines du brouillard météo, le nombre de décès dans une certaine zone a augmenté de 2 800 personnes ... Réfléchir soigneusement à ce sujet, Cet âge est meilleur que d'habitude? N'est pas l'exception? Tout est en train de changer. Regardez-vous, comment avez-vous quelques semaines? Le taux de mortalité est réduit au niveau moyen, ce qui signifie que les morts dans le gros brouillard sont trop tard.
Voir, ces données sont vraiment impressionnantes, mais comme il n'y a pas d'autres données SComparez, ces données sont devenues sans importance.Mardi, les données écrivent une épée à deux lames
Un peu d'un peu tué 10 000 personnes auto-réduisant, le piège de données est mentionné plus tôt, peu importe que c'est un faux corrélation, ambiguïté ou des données minces au point de vue; Ces données que je suis tombée dans le cercle et j'ai aussi un outil pour ma "fraude" pendant un moment.
Quelles données voulez-vous utiliser? Je n'ai pas eu de système systématique de mines et d'analyse de données, mais je crois aux vastes perspectives d'application des grandes données et j'ai bénéficié de nombreuses règles de corrélation données par des données importantes; Je reflète également, dans le délai de données, je n'ai pas exploré ses limitations et comptez sur des conclusions à ce sujet.Pour ceux qui obtiennent de grandes données pour juger des individus, des organisations et même de la société, en particulier des personnes sur l'humanité, que nous puissions accepter des données froidesFaites-le utiliser la chaleur?
attendra de voir.Trois livres récemment achevés me donnaient une nouvelle fois plus d'inspiration pour les données et la sensibilisation:
Cises Stephens: "Les gens mentent: vérités"
"Divers division
" ] Darl Hawl Statistiques "va mentir"