Skip to main content

Cette histoire est totalement fictive.


L'histoire s'est produite sur la montagne, le personnage principal était un petit singe qui était la première personne au travail, nommé "Yue Jun", il ne fait que des conditions de l'eau de la technologie générale CO. , Ltd. Le recrutement est un analyste de données. Son patron est un analyste de données de Dinh Dinh célèbre "singe". Les personnes de la société le respectent comme "Qi Tian Dashag".

Huaguashan a récemment paru, certains singes ont été infectés par des virus inconnus, provoquant une épidémie grave sur la montagne. Maintenant, Water Water Condo Technology Co., Ltd. Ne peut travailler que à la maison.

Ce jour-là, le patron de Qi Tian Dashag a passé "Monkey" (personnes Huashan dans le logiciel de messagerie instantanée utilisée par les gens), a-t-il déclaré: "Hey Sijun, tu viens d'entrer dans le public Ty, j'ai besoin de Habituez-vous à la société dès que possible. Je ne peux pas aller à faire maintenant, mais je ne peux pas perdre ce temps. De cette façon, je vais cunG vous émet une donnée, des camarades de classe et une analyse, veuillez me donner la semaine à nouveau. Rapport d'analyse des données.


Continuez à la mission, 皮 君 Très serré: Ceci est la première tâche à inclure dans l'entreprise, assurez-vous de mettre en œuvre! Il a donc vu une analyse de données sérieuse de l'enseignement vidéo que le patron de Qi Tian Dashang a fait et a également visité beaucoup d'informations relatives à Internet.

Ce qui suit, c'est le processus de réflexion et d'écriture de:


1. Analyse de fond et objectif

Source de données: Informations sur les marchandises Données de données - Ali Cloud Tianchi

Il s'agit d'une donnée de vente pour les produits mère et enfants. Signification des ensembles de données comme suit:


Nous devons explorer certaines règles ou données inhabituelles des données Hey, puis faire des recommandations pour le Groupe d'exploitation.


Deuxièmement, l'idée d'analyse

du "produit" et "utilisateur" deux coins:


Analyse des changements de volume des ventes Au fil du temps

Qu'est-ce qu'un produit de vente, il s'agit d'un produit de vente lent, les caractéristiques

2. Coin utilisateur
Analyse de l'âge de l'âge et des ventes Relation entre

Analyse de la relation entre les anniversaires et les ventes de nourrissons

1. Données de nettoyage



(1) Tableau d'analyse déterminé


Remplacement du nom de la colonne en chinois, ajustant la largeur et les colonnes de la colonne:


(2) multi-Dungle




.








1 Traitement


. ]






.






peut être vu à partir des résultats ci-dessus et la répétition introuvable.


2 Traitement NULL Valeur

a trouvé des résultats de traitement, des valeurs vierges dans la table d'informations sur le produit en fonction des biens de champ d'attribut, en raison de valeurs spécifiques, en raison de valeurs spécifiques, il n'est pas cher.Il n'y a aucun moyen de remplir l'absence d'autres sources de données, de sorte que ces valeurs nulelles sont temporairement ignorées.

Aucune valeur nulle dans la table d'information du nourrisson.



Switch "Bébé anniversaire" et "Anniversaire de bébé" Changez au format de date, convertir " nouveau-né "à son vrai sens.


[12) Manutention anormale de la valeur


1 Supprimer tout sexe inhabituel

Le sexe du bébé n'est que deux hommes et femmes qui peuvent, après les étapes de nettoyage ci-dessus, ont constaté que le sexe du bébé a une valeur inhabituelle, a été supprimée.

2 Supprimez la valeur inhabituelle


Après la classification des résultats d'observation, la gamme d'achat Les marchandises sont [2012/7 / 2, 2015/2/5], il n'y a pas de valeur d'exception extrême.

La gamme d'anniversaire de bébé est [1984/6/16, 2015/8/ 15], le temps de vente de produits est de 2012 ~ 2015, il y a un anniversaire en 1984, il est clair que cet élément de 1984/6/16 est un terme anormal, il doit donc être supprimé.


3 Détermine si l'ensemble de données peut avoir une valeur inhabituelle

est une analyse statistique que le nombre d'achats a été analysé. :


Coefficient de mifter = écart type / moyen * 100% = 2515%, indiquant des ensembles de données très élevés et il peut y avoir une valeur extrême partielle.


Parfois, certaines valeurs d'exception, nous ne pouvons pas trouver dans la phase de nettoyage des données. Nous allons donc également faire une analyse de valeur d'exception avec une analyse de graphique.

2. Combinée à l'analyse graphique

(1) Règles de vente avec le temps

1 Observez Xu General Sales






Un style de vente important est apparu en novembre 2014.


Nous pensons souvent que cela est dû à une double opération de onze novembre

La première fois que nous pensons en raison de la double opération, les ventes doivent alors être dues à l'augmentation de La quantité d'achat, les suivantes collecteront des certificats de données.


2 Une forte augmentation de l'analyse des ventes en novembre 2014

Surveillez les ventes de novembre: [














peuvent être observés à partir de la figure ci-dessus, les ventes en novembre 2014 sont principalement dues à novembre. 13, les ventes de cette journée sont apparues.


3 analyse les causes de vente de ce jour ce jour-là

Observant chaque type de 11 ventes mensuelles de marchandises:

Nous serons évidents à partir de l'image que les principales ventes sont extraites du type 50014815, les données de requête spécifiques ont remarqué une vente totale 10138 au 13 novembre 50014815 de type 1030 (99,7%).

4 peauAnalyse NH Section 50014815 Vendu la force de l'enquête le 13 novembre

Souvent toutes les données de type 50014815 Vue:






Des données de vente historiques de type 50014815, on peut constater que les ventes antérieures ont été maintenues à un niveau relativement stable. Le niveau n'est qu'une augmentation de la journée du 13 novembre 2014.


Retour à l'analyse, filtrer les détails de vente de type 50014815 le 13 novembre 2014.

]

Détails des ventes, les produits sont utilisés par les utilisateurs 2288344467, représentant 99,7% (total 10030), obtiennent ainsi des conclusions suivantes:

Non dû à une activité à moitié doublée onze. Parce que s'il s'agit d'une activité à double dédiée onze, il doit y avoir de nombreux utilisateurs à acheter du volume de vente, au lieu d'un seul utilisateur qui achète beaucoup de biens;

Besoin de trouver des ingénieurs pour confirmer si la source de données est manquée;

Si les données sont correctes, la situation est ramenée à l'opérateur, suivant les personnesS'il y a un comportement suspect (marquage ou utilisation de la vulnérabilité du site 薅 laine).

5 exclut la valeur inhabituelle, observant la tendance des ventes


Cet enregistrement est acheté par les utilisateurs 2288344467 appartenant à une valeur réelle habituellement, il est enregistré comme "Données inhabituelles 1 ", devrait être supprimé, puis analyser la loi sur les ventes avec le temps de changer.

Supprimer "Données anormales 1" Système d'eau de réutilisation arrière:





de la figure, de type 38, de type 50014815, de type 50022520, de la situation des ventes de 122650008 Type Stable, volume de ventes de type 28 est grand, de type 50008168 une apparence extrême extrême apparence.



6 types d'analyses 50008168 raisons points extrêmes


Le type 50008168 peut être analysé en 2014 2 748 unités ont été achetées à partir des utilisateurs 173701616 et les données enregistrées comme "Données d'exception 2 "Et la méthode de traitement des données d'exception mentionnées 1.

7 analyse les causes des fluctuations de ventes de 28 classes

[ après la suppression de "données inhabituelles 2", "données anormales 2" supprimées et prenant le Diagramme de lignes prises:


Observant la découverte de type 28 oscillation relativement grande, trouver des détails Ventes de type 28, adaptées à la commande client:

. d'autres données pour analyser la raison.

8 petites fourches

de type 50014815, de type 50008168 avec une valeur inhabituelle marquée comme "données inhabituelles 1", à l'exclusion des données inhabituelles 2 "causées par des activités marketing. Parce que si c'est un marketing Activité, il doit y avoir de nombreux utilisateurs à acheter du volume de vente, à la place d'un seul utilisateur qui achète un grand nombre de marchandises;

Type 50014815, type 50008168 Ces deux données inhabituelles doivent être trouvées pour confirmer si la source de données est fausse; Si les données sont correctes, il est nécessaire de renvoyer l'opérateur pour surveiller si la brosse conditionnelle de l'utilisateur (le site peut avoir des vulnérabilités et des pirateuses utilisées pour peigner une seule laine de laine), une analyse de suivi pour exclure ces deux données; Type 28 Marquage de trois données d'attention ", n'a actuellement aucune autre analyse de combinaison de données, temporairement réservée.

(2) L'analyse est un produit de vente de produits, il s'agit d'un produit de vente lent, Caractéristiques
Qu'est-ce que "attrayant" et "les ventes" lentes "doivent être évaluées en fonction de la quantité d'achat.

1 Pour trouver la vente à chaud et le déchargement de marchandises peut voir que le type 50008168 est le code PIN le plus chaud et le Nombre de produits achetés Type 38 est au moins et le nombre d'achats avant que les combinaisons puissent être constatés que la vente de masse de type 38 est relativement moins importante, de sorte que la réduction de la charge de soudage du produit 38Obtenir. 2 analyse la quantité d'achat de produits chauds et de produits de vente bas A. Appuyez sur "Année" ] Au 6 février 2015, des données incomplètes, et le nombre d'achats dans toutes les catégories peut être vu. Augmenté chaque année. b. Cliquez sur "Quarter" pour voir [ La performance globale diminue au premier trimestre, le deuxième trimestre réduit, Le quatrième trimestre a augmenté. c. Enfin, selon le "mois" [ comme on peut le voir à partir de l'image, le nombre de personnes peut taper une ombre basse 38 stable, maintenue à un niveau inférieur Niveau en conséquence, l'élément peut être évalué que le produit est essentiellement un débit naturel, ou une porte froide. Sauf pour le type 38, cinq autres biens ont un certain nombre de caractéristiques communes (réduites au premier trimestre, augmentation du deuxième trimestre, diminution du troisième trimestre, du quatrième trimestre) et des fluctuations de Hot La vente 50008168 est grande. 3 analyse les raisons du nombre de produits chauds Catalogue 50008168 Map 50008168 Observation, Février Chaque année et en juillet, il y aura un auge, tandis que Pharma apparaîtra en mai et novembre (pic 2013 en décembre), il sera donc observé séparément avec ces mois. de l'image, on peut constater qu'il y aura une "levage" claire en novembre et décembre chaque année. "Autres mois, j'ai un volusher, je vais donc le sortir de novembre et décembre: On peut voir que la quantité d'achat Dans le montant de l'achat figurera le 11 novembre et le 12 décembre, on peut évaluer que les marchands conduisent des "paires de onze promotions" et "double 12 promotion" active 4 petits boutons La vente chaude est un type de 50008168, un marchand "deux fois onze" et "doubles 12" favoriseront la promotion et les effetsdynamique est claire; L'article bas est un type 38, le nombre d'achats et de ventes reste bas. Quelle est la relation entre le sexe et les ventes de nouveau-nés 1 calculant le nombre mâle et femelle [ La proportion d'hommes et de femmes est probablement 1: 1.1. 2 Calculer le nombre de biens achetés par des hommes et des femmes . ] Le taux d'hommes et de femmes a peut-être acheté 1: 1.7. On peut voir que les ventes de produits nouveau-nés pour femmes sont plus élevées que les hommes. 3 Comparaison de différents types d'achat - Différences masculines et féminines . . ] . . . de la carte, seuls 50022520 est un homme légèrement supérieur, l'autre Type est des femmes par rapport aux hommes, principalement différentes de toutes sortes de 50014815, les femmes achètent des marchandises 3 fois mâles. 4 petites jonctions La vente de produits de femmes nettement supérieurs à ceux des hommes; Le seul type de 50022520 est un homme légèrement supérieur, d'autres types sont des femmes que les hommes, principalement différents de tous les types de 50014815 et des achats de femmes sont de 3 hommes. (4) Quelle est la relation entre l'âge et les ventes de nouveau-nés 1 relation entre l'enfance et le nombre d'articulations Du graphique, la vente globale du produit a diminué avec la croissance de l'âge du bébé. Fondamentalement, il n'y a pas besoin de 6 ans. 2 analyse la tendance des ventes de chaque type . . de l'image, peut voir queBien que les ventes globales diminuent avec l'âge des nourrissons, sous-cotation différente: Type 50014815, type 50008168, type 28 est principalement une mère et des enfants âgés de 1 ans (0 ans au sommet); Type 38, type 122650008 Produits pour des mères et des enfants de 1 an (1 an au sommet); Type 50022520 Les produits mère et enfants ("pic") devraient principalement faire face aux femmes enceintes et aux mères indigènes. 3 petites jonctions La baisse des ventes communes avec la croissance de l'âge du bébé, fondamentalement, pas besoin après 6 ans; Type 50014815, type 50008168, liste de 28 produits de la mère et des enfants sont principalement âgés de 1 an; Type 38. Enfin, toutes analyse l'ensemble de l'analyse, du processus d'analyse et du processus d'analyse sont formés et collectés une analyse conclue et toutes les conclusions proposées: DA DA a été écrit pour les deux jours, puis envoyé à luiPropriétaire Qi Tian Dastreng. Après avoir lu le patron, souriant et riant. " 君 君: Tout d'abord, nous devons analyser clairement des idées, réfléchir à de nombreuses analyses à contrecœur et d'analyse des produits; Avant l'analyse officielle selon la table d'analyse, Nettoyage: Identifier le tableau d'analyse - traitement moins supprimé - Manipulation de la valeur inhabituelle; Selon le point d'analyse des colonnes, analyse comparative, analyse logique des arbres, analyse de vérification hypothétique et autres méthodes d'analyse analysées; De nombreux problèmes ne sont pas le début du début, mais de faire l'expérience des «éléments de construction d'expression - découverte inhabituelle - d'atteindre l'incident (libération continue) - analyse d'analyse de vérité - - trouver une explication raisonnable, donc il est donc nécessaire de Expliquez raisonnablement, donc besoin d'être un prix raisonnable, il y a donc un esprit de "tâche à décaper"; Lorsque des données relatives à l'ensemble, il est nécessaire de se méfier de "Simpson Paradox". Après avoir étudié l'intégrité, besoin d'étudieru la partie totale du milieu, voir si elle peut aussi être prise; Chaque analyseur a été synthétisé et finalement résumé, il peut souvent exprimer des conclusions plus complètes;La recommandation finale basée sur des conclusions globales sera plus significative. Cette histoire est terminée, merci de regarder . est partagé à être copié, si ce qui concerne les emplois, les droits d'auteur sur les droits d'auteur et d'autres problèmes, veuillez nous contacter pour supprimer la première fois (Micastress: LOVEDATA0520)

Sujets

Catégories