Skip to main content

Les données contiennent 1 000 000 informations comportementales des utilisateurs le 25 novembre 2017 et les informations de l'école contenues dans le tableau sont les suivantes:




PV, Acheter, PV, Acheter, Panier , FAV d'actes correspondant à des clics, à acheter, ajoutez le panier et quatre comportements.

En raison de ces grandes données de données, il ne peut pas être analysé par Excel et donc 100 000 données seront sélectionnés avec Navicat pour introduire SQL pour effectuer l'analyse suivante.

En fonction des informations de la table actuelle, l'analyse de la trémie peut être effectuée en fonction du comportement de l'utilisateur. Observez le taux de conversion de chaque lien; En outre, les utilisateurs peuvent explorer les règles comportementales quotidiennes du comportement des utilisateurs et du temps pour comprendre les priorités de comportement des utilisateurs.


II. Données de nettoyage

1. Choisissez un sous-ensemble


Parce que les ensembles de données contiennent moins de types de données, cette analyse utilisera tout le mal à savoir siDonc, ne faites pas de traitement

2. Renommez



Suivez de gauche à gauche, Nom ID utilisateur, ID de produit, Type de produit ID, Type de comportement et TimeStamp



3. Supprimer la valeur de répétition


Observez les données de résultats, ID utilisateur, ID de produit, type de produit et actes de toutes sortes Des valeurs répétitives raisonnables, il faut donc être associé à différents types de données, c'est-à-dire que chaque utilisateur a beaucoup de temps en même temps est la même chose en même temps pour un article.
Sélectionnez ID utilisateur, ID de produit, Temps de pool

de UserBehavior


Groupe d'ID utilisateur, ID de produit, Temps de piquer

Quantité (*) & GT; première;


Les résultats montrés sans la valeur répétée


4. Manipulation du manque de valeur

Choisissez le comptage, le comptage (produits d'identité), le comptage ( ID de type produit), quantité (type de comportement), comptage




Les résultats n'ont montré aucune valeur manquante


5. Le processus d'intention


des données de format horodatage centralisées, il est nécessaire d'être converti en un écran normal. Le traitement de flux est le suivant:


- Ajoutez une colonne de jour


Modifier la table userHavior Ajout du temps Varcharchar (255);
- Convertir UnixTime en un écran de temps normal

Mise à jour UserHavior Set = de_unixtime;


Après traitement des données


une date et une heure spécifiques
- augmentez la date de la colonne de conversion

Modifier la table userhavior Ajouter une journée de Varchark (255);

- Ajout de la colonne du temps


Modifier la table UserHavior Ajouter une colonne Varchark (255);
- de l'extrait de temps normal

Mise à jour UserHavior Set Date = Supertring (heure normale, 1, 10);


- Du temps d'extraction temporelle normale
Mise à jour UserHavior Set = supstring (temps normal,12, 9);

Après la fin, le format horodatage est converti à la date correspondante et à l'heure spécifique.

6. Traitement de la valeur anormale


Si la date de requête est décrite dans les données définies du 25 novembre au 3 décembre:

- données de novembre 25 au 3 décembre dans la date de requête

Choisir * de UserHavior Place Date & LT; '17 -11-25 'ou date et gt; '17 -12-04 ';


Au total de 44 pièces de données, ce qui est clair:

- Supprimer des données qui ne répondent pas aux exigences de la journée


Supprimer de Userheavior & lt; '17 -11-25 'ou date et gt; '17 -12-04 ';

3. Modèle de construction





(1) Temps à temps partiel







]
] Modifier la table userhavior Ajoutez l'heure de la colonne VARCHAR ( 255);
- Ajouter des heures

Mise à jour UserHavior Set the Time = enfant chaîne (heure, douzième);


- Statistiques par heure Utilisateurs d'exploitation

Choisissez l'intervalle, comptant (intervalle) pour effectuer un numéro d'activité de l'utilisateur du groupe UserHavior dans l'ordre du temps;


Données de SQL à l'analyse visuelle:











Les utilisateurs modifient l'heure des visites

On peut voir que 3 heures du matin est le point d'accès le plus bas, puis le nombre d'utilisateurs a progressivement augmenté, atteignant un petit pic à 10 heures et refusé à 12 heures. À partir de 12h00 à 16h, c'est dans une augmentation stable de l'état, puis une baisse significative de 17 points, puis soudainement développée à 19 heures et a augmenté à 21 points pour obtenir le plus haut sommet.


Résumé: Les utilisateurs toute la journée ont été divisés en deux segments de 10 à 16 heures.H Small, 20-22 points le soir, la plus haute heure de toute la journée, peut voir 10 points tous les matins chaque matin après la maison, je vais utiliser Taobao pour parcourir les achats. À midi, j'aurai un déclin temporaire pendant le régime, adapté à la plupart des habitudes de travail utilisateur. (En raison de la courte journée, il n'ya pas de distinction entre jours ouvrables et le week-end, spéculer les résultats ci-dessus conviennent mieux aux utilisateurs du jour ouvrable)

(2) Numéro PV quotidien et numéro d'achat



Sélectionnez la date,
SUM (si (Type de comportement = 'PV', 1, 0)) Nombre de clics Simple,

Somme (si (si ( Type de comportement = 'Acheter', 1, 0)) Numéro d'achat unique

de Userheavior

en groupes;





Après avoir visité SQL, la date de requête a été trouvée les 25 novembre, 26 et 2 jours 3 est le week-end et le montant de l'achat a un État allant du 25 novembre au 3 décembre,Et le nombre de hits a augmenté. Les week-ends sont légèrement supérieurs à la journée de travail, mais il n'y a pas de différence significative.
(3) Nombre de PV PV quotidiennes


Sélectionnez Date, Quantité (Type de comportement) / Comptage (Différent ID utilisateur) sous forme d'accès mis à jour à partir de UserBeHavior
Où type = comportement "PV" en groupe;

PV Perita Number Daily est environ 13 fois, car aucune donnée de comparaison ne peut être analysée.

(4) Achats quotidiens moyens par habitant


Sélection de la date, le comptage (type de comportement) / comptage (numéro d'utilisateur différent) est accessible à partir de userHavior

Où le comportement = "acheter" le groupe de jour;


Les utilisateurs peuvent expliquer que la moyenne d'au moins un comportement d'approvisionnement survient quotidiennement et la fréquence d'achat d'utilisateurs est relativement stable;


(5) Analyse / conversion de l'entonnoir



Sélection du type de comportement, le comptage (type de comportement) est le comportement,

enfantsCat (anneau (comptage (comptage) / (sélectionnez compter

de userbehavior où type de comportement = 'PV') * 100, 2), '%') est converti du groupe UserHavior dans l'ordre de type oignons vi dans l'ordre (type de comportement) Desc;




Parcourez les marchandises photovoltaïques pour faire des achats pour le taux de conversion des voitures et des amoureux de 6,07% et de 3,06% respectivement. Deux actes d'achat se produiront.

2 Favoris / Ajouter un panier d'achat - Conversion d'achat


Choisir le type de comportement est 'Favoris / Ajouter Panier - Acheter Conversion',


] ] ] ] ]
] ]
] ]
] ]
] ]
]

(Choisissez la quantité) de userbehavior dans quel type de comportement = 'Cart') + (Sélectionnez le comptage à partir de UserHavior dans quel type de comportement = 'fav')) * 100, 2), '%') dans la forme de conversion

de userbehavior où type de comportement = 'Acheter';




Le taux de conversion de la totalité des marchandises collectées et ajoutés à l'achat est de 25,65%, ce qui signifie que le trimestre du panier et les ensembles de fret de collecte seront achetés.

2. Indicateur de données de produit

(1) Différents comportements d'utilisateur, numéros d'article et chiffres

Choisissez le type de comportement, comptant (type de comportement), comptage (autre ID d'utilisateur spécial), comptage (ID de produit séparé)

du groupe UserHaVior en fonction du type de comportement;














. ] . . . . Choisissez le comptage (ID de produit séparé), compter (ID de produit séparé) de UserHavior; Résumé ci-dessus: 4. Résumé et recommandations Le 25 novembre 2017 - 3 décembre: Utilisateurs quotidiens L'heure d'accès principal est de 15-16 points et 20- 22 points dans la soirée, dans lequel le plus haut sommet du soir(2) Le nombre moyen d'utilisateurs par jour est d'environ 13 fois et le nombre de biens achetés quotidiennement est de 1,5 (3) de la conversion globale, du PV au panier et des taux de conversion préférés à leur tour est de 6,07% et 3,06% et le taux d'achat de L'achat est de 2,34% et le navigateur Web - Le panier est presque approuvé - plus du double du taux préféré, voir que les utilisateurs ont tendance à ajouter des objets d'amour. Dans le panier; Favoris / Ajouter le dernier chariot à convertir pour acheter 25,65%, indiquant que tous les 4 acheteurs ou marchandises seront transférés à l'achat (4) en raison du manque de données industrielles, impossible d'analyser plus de matériaux mentionnés ci-dessus (tels que le niveau de commutation est inférieur à la moyenne, possible, par analyse hypothétique, détection supplémentaire, trouver des raisons et des commentaires) afin de mettre en œuvre des recommandations efficaces. Cette analyse n'est utilisée que pour illustrer les bases des ensembles de données

Sujets

Catégories