Premièrement, avant d'analyser les données, nous devons penser
L'ordre général d'une bataille affecte toute la bataille et les pensées des analystes de données ont pensé à une analyse générale. Les résultats ont un rôle majeur. Deuxièmement, analyser les problèmes et résoudre des problèmes
1. Identifiez le problème (une des étapes importantes):
(1) Premièrement, pour trouver la substance, une expression précise et réelle de le problème.
(2) SECONDES, Comprenez pourquoi voulez-vous résoudre ce problème?
[3) Enfin, quel est le sens de résoudre ce problème? Il est nécessaire de le résoudre ou non nécessairement ou de résoudre immédiatement. Le problème n'est toujours pas très urgent.
Collection, des données historiques complètes, des situations similaires et l'état du problème GJ'ai décidé du problème. Par exemple, des données de rapport existantes, vous pouvez voir les données actuelles du point de problème ou une période de temps;
3, Choisissez la méthode analytique:
(1) L'analyse principale de la taille correspond à la préparation des besoins de données suivants;
(2) Sélectionnez la méthode analytique et la méthode d'analyse (méthode liée à la statistique);
Extraction complète des données (deux étapes importantes):[1) Selon la méthode d'analyse et d'analyse analytique. Exigences en matière de données.
(2) Pour la rétroaction de retour, il est nécessaire de manipuler une pièce pour tenir compte de la question de l'analyse;
Résultats de l'analyse et la conclusion:
(1) (1) Selon les résultats d'analyse, des conclusions sont obtenues par le problème actuel. La méthode et la taille de l'analyse ici, le résultat du résultat, V.V.(2) Conclusion requiert suffisamment de données pour support;
Recommandations et recommandations:
(1) prixLa France pour le problème actuel est donnée au problème actuel;(2) Suggestions du niveau de l'entreprise. D'autre part, une analyse de niveau plus profond peut être effectuée sur le point problématique Créer des solutions pour les niveaux d'extraction de données;
Évaluation des effets de mise en œuvre et des rapports de finition:
(1) L'évaluation est faite selon les mesures réelles actuellement et les processus de Les rapports d'analyse, de résultats et d'évaluation seront achevés et des leçons seront fournies aux problèmes futurs;
[2) Pour le problème n'est pas complètement résolu, la description sera décrite.
Déclaration de mardi
Méthode 5W2H:
5W: Quoi, quand, où, où, où, où, où, à l'étoile;
2H: combien, combien, combien;
Où est-ce? Quel est le problème? Quel est le problème?
Pourquoi - Où est la raison?
Qui - quels objets ont le lien QEUR? [
Nombre de fois et nombre d'apparences?Combien cela prend-il?
Quatre, le problème
La structure du problème comprend l'état actuel à, causes directes et causes finales. Une analyse préliminaire d'émission a été faite selon l'analyse de la cause préliminaire de la cause directe et de l'analyse analysée par la cause finale.
Années, méthode analytique
Trois caractéristiques principales des méthodes statistiques, résument juste trois phrases:
(1) Pratique: En plus de la vérité, les données peuvent prouver tout ; (2) (2) Richness: les statistiques ont été exposées, claires et peuvent être plus importantes
(3) Fair: chacun devrait indiquer les données
Partie Six, description
Analyse statistique
"La loi à cinq points": minimum, numéro de position 1/4 , moyenne, 3/4 positionnement, maximum; "Deux degrés": hauteur de pointe, t
sept, Sélection de la méthode d'analyse variable
Classé par la méthode d'exploitation: y compris les méthodes statistiques, les méthodes d'apprentissage, les méthodes de réseau neuronal et méthodes de base de données.
(1) Les méthodes statistiques peuvent être divisées en: analyse de la discrimination (baies de traitement de distinction, discrimination, discrimination des non-paramètres, etc.), une analyse de grappes (grappes du système, clusters dynamiques, etc.), analyse d'exploration (analyse principale des composants, etc.)
(2) Les méthodes d'apprentissage de la machine peuvent être divisées en: Résumé Méthode d'apprentissage (arbre de décision, résumé de la règle, etc.), basé sur l'exemple d'apprentissage, d'algorithmes génétiques, etc.
(4) La méthode de la base de données est divisée en: analyse de données multidimensionnelles et technologie OLAP, ainsi qu'un attribut. Les règles de l'Association: les règles de l'association reflètent l'interdépendance et le lien entre une chose et d'autres choses, s'il y a une certaine relation entre deux choses ou beaucoup de choses, l'un d'entre eux peut prédire à travers d'autres des choses.
Neuf, sélectionnez les données pertinentes nécessaires à l'analyse
Dix données d'évaluation de la qualité
Dans la société réelle, il existe un grand nombre de "données sales":
1, pas complet (Structure de processus de conception de données, dispositif de collecte de données et personnel de saisie de données):
(3) ne contient que des données synthétiques, non Données surT
.
.Transfert de données): (1) des informations contenant des erreurs . 2, incompatible (structure de données, entrée de données) Ressource humaine): (1) Non cohérent [1) ] (2) L'incohérence des étiquettes (3) n'est pas d'accord sur les valeurs de données 3, matériau de conflit: ] (1) Sexe: chaîne (mâle, femelle), char (m, f), entier (0, 1) (2) Date: Date, DateTime, Sting Conflit de carte Données: Résolvez le même nom, le même nom: Etudiants, points 4, Données de conflit: [1) Point d'élève ] a. Pourcentage: 100 ~ 0 [ b. Cinq points: A, B, C, D, E c. Représentant du personnage: super, bon, tir, légal Volume de trading récent: il y a hier, cette semaine, ce mois-ci Conflict concentré: l'origine est une conception de la structure de table Onze, Nettoyage des données Data Détermination des points isolés Le processus n'est pas cohérent . Douze, comment présenter les résultats reflétant la vérité des ingrédients , Les données doivent être correctes, argument 13, les résultats d'analyse présentés des principes de base Les résultats de l'analyse des données sont présentés: 1, Identifiez le sujet: Objectifs d'utilisation des graphiques: des idées et des vues expresses, approfondissent les lecteurs ou les publics, lors de l'utilisation de Icônes, qu'est-ce qu'il est clair que vous voulez montrer? 2, Déterminez la relation de comparaison: ComparaisonDifférents éléments Différents types d'éléments différents