Skip to main content

Un bon rapport d'analyse de données est indissociable de deux parties: pièces de données et pièces analytiques. Une femme intelligente est difficile et les données sont comme si vous analysez des données telles que l'interaction de SMOCK, l'importance des données peut être vue. L'analyse est la plus importante étape des analystes de données pour signaler les données. C'est l'analyseur de données le plus démontré. La partie fait également partie de la distance. Aujourd'hui, je vous dirai comment écrire des rapports de données dans le rapport de données et l'analyse sera partagée pour tout le monde le lendemain! Je me souviens d'agenouillement demain l'article ~


La section de données la plus importante est la qualité des données et la qualité des données décide directement une qualité du rapport d'analyse des données de journaux. Si un rapport du rapport est interrogé, il affectera directement la réputation de ce rapport d'analyse de données. Aujourd'hui, certains contenus sont liés à des données.




Type de données


Le type de données est mieux compris, ce qui signifie que le type de données est stocké, différents types de données existant différentes utilisations. Traitement des données, vous devez d'abord comprendre le type de données. Les types de données communs ont (ici seulement des types de données communs):

Type Integer

Int: Utilisé pour le stockage et le stockage en entiers tous les entiers positifs et négatifs entre 31 fois -2, 31 Temps, chaque type de type INT stocké dans la mémoire de 4 octets
Bigint: Utilisé pour stocker de gros entiers, tous stockage tous les nombres entiers à partir de 63 fois à partir de - 2, 63 fois, chaque type de données de base représente 8 octets de stockage Capacité

Smallint: Dans un petit kit de stockage entier, tous les numéros de Yang compris entre 15 cellules carrés de -2 sont stockés. Chaque données de type Smallint occupe 2 octets de capacité





Real: les données stockées peuvent être précises à la 7e décimale, portée TOui -3,40e -38 à 3 40e +38. Chaque type de données réel représente la capacité de 4 octets

Float: Les données stockées peuvent être précises à la 15ème décimale, situées entre -1 79e -308 à 1 79e +308. Chaque donnée de type flotteur occupe 8 octets de capacité de stockage. Les types de données flottants peuvent être enregistrés en tant que flotteur [N]. N Spécifiez la précision des données flottantes. n est une valeur brute de 1 à 15. Lorsque N prend 1 à 7, il détermine réellement les données de type réelle et le système le stocke avec 4 octets. Lorsqu'il prend 8 à 15, le système considère qu'il s'agit d'un type de flotteur, Stockez-le avec 8 octets



Type de caractère

Char: Type de données Formulaire de définition pour CHAR [(N)], n signifie que l'espace de stockage est occupé Par tous les caractères, n Les valeurs de n, peuvent contenir 8 000 caractères ANSI. Si la valeur N n'est pas spécifiée, la valeur par défaut du système est 1. Si le nombre de caractères des données d'entrée est inférieur à N, le système ajoutera automatiquement un espace pour remplir le vide. Si les données d'entrée sont trop longues, elle couperaLes pièces surviennent
NCHCH: il est similaire au type de caractère. Différent, le type NCHCH de type N est pris de 1 à 4000. Parce que les types NCHCH utilisent le jeu de caractères standard UNICODE (caractère). Les normes Unicode précisent que chaque caractère occupe deux octets de capacité de stockage. Il est donc plus qu'une double capacité de stockage par rapport aux types de données standard unicode. Les avantages de l'utilisation des normes Unicode sont dus à leurs unités de stockage utilisant deux octets. La masse de l'unité de stockage a augmenté, qui peut inclure des caractères de langue dans le monde et peut apparaître simultanément dans la colonne de données. Chine, anglais, français, allemand, v.v aucun conflit de cryptage
varchar: Formulaire de définition de données Varchar est Varchar [(N)]. Il est similaire au type de caractères et de valeur de N est également de 1 à 8000. Si les données d'entrée sont trop longues, elle coupera son dépassement. Divers types de données VARCHAR ont des caractéristiques des fluctuations, car la longueur de stockage du type de données Varcharne est le degréi valeur réelle. Si le nombre de données d'entrée est inférieur à N, le système ne sera pas ajouter un espace de remplissage dans les paramètres. Spatial. En général, parce que la longueur du type de données CHAR est fixe, il est plus rapide que le VARCHAR



Type de temps et jour

Jour: « 2018 -01- 17
Temps: "10:14:00"
Horodatage: "17/01/2018 10: 14: 00.45"

ci - dessus est un tour de type de données universel, s'il n'y a pas d' autres types de données, vous pouvez aller en ligne, il est préférable de comprendre

(2) données sonores

parce qu'il ya beaucoup d' explications sur les données de bruit, il est très professionnel, je n'ont pas beaucoup des explications plus détaillées ici et nous ne discutons des valeurs inhabituelles lorsque vous obtenez des données de SQL:



NULL

Les gens qui dirigent souvent SQL certainement trouver qu'il y aura nulle dans les données en cours d' exécution, cette fois -ci vous devez remplacer null. S'il est compté, null 0 remplacé, cette étape peut Achevé en SQL ouDans Excel


Valeur améliorée


La valeur maximale affecte les résultats de calcul des données, généralement traitées, remplaçant la valeur maximale différente du traitement extrême de prix ou de la suppression directe

est un échantillon 0

si 0 en tant que Denominner, dans Excel apparaît # div / 0, cette fois, vous pouvez remplacer les résultats en direct suivant ou le remplacer directement dans SQL, utilisez le boîtier d'utilisation.. Lorsque .. vous pouvez remplacer le diamètre de

(3) Data
Le calibre est très important. Selon l'expérience, la plupart des données ont des problèmes. Le calibre est due au calibre des données et aux taux d'intérêt des données visant à obtenir le taux d'intérêt des dépôts:

Le taux restant est un indicateur de taux de cycle, il faut généralement cadavre la nature du retenue et la détermination positive. lors du calcul du taux de rétention.

Le cycle est conservé: Terminer le cycle de retenue signifie que l'utilisateur fonctionne depuis longtemps et travaille toujours des cendresLe cycle suivant, le temps de sortie

a décidé: mentionne de déterminer que l'utilisateur est actif, peut être démarré ou peut être connecté ou peut être rempli, le propriétaire faible est en fonction des besoins opérationnels
des calculs réels: Calcul du taux de survie
Molecular: Cette semaine fonctionne et fonctionne la semaine dernière
Mère: Nombre d'utilisateurs Active la semaine dernière


2. Les outils peuvent être utilisés ]

Dans le processus de traitement des données, il existe de nombreux outils, ici, un nombre commun d'outils introduit ici, tout le monde est familier et l'apprentissage n'est pas spécial.


(1) Extraction de données




Il existe des endroits similaires dans des instructions de requête, principalement pour voir le stockage des données notre société

(2) Traitement des données

Python: généralement écrit un script pour effectuer certaines opérations mécaniques (je suis en cours d'utilisation actuellement) ou peut être utilisé pour la villaC Afficher les calculs

MySQL: Peut être traitée requis
Excel: lorsque la quantité de petites données, il vous suffit de gérer


(3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3] (3) données visuelles

Python: Peut être utilisé pour effectuer des cartes nuageuses à partir de Tableau: visualisez certains graphiques, peut être combiné avec SQL avec Excel: faites de simples graphiques, gérez des données correctes, utilisez souvent suffisamment d'Excel ]

Sujets

Catégories