Skip to main content

Pour les hommes d'affaires, la compréhension d'Excel est souvent meilleure que tout autre programme de couche de données, vous ne pouvez pas comprendre la base de données, vous ne pouvez pas connaître Excel. Le produit Excel de Microsoft a placé la plate-forme de données de la plupart des personnes et a également enterré de nombreuses mines pour des données standardisées. Combinée à votre propre expérience de travail, j'espère que beaucoup de personnes peuvent surmonter les limites de données d'Excel dans l'âge de données importante, entraînant un monde de données standardisé.


* La base de données de cet article fait référence à des bases de données relationnelles.
1, dépasser Excel: Comprenez la base de données

des données utilisées


. Les données n'ont pas besoin de faire attention au format de données, faciles à concevoir des parapluies et des modèles de mise en page faciles à concevoir et des outils d'édition riches, etc qui peuvent être dit comme un outil de production pour avoir des lieux de travail.

Cela a aidé tout le monde à trier des données, à stocker des données et à effectuer des calculs et des ordinateurs.H Données de base et offre une compréhension de base du monde des données. Toutefois, avec l'apparition de données importantes, les hommes d'affaires ont besoin de plus en plus de données de base de données, après la finition, les données de conversion dépasseront leurs propres données de génération et de stockage, solides en raison des entreprises grandes et moyennes, toutes les données pour le traitement et la sauvegarde des données de titres, Nécessite excédentaire de la plate-forme de données Excel, comprendre les règles de base du monde de la base de données (DB). C'est pour mieux comprendre, utiliser et vérifier les données commerciales et le convertir en valeur commerciale.


Enot-Poloskun / Getty Images

Magasinez la conception de la base de données et Excel toujours différent. Plus d'efficacité de stockage de données. La base de données est en fait l'un de nous, depuis votre carnet d'adresses mobiles Huawei, votre disque de chat Wechat, secouant le contenu intuitif, à ERP de la société, CRM, semble inconfortable, mais c'est la facilité de stockage de données. Avec le développementQuickness de la technologie de base de données, l'industrie a formé un certain nombre de spécifications de consensus, augmentant ainsi le stockage de données et l'analyse des données et la probabilité de données de données. En bref, la normalisation des données a deux points: réduire la fourniture de données (suppression des données de sauvegarde) afin de garantir que les données dépendent de la signification (garantissant une dépendance significative des données).

Normaliser les données désigne efficacement le processus d'organisation de données de la base de données.

Réduisez les données faciles à comprendre, faire référence à des données en double devrait être réduite au minimum. Par exemple, vous ne pouvez pas enregistrer le nom et le sexe du membre. Dans plusieurs tables (telles que la table d'informations de commande et le tableau des informations de membre), car le nom de membre et le sexe sont les propriétés des membres, sont enregistrés Stocker dans de nombreux endroits, Augmenter la fourniture de données, entraînant des déchets et entraînant facilement l'éradication des données et les corrections de bugs. Et réduction de la base de données de performance.


Assurez-vous que les dépendances, signification des données ouiLa relation entre l'autre est réglée correctement.

2 La première est la première des trois premiers, appelée le premier modèle, le deuxième modèle, le troisième modèle, appelé 1NF, 2NF, 3NF.


Simple, le premier modèle est que tous les flux de données ne peuvent pas être répétés - il s'agit d'une norme très faible, très facile à réaliser; Si cela signifie que la plupart de nos excellents correspondent à la première base de données de modèles? Non, le problème est en fonction de l'habitude d'utiliser Excel!

La plate-forme de la base de données est différente et les deux les plus élémentaires sont les suivantes: lecture et écriture de données dans des unités comportementales, une seule donnée. Sur la base de cela, nous comprenons que le titre de la base de données est la première ligne de la base de données, il ne peut pas avoir deux lignes et vous ne pouvez pas avoir la fusion et la séparation! Cependant, des données régulières autour de nous sont comme ceci:


Bien qu'il n'y ait pas de flux de données répétitifs, c'est irrégulier; Il peut être sur la fiche de données dans Excel, mais ne peut pas être une fiche technique dans la baseQu'il s'agisse. Nous entrons sur les données dans la plate-forme d'analyse Tableau, l'interpréteur de données Split, vous ne pouvez pas déterminer la ligne de titre par défaut!

Comment surmonter les mauvaises habitudes d'Excel, entraînant des exigences de normalisation pour une analyse de données importante (premier modèle)? Il y a plusieurs guides observés:
Il n'y a qu'une seule ligne de titre et dans la première ligne;

Titre ou données, ne fusionnez pas les cellules;

Il y a l'une des écoles les plus importantes (attributs), pas vide, d'autres écoles en dépendent.

Conformément à ces principes, nos données Excel deviendront une table de base de données qui répond aux exigences minimales des normes; Ceci est également la base de toutes les bases de données associées - toutes les tables de base de données ont qu'un seul titre par données mobiles est unique, le numéro de série est la propriété principale, assurez-vous que chaque ligne n'est pas répétée.




Si vous souhaitez conserver des informations supplémentaires supplémentaires (comme NGTÀM Export, horloger) est utilisé pour imprimer, vous devez utiliser "Titre / Footer" pour définir ou insérer temporairement des éléments supplémentaires à imprimer.

Pour Excel "Old Driver", ce processus de normalisation est très bon, pour d'excellents nouveaux arrivants, je recommande aux gens de lire "Vous devriez jouer à Excel" (ON), c'est icèle l'illumination après avoir obtenu son diplôme Travail du collège, jusqu'à présent, cela profitera.

3 requêtes et analyses, mais ne garantissent pas la performance et la qualité de l'analyse des données. Pourquoi? Étant donné que le premier modèle ne résout que la redondance des données de la table, il ne peut pas résoudre le problème comme la sauvegarde de la scène, par exemple y compris de nombreuses écoles, de nombreuses écoles du destinataire, le contenu de la réception dépend du contenu de la "alimentation" (dépendance des données ), entraînant un grand nombre de répétitions de données (plus d'informations aura plus d'informations) et des tambours de données (lorsque les repas internes, le destinataire de l'information de tambours), c'est aussi un excédentL'excès d'informations sur la table de base de données, mais ne peut pas être résolu par le premier modèle.


Résoudre ce problème, nécessite le deuxième modèle (2NF) de la spécification de données de référence et ses exigences sont
pour répondre aux exigences du premier modèle.

Il n'y a aucune existence de dépendances.


Par conséquent, pour améliorer l'efficacité de stockage de la base de données, la conception de la base de données doit définir une fiche technique pour des données à charge partielle, telles que des informations client à partir des commandes de commande, des informations distinctes ne sont qu'un codage unique (tel que des membres). et le nombre de séquences de réception est conservé dans l'ordre. Bien entendu, ces choses ont dépassé la portée des analystes de données, dans le cadre des architectes de base de données ou de base de données; Comprendre ces contenus peut nous aider à mieux comprendre l'analyse des données.
Ici, comprenez le deuxième modèle, aidez-nous à comprendre "la connexion de données" (participation) populaireL'abeille analyse les données importantes.Bien que nous ayons besoin de diviser les champs partiellement dépendants pour l'efficacité du stockage de données, nous devons souvent connecter plusieurs données de table, déploiement ainsi une analyse croisée de données croisées et une connexion de base multiples, est l'école Notre Général ou ses principales propriétés.Avec Tableau Prep, nous pouvons facilement connecter, facilement régler et voir visuellement les résultats de la connexion de données.









. ] Excel est le travail le plus élémentaire des employés de service, comprenant les exigences de base des spécifications de base de données et les habitudes de développement utilisant Excel Good pour comprendre plus efficace. Outils d'analyse pour les grandes données.

Sujets

Catégories