Skip to main content

Qu'est-ce qu'un entrepôt de données?
En fait, lorsque de nombreuses entreprises effectuent des entrepôts de données, ils ont ignoré la différence entre numérique et bi, bases de données, uniquement pour participer à des données de base et irréel indiquant des données et des données d'application, en fait, les données d'entrepôt sont sournois ..
L'entrepôt de données peut être considéré comme la version de base de BI, la version de mise à niveau de la base de données nous pouvons imaginer les données de la société dans un répertoire, cette base de données est un fichier qui est le fichier d'armoire, cette armoire de fichier A beaucoup de données, quelles que soient ces données, ou comment ces données sont, ou comment l'organisation. Et lorsque nos fichiers sont compliqués, lorsque nous voulons trouver un dossier, si chaque armoire est à la recherche de toutes les armoires de fichiers, vraiment coûteuses, nous pouvons donc souhaiter configurer une salle de fichiers, un nombre de fichiers différents. Armoires, classification et groupes, de sorte que nous localisons rapidement les sources de données, cette salle de stockage est un entrepôt de données. Donc, à ce stade, nous avons besoin d'un entrepôt de donnéesPlus grand pour nous aider à enregistrer les données de base de données de plusieurs sources de données et le processus de source de données peut être interprété comme le travail de l'ETL, alors comprenez que les données commerciales architecturales seront simples.
Par conséquent

La nature de l'entrepôt de données est en réalité intégrée aux données historiques de nombreuses sources de données pour une analyse fluide et multidimensionnelle

pour aider les cadres supérieurs ou les analystes commerciaux à faire une décision de stratégie commerciale. Ou rapport d'entreprise.

Ceci est lié à l'architecture de l'entrepôt de données. Un entrepôt de données simple est divisé en quatre niveaux: Classe ODS: Storage RAW Data, téléchargez directement les journaux d'origine, les données, les données de copie d'origine, ne traitent pas.

DWD CLASSE: La structure correspond à la table granulaire originale, nettoyant les données de la classe ODS CLASS

DWS: Basée sur DWD, Sommaire de la lumière

AD Calques: Fournissez des données pour les journaux Statistiques différentes
Ici, faites attention à l'architecture architecturaleLes métadonnées de chaque système sont synchronisées dans l'entrepôt de données d'opération ODS par l'ETL et les données ODS utilisées pour former DW (entrepôt de données), DM est pour un certain nombre de domaines d'activité qu'il est prévu de configurer des modèles, des utilisateurs spécifiques (couches de décision ) voir les rapports générés par la DM.

Ce sont les données que nous avons constatées à ne pas être extraites directement à partir de bases, ce qui nous équivalent pour accéder à l'entrepôt de données, de sorte que l'administrateur de la bibliothèque vous aide à trouver une armoire de fichiers. Comment est-il plus efficace et faible? Aller, est une partie très importante du bâtiment de l'entrepôt de données -
Modélisation de données y compris le modèle de stockage de données, le modèle logique, le modèle conceptuel, V.V. Lundi, mode modèle d'entrepôt de données

Parce que le modèle de données de construction constitue une partie très importante de la construction d'entrepôts de données, alors comment construire des tissus Notre entrepôt de données est un problème dont nous avons besoin pour résoudre. Ici, nous annoncerons des détails sur la façon de faire du travailo Modèle de données adapté à vous.

(1) Architecture de données de données d'entrepôt de données


Architecture du modèle de données d'entrepôt de données et d'architecture globale des entrepôts de données Lien serré, veuillez comprendre certaines pièces doit être incluse dans le modèle de données de l'ensemble de l'entrepôt de données. À partir de l'image ci-dessous, nous pouvons clairement voir que l'architecture de l'ensemble du modèle de données est divisée en 5, chacune d'entre elles a sa propre fonctionnalité unique.

À partir de l'image ci-dessus, nous pouvons constater que le modèle de données de l'ensemble de l'entrepôt de données peut être divisé en environ 5: Systèmes de noms de domaine: cette section héberge les principales données de stockage de données de données, modèle Les données sont celles-ci comme la consistance des données.

Domaine de gestion interne: Cette section stocke principalement les entrepôts de données pour la gestion interne et les modèles de données peuvent aider à gérer des métadonnées unifiées.

Sommet: Cette partie de données provient d'un résumé du domaine de l'enregistrement du système etLe modèle de données assure la performance d'analyse des performances de l'analyse de domaine, une réponse de requête de rapport partielle.

Domaine d'analyse: Cette partie du modèle de données est principalement utilisée pour une analyse de secteur de thème spécifique de chaque partie de l'entreprise. Cette partie du modèle de données peut être stockée séparément sur le marché des données correspondant.

Domaine de rétroaction: options facultatives, cette partie du modèle de données est principalement utilisée pour les données de retour de la fin de l'extrémité avant et l'entrepôt de données peut définir cette zone en fonction des besoins du karma articulaire.


Par la division de la zone de données de l'ensemble du modèle d'entrepôt de données, nous pouvons comprendre qu'un bon modèle de données n'est pas seulement la division abstraite de l'entreprise, mais également à une technologie actuelle réelle, elle devrait inclure de nombreuses parties de l'entreprise pour effectuer une technologie.

(2) Étape modèle de l'entrepôt de données

Nous avons introduit certains niveaux de modèles d'entrepôt de données, en parlent, pour les niveaux Ceci, contenu de contenuNH de la modélisation des données de différentes étapes:

De l'image ci-dessus, nous pouvons clairement voir que la modélisation des données des entrepôts de données est divisée en quatre étapes: Modèle commercial, modélisation de cette section, principalement comprenant les entreprises , etc. Mode conceptuel, cette section est modélisée, comprenant principalement la collecte de principaux concepts commerciaux, des groupes, des concepts de groupe de raffinage, formant des modèles de concept scolaire complètes

des tissus logique image, cette section de travail de modélisation, notamment le concept physique de Business, entité, indique que la modélisation physique

Modèle de physique


Mots le haut de notre entrepôt de données à toutes les étapes, nous pouvons en apprendre davantage sur le modèle principal des entrepôts de données au travail et la charge de travail, j'espère nous aider à nous aider. Pour nous aider à créer un véritable projet.

(3) Méthode de modélisation de l'entrepôt de données

Loi type paradigme
Méthode du modèle paradigmeVraiment une méthode permettant de créer des modèles de données, cette méthode est principalement annoncée par Inmon, principalement pour résoudre le niveau des relations de base de données de données techniques et utilisez un niveau technique. Actuellement, nous utilisons la plupart des modes de modèle dans des bases de données relationnelles.

L'avantage maximal du modèle commence à partir du point de vue des bases de données relationnelles, associée au modèle de données du système commercial, plus pratique pour effectuer des données de modélisation de l'entrepôt. Cependant, ses inconvénients sont également clairs. Étant donné que la méthode du modèle est déterminée au-dessus de la base de données relationnelle, à certains moments, il limitera la flexibilité, la performance, le V.V. de l'ensemble du modèle d'entrepôt de données, en particulier des données de base des entrepôts de données pour les données de marché. Lorsque des données sont résumées, certaines tâches doivent être effectuées pour répondre aux besoins correspondants. Taille de modélisation de la loi


Méthodes Taille de modélisation, KIMBALL First OffreT ce concept. La description la plus simple consiste à créer un entrepôt de données et un marché de données en fonction des tables et des tailles réelles. Le nom le plus connu de cette méthode est un schéma d'étoiles.

L'architecture de

est une architecture d'étoiles typique. La raison pour laquelle le modèle d'étoile est largement utilisé est pour une grande quantité de prétraitement pour chaque dimension, telle que les statistiques précédentes, la classification, le tri, le V.V. Grâce à ces prétraitements, il est possible d'améliorer considérablement la puissance de traitement de l'entrepôt de données. Surtout pour les méthodes de modèle 3NF, les modèles d'étoiles occupent un avantage significatif dans la performance

La méthode de modélisation réelle


Les formes sont présentées sous la forme d'une statue de mouton, si nous décrivons une pratique simple: "Donnets de xiaoming à l'école à l'école. "Prendre cette affaire comme exemple, nous pouvons voir" Xiao Ming "," l'école "est une entité" aller à l'école "est un processus métier, nous pouvons abstraction comme un" incident "spécifique ici et" DRI"Il peut être considéré comme une explication de l'événement" Top School ".

En raison de l'organisation de casting, la division des modèles d'entreprise peut être facilement reconnue. Par conséquent, dans le modèle de modélisation de l'entreprise et modèle conceptuel de terrain, méthode de modélisation méthodologique a Un large éventail d'applications. De l'expérience de l'auteur, aucun modèle industriel n'est produit prêt, je peux utiliser notre modèle d'entité et notre méthode client avec le modèle de l'ensemble de l'entreprise, des parties du modèle conceptuel de l'école, du concept d'entreprise spécifique abstrait, de la combinaison d'invités éléments de caractéristiques, vous pouvez créer un modèle de base de données pour vous rencontrer.

Mardi, le processus de construction de l'entrepôt de données

1, étude de modèle:
L'information de l'étude est la base de la conception logique modèle, la conception de modèle physique et la cartographie de données. La qualité des entrepôts de données est toujours déterminée pendant la phase de conception de modèle.
Cette étape, nous chLes travaux de faiblesse consistent à identifier de vrais problèmes d'affaires, à des problèmes de leadership de KPI et n'ont maintenant aucun problème à l'avenir, ce qui est au cœur des entrepôts de données. Cette méthode consiste à étudier, y compris les employés d'entreprise, les dirigeants de communication continus, les enquêtes continues et les problèmes de production.

2, modèle de modèle de domaine modèle: Définition du domaine du domaine, principes d'adhésion, spécifications de traitement des données et classification de base détermine le cadre principal du modèle de données, conservez le modèle de données. La stabilité. La stabilité. La stabilité du cadre principal assure la stabilité de l'entrepôt.

3, modèle conceptuel de conceptuel:

Conception d'attribut d'entité détaillée, un grand nombre de règles de vérification des règles d'analyse de données, modèle de modèle conçu la ville dans une brève carte de données du modèle de données logique

4, Conception de données de modèle logique: Fournit une structure de données, des dictionnaires de données précis et complets, un dictionnaire de données principales xdial et parfait, réponse des données d'échantillon des besoins analytiques;Et des questions opportunes et précises dans l'échantillon d'analyses Réponse de l'échantillon à la piste

5. Conception Modèle de stockage physique: Les parties prenantes pour combiner les entrepôts pervers par le consensus, qui inclut les données actuelles pour répondre aux besoins actuels, mais Il existe également une certaine transition - le facile à optimiser, doit fonctionner 6, Évaluation de la conception de l'optimisation des modèles: La conception du modèle est un esprit d'équipe de coopération multijoueur, est un processus qui continue d'élargir les améliorations évolutives,Spécifications de la conception de modèle de communication de suivi, méthodes personnalisables Le même modèle est très important.

Sujets

Catégories