Skip to main content

Méthodes d'architecture de construction et d'entrepôt de données (partiellement)

1. Aperçu de l'entrepôt de données

1.1. L'entrepôt de données a provoqué

Avant de créer un entrepôt de données, des données dispersées dans l'entreprise dans la conservation des données de chaque département, une relation commerciale complexe entre elles. Dans l'ensemble, c'est comme une araignée géante Web: la structure de l'intoctrine, mais elle a quatre passes. Une entreprise unique pratique à utiliser dans les applications de données d'entreprise et plus flexible; Mais liée au service croisé, l'application générale existera:


1 Source de données Devital, décision de gérer des données trop dispersantes;
2 DONNÉES Manque de normes, intégration des difficultés;
3 signaux de désensité, faible fiabilité;
4 Manque de systèmes de contrôle des données, la qualité des données est difficile à sécuriser.

Si la société n'a pas la planification de la planification de données complète, comment faire de l'évolution naturelle, alors dans le processusApplications de données futures, les problèmes suivants sont confrontés à:

[


Manque de données de réputation: taille uniforme manquante; Il existe des différences dans les algorithmes de données; Multirsevel; Problèmes de données externes; Il n'y a pas de source de données publique initiale;

Faible productivité: nécessité de suivre toutes les données pour créer une entreprise de reporting; Les données de positionnement doivent parcourir plusieurs fichiers; Il existe de nombreux programmes extraits et chaque programme est personnalisé et doit surmonter de nombreux obstacles techniques.
La conversion de données est l'incohérence des informations: les données ne sont pas intégrées; Manque de données historiques nécessaires pour convertir des données en informations.
Sur la base des problèmes susmentionnés, la nécessité d'établir un entrepôt de données de niveau d'entreprise manufacturé.

1.2. Data Warehouse Development

Données fondatrices Entrepôt: MIT (MIT) a fait beaucoup de recherches dans les années 1970. Une série de protestations de test final proposées pour séparer les systèmes KINH.Systèmes d'affaires et d'analyse, manipulation et analyse des affaires à différents niveaux. C'est-à-dire les conclusions suivantes: le système d'analyse et le système commercial ne peuvent être traités qu'avec des architectures et des méthodes de conception complètement différentes.

Principes, architecture et spécifications des entrepôts de données: 1988 IBM suggéré "Store d'information", l'objectif est de résoudre les données d'entreprise à problèmes intégrées, dans la conception de "environnement structuré, utilisateur final Soutenez toutes leurs entreprises et soutenir les pièces technologiques de l'information pour assurer la qualité des données. »IBM n'utilise que ce concept avancé pour propager le marché et n'inclut pas la conception architecturale pratique.

Entrepôt de données officiel proposé: En 1991, Bill Inmon a publié le premier livre "Building Warehouse Warehouse", proposant un concept d'entrepôt de données et expose pourquoi l'entrepôt de données est défini etFournit également des bases de données de construction. Méthode.


1.3 Définition de l'entrepôt de données

L'entrepôt de données est un sujet, intégré, relativement stable, reflétant le changement historique (collecter des données sur le temps des modifications de données). Il soutient principalement l'analyse de la décision du personnel de gestion des entreprises. L'entrepôt de données collecte une série de données historiques relatives aux sources de données, archives et à la transformation des informations stratégiques en fonction des exigences de l'entreprise.

1.3.1. Caractéristiques de l'entrepôt de données

Âge: La base de données d'exploitation est généralement traitée principalement et toutes les données de l'entrepôt de données sont souvent divisées par sujet. Le thème est une abstraction de données commerciales, résumées et organisées à partir de données dans le système d'information à un niveau supérieur. Les données orientées topiques peuvent être divisées en deux parties - à extraire et à déterminer le contenu de données deg Objets en fonction des caractéristiques des données d'origine du système d'origine. Par exemple, des objets clients, des sujets de produit, des sujets financiers, V.V.; Et les sujets des clients incluent des informations de base des clients, des informations de crédit client, des informations sur les ressources clients, V.V. Lors de l'analyse de thèmes d'entrepôt de données, la méthode générale est d'abord à définir un certain nombre de thèmes de base, puis développer la plage et cherche éventuellement collapsus en profondeur: des bases de données d'exploitation normales homogènes et indépendantes, il ne peut donc pas être résumé et reflété dans la nature de la nature de la nature. information. Les données de l'entrepôt de données extraient des données, du nettoyage, de la commutation, du téléchargement, afin de garantir que les données n'existent pas, les données doivent être cryptées et nécessaires pour résumer les données pour assurer la cohérence du calcul des données dans l'entrepôt de données. Entrepôt de données Après l'expérience de la phase d'intégration des données, la création de données dans les entrepôts de données est conforme aux règles de cryptage uniformes et éliminant plusieurs données excédentaires.


Stabilité: les données de stockage de données reflètent le contenu de données de l'heure de l'historique. Son activité principale est la requête, l'analyse et non dans des mises à jour générales. (La base de données fonctionne avant que l'intégration des données termine l'augmentation des données, des modifications, des suppressions et des requêtes). Lorsqu'une données entre dans l'entrepôt de données, les données seront réservées pendant une longue période et le temps prédéfini sera supprimé. Habituellement, le travail doit être effectué dans l'entrepôt de données de chargement, la requête et l'analyse, n'effectuez généralement aucune opération modifiée, utilisée pour utiliser l'analyse des personnes âgées des personnes âgées.
reflète les modifications historiques: entrepôt de données continu du type de base de données d'exploitation ou une autre source de données pour obtenir des modifications, des analyses et des prédictions des données historiques nécessaires, donc le code de verrouillage (dimension) des données La feuille dans le référentiel de données communes comprend des clés de temps pour indiquer le temps historique des données, puis augmenter le contenu de la teneur en LI.Nouvelle. Ces informations historiques peuvent être analysées et prévisibles pour l'histoire du développement et la tendance de la société. La construction d'un entrepôt de données nécessite de nombreuses données commerciales telles que l'accumulation et ces précieuses informations historiques sont traitées, organisées et fournies enfin aux employés de l'analyse des décisions, voici le but de base de la construction d'entrepôts de données.


1.3.2. Avantages de l'entrepôt de données

Informations Trafic après l'intégration des données

Utilisation des données de partage améliorées

Gérer la centralisation des données, la source est unique
Formation One View, Standardiser les données

Système de contrôle de données, qualité de données garantie

1.3.3. Composition de l'entrepôt de données

De nombreuses sources de données

Extrait de données, Conversion, importation (ETL) Données de fonctionnement et analyse Données de données
Modèle de thème

Données de données

Rapport, demande, outil EIS (High -end Système d'information - Servir des gestionnaires haut de gamme CLe système d'information spécial de l'Organisation peut fournir des informations complètes et complètes d'informations intuitives (graphiques)

Outil OLAP
Outil d'exploration de données

Gestion de la qualité des données
Normaliser les données



Éléments de données Caractéristiques Construction d'entrepôt

Data Warehouse Project n'est pas un projet technique de premier plan, un grand projet intégré, des méthodes plus importantes et des projets d'entrepôt de données nécessite un entrepôt. PROJETS Les données de construction continues nécessitent une recommandation d'échéance et d'amélioration constantes pour différentes étapes de mise en œuvre des exigences techniques et des organisations d'entreprises architecturales qui combinent étroitement des projets d'entrepôt qu'il est nécessaire de renforcer les activités de cet entrepôt de données de projet à long terme nécessite une gestion efficace. Mécanisme

1.4. Entrepôt de données et système de gestion de données différent


1.4.1 Différences de données de différence etBase de données

Entrepôts de données et bases de données Différents: bases de données sont un traitement de données de transaction, une orientation de l'application, un temps réel réel, une connexion plus faibles, stocke uniquement les données actuelles, les fréquences d'accès élevé, les courtes exigences du temps de réponse, principalement Les utilisateurs normaux et les quantités sont caractérisés. L'entrepôt de données concerne principalement le thème, l'analyse de traitement des données, avec des exigences en temps réel, une grande récupération de données, un grand nombre de données historiques et des données actuelles, une fréquence d'accès faible, une rétroaction de temps plus longue, principalement pour les groupes d'utilisateurs spéciaux, le nombre de petits utilisateurs . L'analyse et les transactions de traitement des données sont différentes:

Tout gère les informations sur les performances strictes, les transactions contrôlées par des données, principalement le stockage appliqué, a souvent déclaré que le général est en temps réel, des données détaillées et des données sont mises à jour. L'analyse de traitement des données a généralement des exigences plus élevées sur la performance de la requête, les données distribuéesL'intégration, principalement pour l'analyse décisionnelle, le stockage est généralement des données historiques, un résumé, des données ne sont généralement pas mises à jour.

1.4.2. Différence de données et différence SAO

1, Définition ODS SAO est un tel système de stockage de données provenant de différentes sources de données (différentes bases de données d'exploitation, en dehors de la source de données, etc.) axée sur le sujet, l'intégration, la mise à jour. , actuel ou proche du courant, et principalement les données détaillées et les données détaillées les plus proches et les données sommaires possibles), d'accord à respecter les activités OLAP et les entreprises mondiales d'activités OLTP d'entreprise et fournir des données intégrées pour les entrepôts de données et les processus ETL dans l'entrepôt de données système dans les SAO. Réduire la pression de l'entrepôt de données.


2, Fonctions ODS

Orientation des données - Saisie de données ODS extraites de différentes bases de données actives et d'autres sources de données externes, entrez des données avant que les SAO ne doivent transférer via le processus ETL; Données intégrées-ODS est tiré de différentes bases de données d'exploitation et effectuera également un certain niveau de synthèse après le nettoyage des données; Peut être mis à jour --- peut être modifié en ligne. Ceci est différent de l'entrepôt de données; Accès actuel ou actuel - "Courant" signifie que les données sont les dernières à cette époque, "approche" désigne les données sont reçues au cours de la dernière fois.

3, la différence entre ODS et DW

1 Différentes données stockées: SAO est principalement stockée dans des données actuelles ou fermées, le mal aura des détails, peut procéder à des mises à jour en ligne. Les données détaillées et les données historiques sont principalement stockées dans DW, ainsi que des différents niveaux de données intégrés et ne peuvent pas être mis à jour en ligne. Les données intégrées peuvent également être stockées dans SAO, mais elles ne sont créées que si nécessaire.

2 Différences de ratio de données: en raison de différents contenus de données stockés, les données DW sont beaucoup plus que des SAO.


Différent support technique: SAO doit prendre en charge les mises à jour en ligne dans une direction d'enregistrement et à tout moment pour garantir que leurs données correspondent aux données de la source de données. DW a besoin de prendre en charge la technologie ETL et la technologie d'accès rapide aux données.

4 besoins différents: SAO principalement pour deux besoins: premièrement, il est utilisé pour répondre aux besoins des entreprises pour mettre en œuvre des applications globales, les instruments peuvent être une entreprise OLP et OLAP instantanément; La seconde consiste à fournir un environnement de données cohérent pour les entrepôts de données pour extraire des données. DW est principalement utilisé pour des décisions stratégiques de haut niveau pour l'analyse d'exploitation.

5 utilisateurs différents: L'utilisateur principal SOP est un gestionnaire de lycée de l'entreprise, ils utilisent des SAO pour effectuer une gestion et un contrôle quotidiens. L'utilisateur principal de DW est un analyseur de données de haut niveau.

4, ODS dans la construction de l'entrepôt de données

Architecture à trois couches est couramment utilisé dans VIConstruire de grandes entrepôts de données, comme suit:

SOYS et DW Faites face à différents utilisateurs, il y a donc un rôle instable, les deux se sont combinés, se complètent. ODS joué dans une architecture à trois couches:

D'une part, SOP a établi une cohérence sur la base de données DB indépendante, la société a un environnement global, l'environnement de données dans la direction du système de DB d'origine à thème. D'autre part, les ODS proviennent de devenir une série de charges telles que l'intégration des données, la conversion de la texture. Les données DW sont complétées par ODS, qui simplifie beaucoup d'interfaces de transmission de données DW et de données complexes de données de gestion de DW, inutile dB ~ dw compensation, mais pas nécessaire, lorsque la société n'a pas besoin d'exploiter des informations intégrées, la DB ~ DW L'architecture à deux couches est meilleure, si nécessaire, puis db ~ ods ~ dw Trois-couche architecture mieux.

1.4.3. Marché des données et marché des données

1, Définition du marché des données

Les données sont un ensemble spécifique pour un certain nom de domaine de sujet, un certain nombre de pièces ou d'utilisateurs spéciaux, la collecte de données de classification peut également être dite comme un petit entrepôt de données.

2, l'entrepôt de données et la différence de marché des données

L'entrepôt de données est un type d'entreprise, peut fournir des véhicules décisionnels pour le fonctionnement des activités différentes parties de l'entreprise et Les données sur le marché sont un entrepôt de données miniatures, ont souvent moins de données, moins de sujets et moins de données historiques, de manière urgente, généralement seulement pour une partie. Le service de gestion est donc également appelé entrepôt de données ministériel. [123.

2. Architecture de l'entrepôt de données


2.1. Méthode de conception de données

Avant la définition de l'entrepôt de données, elle doit être prise en compte et elle doit être prise en compte. Trois autres déploiements de premier plan, tous en un et les deux.


2.1.1. Depuis la première diminution du déploiement doit remplir de nombreux projets et définirEH PLUS Au début du projet, cela nécessite une participation à l'entrepôt de données, chaque groupe de travail, ministère ou secteur d'activité de la mise en œuvre. Les sources de données, la sécurité, les structures de données, la qualité des données, les normes de données et l'ensemble du modèle de données et tout le modèle de données doivent être terminés avant de commencer.

2.1.2. Étant donné que le déploiement augmente au fond contient la planification et la conception de l'entrepôt de données, il n'est pas nécessaire d'attendre une autre gamme de conceptions d'entrepôt de données. Cela ne signifie pas qu'aucune portée plus importante de conceptions d'entrepôt de données; Avec le déploiement de l'entrepôt de données d'origine, il augmentera progressivement la construction. Cette méthode est actuellement plus largement acceptée que la méthode descendante, car les résultats directs de l'entrepôt de données peuvent être déployés et peuvent être utilisés comme une plus grande preuve d'expansion de la portée des entreprises.

2.1.3. Combiné avec une combinaison de combinaison d'une combinaison de chaque foisLa mise en œuvre est pratique. Dans de nombreux cas, la meilleure façon peut être une combinaison d'un ou deux. L'une des clés de la méthode consiste à déterminer l'architecture de la portée de l'entreprise nécessitant une prise en charge de la planification et de la conception intégrées, car l'entrepôt de données est construit à partir de la méthode de bas en haut. Lors de l'utilisation d'une variété d'ensembles de données dans l'architecture de la portée des entreprises avec un modèle d'entrepôt de données de self-up ou de stadification, vous pouvez simuler une rocheuse de données dans différentes entreprises, formant ainsi une bonne conception de données professionnelles. Conserver. Une telle méthode peut être utilisée idéale pour les entreprises. De cette manière, le marché des données peut être interprété comme le sous-ensemble logique de l'ensemble du système d'entrepôt de données et de l'entrepôt de données est un ensemble d'étiquettes de données.

2.2. Arguments de données sur l'architecture de l'entrepôt de données

À propos de Inmon et de Kimball Big PaLeate: Ralph Kimball et Inmon Inmon de Ralph Kimball et Inmon sont innocents dans des entreprises intelligentes, des joueursNouvelles technologies et tests de test et d'architecture. Dans le domaine de BI / DW, "Quel type d'architecture de données est le meilleur?" Le débat n'a pas été arrêté, cette question est également une question importante pour décider lors de la mise en place de la structure de données de données DW: Factory de Hub Inmon Data Architecture / ANTS Structure de bus de Data Structure de données est un débat clé de DW Architecture.

Inmin détermine l'entrepôt de données "Un thème, une intégration, aucune évaporation, une collecte de données modifie la gestion des processus de prise de décision"; Il a montré que les "données" thème "dans l'entrepôt de données devraient être détenues autour du sujet, telles que les clients, les ventes, les produits, etc. Chaque domaine de thème ne contient que des informations relatives au propriétaire. Titre. Data Warehouse ajoutera un sujet à un temps et lorsque vous devez accéder facilement à plusieurs sujets, vous devez créer un marché de données pour l'entrepôt de données comme source. En d'autres termes, toutes les données sur un marchéLes données spécifiques proviendront d'héberger des données d'orientation thématique. La méthode de Inmon comprend plus que les travaux ci-dessus pour réduire l'accès initial à l'information. Mais il croit que cette architecture centralisée continuera de fournir une cohérence et une flexibilité plus forte, et pendant longtemps, il sauverra vraiment des ressources et travaillera.

Ralph Kimball a déclaré: "L'entrepôt de données est simplement une combinaison de foires de données de composants", estime-t-il que "peut construire un marché de données avec la même direction. Base de données". Chaque marché des données répondra à de nombreuses sources de données pour répondre aux besoins spécifiques des entreprises. En utilisant la taille «cohérente», vous pouvez voir des informations sur différents marchés de données. La structure de l'entrepôt de données de KIMBALL est également un bus de données célèbre entrepôt de données (bus).


2.3. Choix de l'architecture d'entrepôt de données

Sélection de l'architecture de l'entrepôt de données, une relation étroite avec sDéveloppement d'une entreprise et d'un environnement d'entreprise: Méthodes de construction d'un entrepôt de données d'Inmon, Building Employee Data Warehouse Besoin de la constitution des développeurs de haut en bas et des entrepôts de données doivent mener des enquêtes approfondies dans les entreprises de tous les secteurs d'activité avant de créer des entrepôts de données, puis Compris, alors selon les entreprises avec le service de domaine thématique. Cette méthode de construction est relativement longue, une planification et une conception plus complexes, mais une fois que cette architecture centralisée fournira une unité et une flexibilité plus fortes, et sauvera réellement les ressources et travailler pendant longtemps; KIMBALL SUPPORT DE DONNÉES L'entrepôt de données n'est que les vues du marché des données et de chaque département ou entreprise peuvent créer un marché de données qui répond à ses propres thèmes en fonction de son propre développement et continue d'enrichir ces données. En réponse aux besoins des données commerciales, les informations de taille de ces données sont unifiées.An, puis connecte ces données avec des informations de taille cohérentes, permettant au marché des données de former un entrepôt de données, y compris toutes les pièces ou services de l'entreprise, fournissant des services.

Selon la vitesse du développement et du développement des affaires: tradition, les entreprises d'affaires matures peuvent envisager de construire des entrepôts de données dans la méthode inmon; Complexe commercial et plus grand, le développement des affaires et les entreprises très rapides peuvent considérer la méthode KIMBALL pour construire un entrepôt de données.


2.4. Bâtir des entrepôts de données dans le développement des entreprises

Nouvelles entreprises ou champs, moins d'entreprise au cours du développement précoce, des échantillons d'organisation relativement simples. Les employés numériques peuvent se tenir dans la hauteur totale, ignorer le processus métier de l'ensemble de la société, les brosser et extraire des modèles de données. Construisez un entrepôt de données de manière descendante. Par conséquent, pendant la constructionHO Données initiales, la méthode de construction d'un entrepôt de données pris en charge dans Inman essentiellement utilisé et la structure de DataSource - & GT; ODS → EDW → DM - & GT; application. C'est-à-dire que l'intégration de différentes sources de données de pièces est complétée par la classe ODS. Basé sur les ODS, tous les entrepôts de données uniformes contiennent de nombreux sujets, puis cet entrepôt de données unifié est la seule source de données pour chaque département. Le marché des données fournit un support de données.

Cependant, une fois que la société ou le service de développement est très rapide, le trafic rapide et les organisations d'affaires ont tendance à être compliqués et peuvent avoir une large distance entre différents services. La construction d'une donnée L'entrepôt apportera beaucoup de difficultés si continue de causer des blessures, telles que le plan complexe d'EDW en mode inonique, des cycles de construction longue et aucune réponse rapide aux besoins de chaque département. Le développement de la société. Adapter le développement de la société, par l'exécutionC Sonde continue de développeurs numériques, a essentiellement tendance à créer un entrepôt de données à l'aide d'un mode mixte, à savoir Inmon + Mode de variation kimball.

La plus grande différence par rapport à l'architecture d'origine est la source de données de différents marchés de données de pièces n'est pas le seul résultat d'EDW, qui provenant de sources de données de différentes parties. Classe ODS intégrée. La classe ODS intégrée est obtenue. Toutefois, certaines parties ont également participé à des statistiques de données à partir de secteurs cross-secteurs, de sorte que cette demande de données au niveau de l'entreprise est également tirée des entrepôts de données au niveau de l'entreprise. Il est également de soutenir de nombreux besoins professionnels de différentes parties; Entrez les besoins de données au niveau de l'entreprise, à partir de différents musées de données ou de classes ODS pour créer des modèles publics (par exemple, les commandes de la société, les utilisateurs, etc.) et ici la taille publique du marché est unifiée pour soutenir les besoins commerciaux de niveau commercialou entre l'industrie.
3. Données de modélisation dans la construction de l'entrepôt de données


Le modèle de données fait référence à la relation entre entités, attributs et entité, définition uniforme, concepts commerciaux nommés et règles logiques . Et le cryptage, décrivant principalement les règles de l'entreprise et les règles commerciales, est la langue des développeurs et des développeurs, qui constitue la première étape des conceptions d'entrepôt de données

Premièrement, nous devons résoudre trois problèmes: 1 Quel est le modèle de données; 2 Pourquoi vous avez besoin d'un modèle de données? 3 Si vous créez un modèle de données; Que pouvons-nous obtenir?

3.1. Modèle de données

est un modèle de données comme une description abstraite du monde réel, par l'intermédiaire d'entités abstraites et d'entités. Le formulaire de contact est de représenter une carte de la relation entre négociation dans le monde réel. La relation entre les entités abstraites et les entités du modèle de données ici, montrant cRelation commerciale spécifique malée dans la définition et la description de la relation entre entités et entités.

Data Warehouse Model est un modèle de données spécifique pour un système d'application de données spécifique dans le modèle de données. En général, notre modèle d'entrepôt de données est divisé en niveaux suivants: modèle d'entreprise, modèle scolaire (modèle de domaine de sujet), modèle logique, modèle physique. Par conséquent, l'ensemble du processus de modélisation de l'entrepôt de données nécessite généralement quatre processus:

Modèle d'entreprise: résout principalement la décomposition et la programmation du niveau commercial;
School (Nom de domaine du sujet) Modélisation: principalement le modèle économique effectue une manipulation abstraite, créant un modèle de concept de terrain (sujet de domaine de domaine);

Modèle logique: principalement pour enregistrer les hiérarchies dans la mise en œuvre de l'entité conceptuelle du modèle de domaine avec la relation entre l'entité;

Modèle physique: il résout principalement des techniques spécifiques de problèmes physiques etPerformance des modèles logiques.

Par conséquent, dans la conception et l'architecture de l'ensemble du modèle de magasin de données, elle est liée aux connaissances commerciales, également liées à des technologies spécifiques, il est nécessaire de comprendre l'expérience de l'industrie riche, mais également de certains information. La technologie pour nous aider à réaliser notre modèle de données et surtout, nous avons également besoin d'une méthode très applicable pour guider leur propre entreprise à résumé, à traiter et à créer des modèles différentes étapes.

3.2. Pourquoi avez-vous besoin d'un modèle de données

dans la construction d'entrepôts de données, nous avons souligné à plusieurs reprises le modèle de données nécessaire, puis le modèle de données est très important? Nous devons d'abord comprendre l'historique de développement de la construction de l'ensemble de l'entrepôt de données. Le développement de bases de données a subi trois processus de ce type:

Stade de reporting simple: cette période, l'objectif principal du systèmeLe système consiste à résoudre certains jours les normes nécessaires dans l'entreprise fonctionnent souvent et certaines données simples peuvent aider les dirigeants à prendre des décisions. La plupart de ces étapes sont une base de données et un outil de rapport avant.

Données Arts martiaux Étape: Cette étape repose principalement sur une certaine unité commerciale, une organisation, une organisation, en fonction des besoins du personnel des ventes et de la mise en œuvre de rapports multidimensionnels, et peut fournir des données pour des conseils d'entreprise spécifiques. Et peut fournir des décisions de leadership spécifiques.

Étape de l'entrepôt de données: Cette étape est principalement conforme à certains modèles de données et peut collecter des données de l'ensemble de l'entreprise et peut fournir des données complètes de rapport d'entreprise, entièrement liées et peut transférer des données en fonction des besoins de chaque unité commerciale. Le stockage des données contient des instructions sur les entreprises tout en fournissant un soutien complet de données pour les décisions de leadership.


Tong C

Mise en œuvre d'une carte de service globale, améliorant le processus métier. Au stade des modèles commerciaux de construction, nous pouvons aider nos agences commerciales ou de gestion à combiner les activités commerciales globales de cette unité. Grâce à la construction de modèles commerciaux, nous devrions bien comprendre les diagrammes d'architecture commerciale de l'unité et l'exploitation de l'ensemble de l'entreprise, peut faire des affaires selon des réglementations spécifiques et nous aider simultanément à améliorer les processus métier, à améliorer l'efficacité des entreprises, à guider les unités commerciales de production américaines.

Construisez une gamme complète de vues de données, supprimez les îlots d'information et les différences de données. Grâce à la construction d'un modèle d'entrepôt de données, peut fournir un angle de visionnage global pour les entreprises. Aucune partie de l'unité ne fait plus attention à ses propres données et à la modélisation, relie les champs connectés pour aider à supprimer les informations entre les pièces. QuestionLe titre de l'île est plus important. Grâce à la construction du modèle de données, la cohérence des données de la société peut s'assurer que la différence entre les données entre différentes parties sera une résolution efficace.


Résoudre les changements dans l'entreprise et la flexibilité de l'entrepôt de données. Grâce à la construction du modèle de données, il est possible d'isoler la mise en œuvre de la technologie de base et de présenter sur l'entreprise ci-dessus. Lorsque l'entreprise change, via le modèle de données, le déploiement technique de base peut être très facile à compléter les changements commerciaux, gagnant ainsi la flexibilité de l'ensemble de l'entrepôt de données.

Faites de l'aide pour construire un système d'entrepôt de données. Grâce à la construction de modèles d'entrepôt de données, les développeurs et les entrepreneurs peuvent facilement obtenir la définition de la construction du système et des objectifs à long terme, permettant à l'ensemble de l'équipe de projet de clarifier la tâche actuellement, accélérerez ce système.

3.3. Comment créer des modèles de données

Modélisation Modèle EvilEst-il divisé en quatre étapes:

3.3.1. Le modèle d'entreprise est déterminé à connaître, le modèle économique est l'échantillon le plus élevé des données complétées:

L'ensemble de l'unité est souvent basé sur la division de l'entreprise et les travaux commerciaux de relations entre différentes parties sont supprimés;

Une compréhension profonde de parties spécifiques de chaque partie des unités commerciales de processus et de procédures commerciales;

Proposer comment modifier et améliorer le processus de travail des unités d'entreprise et de la programmation;
La gamme de modélisation de données est déterminée et ce projet d'entrepôt de données est divisé en étapes.

3.3.2. Concept de l'école (Nom du domaine du sujet) Modèle

Le sujet principal entre le thème de l'entrepôt de données de domaine et la relation entre services importants. En général, le personnel de conception et de développement et les hommes d'affaires ont gagné un consensus du domaine thématique en concevant et en développant des modèles commerciaux antérieurs et des modèles de domaineLe thème reflète les questions fondamentales d'affaires. Les étapes pour concevoir le modèle de nom de domaine thématique comme suit:

basé sur la modélisation d'entreprise, d' importants thèmes de données d'affaires, y compris les explications détaillées des entreprises de sujets de données;

Sur la base de la division des thèmes de données d'affaires, y compris une explication détaillée des domaines thématiques de données;

Modèle du concept de domaine thématique est divisé par sujet: selon le thème des données, affiner la structure organisationnelle interne et relations d'affaires.


Le processus de modélisation dans le domaine des thèmes peut être divisé en les sections suivantes: Dans le procédé de modélisation d'activité dans la période précédente, le système d'entreprise a été peigné. Selon les caractéristiques de chaque entreprise, la liste des sujets de données détaillées cotées en bourse et chaque thème de données est faite en détail, puis fait, classé, classés dans les noms de domaine d'hôte différents sujets de données, liste les parties de chaque thème de données et quiz explication détailI avec chaque champ de thème de données, finalement divisé dans le modèle de concept de domaine thématique.

3.3.3. Modélisation logique

Dans la définition, le modèle logique basé sur le modèle conceptuel et le modèle conceptuel est raffiné et décomposé plus loin. Les modèles logiques sont un pont et un contexte pour les employés d'entreprises et de techniciens pour communiquer avec les employés et les techniciens des besoins commerciaux par le biais d'entités et d'entités. La conception du modèle logique est l'étape la plus importante pour déployer des entrepôts de données, car il reflète les besoins réels et les règles commerciales des unités d'entreprise, et dispose d'un guide dans la conception et de la mise en œuvre de modèles physiques. Son fonctionnalité consiste à décrire les conceptions de données et les règles de l'ensemble de l'entreprise grâce à la relation entre entités et entités. Le domaine thématique du modèle conceptuel est généralement le modèle commercial du modèle économique du modèle d'entreprise du système d'information et des entreprises industrielles HIOui de la société. En plus du modèle de concept, le modèle logique est riche en modèle conceptuel et déterminer quel sujet est inclus dans chaque domaine, il est également requis:

Demande d'analyse et de liste de liste, des besoins de la cible, de l'indicateur de dimension, de la taille Niveau, marqueur d'analyse, méthode d'analyse, source de données, objet de note, etc.

Sélectionnez des données intéressées par les utilisateurs, séparant les indicateurs requis à analyser conformément aux exigences de l'entreprise, convoquant un modèle logique nécessaire.

Dans l'entité, il est nécessaire d'augmenter les propriétés de l'horodatage car les données d'historique dans la phase frère sont nécessaires dans l'entité. Habituellement, si l'entité est le même code, il n'est pas nécessaire d'ajouter des propriétés d'horodatage.

Nécessité de considérer la division de niveau de détail. Le niveau de détail des entrepôts de données affecte directement les modèles d'entrepôt de données et les modèles de données de grain fins sélectionnant souvent des entités comme modèle logique du modèle d'entreprise, tandis que les tissusLa taille des données de grains brutes doit être résumée pour obtenir les entités correspondantes. La taille des particules détermine le déploiement, la performance, la flexibilité et l'entrepôt de données de l'entrepôt de données d'entreprise.
Sur la base de la hiérarchie de la taille des particules, la définition du régime de relations est également tenue de former la relation entre chaque entité, entité et attributs d'entités. Dans le même temps, sur la base d'un cadre de modèle logique, il est clairement reflété, réalisé et reflète les relations logiques commerciales et les règles commerciales sur la base du cadre de modèle logique.

3.3.4. Modèle physique

Sur la base du modèle logique, la structure physique appropriée est sélectionnée pour appliquer l'environnement de production, y compris la structure de stockage et la méthode de stockage appropriée., Appelé modèle physique. Le convertisseur de modèle logique en un modèle physique comprend les étapes suivantes:


L'entité devient une table

Le nom de la propriété (attribut) est converti dans une liste (colonne), identifier les propriétés de la colonne (créditsh)

Le modèle physique doit être clairement défini, notamment: noms de colonne, types de données
Après la détermination du modèle physique, l'emplacement du stockage de stockage et de stockage de stockage peut être déterminé ultérieurement.
3.4. Méthode de modèle d'entrepôt de données

3.4.1. Mode de construction d'entité

Modélisation de l'entité n'est pas une manière courante dans le modèle d'entrepôt de données qu'il provient d'une catégorie philosophique. Selon la philosophie, le monde objectif sera en mesure de diviser, le monde objectif pourra être divisé en une relation entre une entité et une entité et une entité. Après cela, vous pouvez introduire cette méthode abstrait lors de la modélisation du stockage des données et l'ensemble de l'entreprise peut également être divisé en une entité et une relation entre chaque entité et une description des termes de cette relation, est la nécessité de modéliser nos données. Le travail a terminé le travail égal à.


Bien que la modélisation de l'entité semble être une résumé,C'est facile à comprendre. C'est-à-dire que nous pouvons diviser n'importe quelle entreprise en 3 parties, entités, événements et instructions.

L'image ci-dessus est une signification du symbole, si vous décrivez une pratique simple: "xiaoming drive à l'école à l'école." Prendre cette affaire comme exemple, nous pouvons voir "Xiao Ming", "école" comme une entité "à l'école" décrite comme un processus métier, ici peut abstraire comme un "incident" spécifiquement et "conduire" comment voir un Description de l'événement "School".


de l'exemple énumété ci-dessus, nous pouvons utiliser la méthode résumé abstraite. C'est vraiment simple. Toute entreprise peut être considérée comme 3 parties:


Entités: faire référence au concept de concept de méthodes de construction dans le moule, faisant référence à un objet qui se produit. Relation d'affaires; Événements: le processus d'achèvement d'un processus métier entre l'agence conceptuelle faisant référence à un processus métier spécifique; Description: principalement pour le vrai Thpour et l'événement.

En raison de la méthode de modélisation de l'entité, il est facile d'atteindre la division Modèle d'entreprise. Par conséquent, dans la phase de modélisation des entreprises et la phase de modélisation de terrain, la méthode de modélisation de l'entité comporte une large gamme d'applications. En général, en l'absence d'une modélisation de l'industrie existante, la méthode de modélisation de l'entité peut être utilisée et le modèle de l'ensemble de l'entreprise sera effacé avec le client. La division du concept d'école est effectuée, un concept d'entreprise spécifique abstrait, associé aux caractéristiques des clients, il peut créer un modèle de base de données qui se réunit.
Cependant, la modélisation de l'entité a également ses propres défauts de naissance. Parce que la description de l'entité est juste un événement objectif abstraite, il est prédéfini pour limiter la méthode de modélisation avec le modèle de modèle modèle et le modèle de modèle de concept scolaire. Par conséquent, à la phase de modélisation raisonnable et de phase de modèle physique, c'est le modèle du modèle modèleNH Modèle et taille de modélisation.
3.4.2. Modèle modèle paradigme

La méthode de modèle parallèle est vraiment une méthode d'utilisation de nos modèles de données généraux, la méthode principale proposée par Inmon, principalement des méthodes de stockage de données dans les relations de base de données, en utilisant un niveau technique. Actuellement, les méthodes de modélisation dans des bases de données relationnelles, la plupart d'entre elles sont trois modèles de modèles de modèles.

Paradigm est la théorie de base de la conception du modèle logique de la base de données et un modèle relationnel ne peut pas détruire à partir du premier paramètre au troisième modèle, peut également être appelé standardiser. Dans la conception de modèle de l'entrepôt de données, le troisième modèle est souvent utilisé et il a une définition mathématique stricte. Du Signification de son expression, une relation qui répond au troisième modèle doit avoir trois conditions:


Chaque valeur d'attribut est unique, sans polygones; Chaque attributLe fait doit être rempli en fonction de la touche clé entière, pas une partie de la clé primaire; Chaque attribut non principal ne peut pas s'appuyer sur des attributs d'autres relations, car cet attribut sera renvoyé à d'autres relations.


Selon la perspective Inmon, la méthode de construction de modèles d'entrepôt de données et de systèmes commerciaux de données similaires de la société. Dans le système d'entreprise, le modèle de données d'entreprise détermine la source de données et le modèle de données d'entreprise est divisé en deux niveaux, à savoir les modèles de domaine de la rubrique et les modèles logiques. De même, le modèle de domaine de sujet peut être considéré comme un modèle conceptuel du modèle économique et le modèle logique est l'initialisation du modèle de domaine sur la base de données relationnelle.

Lorsque le modèle de données d'entreprise est transféré au modèle d'entrepôt de données, il est également nécessaire de disposer du modèle de domaine de l'entrepôt de données, du modèle conceptuel et du modèle logique du modèle de domaine. Ici, modèle de données dans le modèle d'entreprise et modèle d'entrepôt de donnéesLégèrement différent. La principale différence est la suivante:

Le modèle de domaine de l'entrepôt de données doit inclure la relation entre le modèle de domaine du modèle de données d'entreprise et chaque modèle de domaine est déterminé. Le concept de modèles de domaine des entrepôts de données doit être plus large que le modèle de domaine thématique du système d'entreprise. Le modèle logique de l'entrepôt de données nécessite des entités abstraites, des attributs, des organisations et des entités.

L'avantage maximal du modèle paradigme commence à partir d'une perspective de base de données relationnelle, associée au modèle de données du système d'entreprise, plus pratique pour effectuer des données de modélisation de l'entrepôt. Cependant, ses lacunes sont également claires. Parce que les modèles sont limités à des bases de données relationnelles, à un moment donné, tournez la flexibilité, la performance, la performance, le V.V. de l'ensemble du modèle d'entrepôt de données, en particulier des données de base des entrepôts de données sur le marché des données. Lorsque les données sont résumées, une certaine solution doit être faite pour répondre aux besoins du comptoir.Appliquer.

3.4.3. Méthode de modélisation

La modélisation de la taille est proposée pour la première fois par KIMBALL. Sa description la plus simple est la suivante: suivez l'événement, la taille de la table pour construire l'entrepôt de données, les données de marché. Cette méthode est le nom le plus connu du modèle Star.

L'image ci-dessus est l'architecture star la plus typique de cette architecture. Le mode étoile est largement utilisé pour répondre à une grande quantité de prétraitement, telle que les statistiques préalables, la classification, le tri, le V.V. Grâce à ces prétraitements, il est possible d'améliorer considérablement la puissance de traitement de l'entrepôt de données. Surtout pour les méthodes de modélisation 3NF, le modèle STAR a un avantage significatif dans la performance.


Dans le même temps, un autre avantage de la méthode de modélisation de taille est une modélisation de taille très intuitive, uniquement autour du modèle économique, peut répondre aux problèmes d'entreprise. Vous pouvez compléter le modèle de taille sans règneRésumé spécial. C'est aussi l'avantage de la modélisation de la taille.

Cependant, les inconvénients de la modélisation de la taille sont également très clairs. Étant donné qu'une grande quantité de données de pré-traitement est requise avant de créer un modèle d'étoile, il existe un grand nombre de travaux de traitement de données. De plus, lorsque les entreprises changent, nécessitent souvent de réinscrire la taille des données de taille. Dans ce processus de traitement de ce numéro, il existe généralement une grande quantité de sauvegarde de données.

Les faiblesses du modèle d'autre taille sont si seulement le modèle de taille simple, la cohérence et la précision des sources de données ne peuvent pas être garantis et la couche inférieure de l'entrepôt ne convient pas particulièrement à la taille de la construction. Méthode de modèle.


Sujets