Skip to main content

Dans l'entrepôt de données

Avant de commencer l'article, si le lecteur a entendu l'entrepôt de données ou connaître le magasin de données, la différence entre l'entrepôt de données avec la base de données musculaire. Si vous n'avez pas entendu l'entrepôt de données, je suppose que vous voulez également savoir pourquoi il y a une base de données, mais aussi l'entrepôt de données. Après des pensées courtes, commencez.


Qu'est-ce qu'un entrepôt de données?

Il suffit de mettre, l'entrepôt de données est une base de données spéciale. L'entrepôt de données est généralement effectué par sujet, ce qui signifie que les données commerciales, intégrant de nombreuses sources de données différentes, changeront au fil du temps, car la quantité de temps changera et lue activement il n'est pas perdue, résumant les 4 caractéristiques que l'entrepôt de données est un sujet. , intégration, changement de temps, collecte de données non volatile, processus décisif du gestionnaire de support. C'est un référentiel électronique pour une grande quantité d'informations réalisées par la société et ses conceptions utilisées pour interroger au lieu de traiter des transactions. IciAussi la différence entre elle avec la base de données. Data Warehouse convertit les données en informations et fournit rapidement aux utilisateurs et dispose de la plupart des bases de données traditionnelles. L'entrepôt de données est caractérisé par l'image:


Composition de l'entrepôt de données

L'entrepôt de données n'est pas un produit, qui est un environnement. On dit que ceci est dû au fait que ce n'est pas une simple données stockées, mais la structure architecturale du système d'information est conçue pour analyser et signaler des données. Principalement composé de trois parties:



    La couche inférieure est un serveur de base de données d'entrepôt: presque un système de base de données relationnelle, utilisant des outils et une utilisation auxiliaire pratique, extrayant des données avec des bases de données d'exploitation ou d'autres sources de données externes. En plaçant la couche intermédiaire de base lorsque la couche supérieure du serveur OLAP est la couche de cliente avant, également appelée application de classe. Comprend des outils de requête et de rapports, outils d'analyse et outils d'exploration de données. IngrédientSpécifiquement, comme indiqué sur l'image:
Troisième, Modèle d'entrepôt de données

Selon la structure, Warehouse de données comporte trois modèles de données de données.

Entreprise Entrepôt: Il s'agit d'un référentiel centralisé, y compris des données détaillées et des données sommaires, fournissant des services de support décisif dans l'ensemble de l'entreprise, fournissant des méthodes unifiées pour organiser et représenter des données et classer la classification des données et l'accès. Capacité

Marché des données: il s'agit d'un sous-ensemble d'entrepôts de données. Conçu pour des unités commerciales spécifiques, telles que les ventes, la finance. Les données peuvent être recueillies directement à partir de la source sur un marché de données distinct.
Entrepôt virtuel: une collection de modes de visualisation sur les bases de données actives.

Quatrièmement, développer des systèmes d'entrepôt de données pour faire attention à.

Le développement de l'entrepôt de données correspond à des méthodes plus courantes, correspondant au sommet et à la norme.

Depuis le haut en bas: c'est un giLe système est comparable et peut minimiser les problèmes intégrés. Cependant, les coûts élevés, le cycle du développement à long terme et le manque de flexibilité, car l'ensemble de l'organisation est conforme au modèle de données générales plus difficile


depuis le bas: Linh activé, faible coût et rapide Rapport d'investissement Toutefois, il est intégré aux foires de données pour former un entrepôt de données commerciales non commun, ce qui peut entraîner des problèmes.


Par conséquent, si deux personnes peuvent combiner, l'entrepôt de données est déployé dans une augmentation et une évolution. Par exemple, en peu de temps raisonnable, il existe une gamme d'entreprises, cohérente, visualisant des données intégrées entre différents sujets et applications. Étapes en général:

1. La sélection du traitement de l'entreprise (par exemple, les commandes, les ventes) seront modélisées. Si un processus d'entreprise est l'ensemble de l'organisation et implique de nombreux objets complexes, nous devrions utiliser le modèle de l'entrepôt de données que nous parlons ci-dessus. Si le traitement est une partie, mais aussiPréoccupations concernant l'analyse d'un processus opérationnel Certains métier, vous devez choisir le marché des données.

2, choisissez la taille des particules du processus métier (par exemple, des transactions).
3, Choisissez des exemples de maintenance (heure, produit) pour chaque enregistrement de table réel.

4, sélectionnez la mesure dans chaque enregistrement de table réel. Par exemple, les ventes. Étapes à suivre en général:

1. Stratégie d'entreprise: identifier la technologie, la réalité, la taille et l'attribut. Comprend la cartographie et la conversion de données. LIVRAISON: Effectuez un entrepôt de données basé sur la phase d'objet. Par exemple, le système de vente, des entités commerciales connexes telles que planifiées et le paiement devraient être effectuées en premier, puis s'intégrer les unes aux autres. Répéter le prototype: Il s'agit d'un développement et d'essai répétitifs, pas une méthode de mise en œuvre explosive importante.

L'entrepôt de données de conception est une chose relativement difficile et à long terme. Nous devrions clairement identifier sa gamme de déploiement, ce qui consiste à atteindre clairementUtile et doit être détaillé, les entreprises sont implémentées, principalement quantitatives.

V. Base de données VS Warehouse VS

Selon ce qui précède, nous comprenons l'entrepôt de données, vous pouvez maintenant répondre au problème de l'article.


La base de données traditionnelle est née en magasin et l'entrepôt de données est clair, il est né d'analyser. Différents efforts pour obtenir leurs différences. La base de données traditionnelle comprend une suppression supplémentaire, mais l'entrepôt de données porte une attention particulière à la demande. La tâche principale de la base de données traditionnelle consiste à effectuer le traitement des transactions en ligne, appelé OLTP (traitement des transactions en ligne). Principalement responsable de l'opération quotidienne, telle que les achats, la production.

Système d'entrepôt de données dans l'analyse et les aspects des fournisseurs de données de décision pour les utilisateurs ou les «travailleurs du savoir», peuvent organiser et fournir des données dans d'autres formats mutuellement pour traiter différents besoins, ce système s'appelle le traitement de l'analyse.En ligne, appelé OLAP (analyse en ligne). Ci-dessous, nous pouvons en apprendre davantage sur la différence entre les bases de données et les bases de données en comparant les différences d'OLAP et d'OLPP.

Tout d'abord, des objets d'utilisateurs et de systèmes orientés objet sont pris en compte, OLTP est un processus de négociation et des requêtes pour les clients, les opérateurs d'utilisateurs, les clients et les techniques de tablette d'information. OLAP est une orientation du marché, utilisée pour analyser les données des travailleurs du savoir.

Contenu de données: OLTP gère les données actuelles. Mais en général, ces données sont triviales, très difficiles à utiliser pour décider. Le système OLAP gère un grand nombre de données historiques, fournissant des mécanismes de synthèse et de synthèse de synthèse et de stockage et de gestion de l'information sur différentes couches de particules.


Conception de la base de données: système OLTP applique le modèle de données pour contacter l'entité (ER) et concevoir la base de données de direction d'application. Le système OLAP utilise des modèles d'étoiles ou de flocons de neige et THConceptions de thème de la base de données.

Voir: OLTP se concentre sur les données actuelles à l'intérieur d'une entreprise ou d'un département, non liées à des données historiques ou à différentes unités de données. OLAP nécessite généralement différentes versions de mode de base de données croisées.

Mode d'accès: le système OLTP comprend principalement des transactions atomiques courtes, nécessitant souvent des mécanismes de contrôle et de récupération simultanés. La plupart des droits d'accès du système OLAP sont des activités en lecture seule.

Le résumé suivant semble clairement


6. Quelle est la quantité d'utilisation de l'entrepôt de données


Qu'est-ce que l'entrepôt de données? Lieu. Les individus résument deux points. L'une est d'améliorer la productivité, l'une est bénéfique pour la gestion des relations. C'est ses données en temps réel et riches.


SEPT, Junction Petit


Data Warehouse est comme un outil système, tel que HoneyComb, basé sur l'entrepôt de données Open Source Hadoop, peut interroger, analyse des données.Le fichier est stocké dans HDFS.Les limites de l'espace ne sont pas expliquées ici.L'entrepôt de données joue un rôle important dans l'architecture de données importante.En fait, l'architecture de l'entrepôt de données ci-dessus peut être dite d'avoir les bases des processus de données importants et chaque composant intérieur suffit à nous faire étudier pendant une longue période.