Skip to main content

L'entrepôt de données peut être envisagé par des produits de données et dans la recherche d'emploi de données de données, l'entrepôt de données peut être un endroit dans cet élément dans la recherche d'emploi du produit de données.


Cependant, pour les chaussures pour enfants pour préparer des données de recherche d'emploi, des amis qui n'ont pas été développés autour de vous pouvez demander. L'auto-étude, et que quelques livres classiques sont trop théoriques, ce n'est vraiment pas aussi bon que la mort et les produits de données ne sont pas de développement de données, et certains d'entre eux peuvent connaître un bon sens, il y a un concept probablement.


J'ai également beaucoup de connaissances dans ce domaine, je me suis combiné dans ces deux jours, en formant ci-dessous, j'espère aider tout le monde, les développeurs de nombres non professionnels, si vous avez des lieux inexacts , vous espérez également que tout le monde va corriger.


Structure de l'article
1. Quel est l'entrepôt de données
Deuxièmement, quelle est la caractéristique de l'entrepôt de données

III, pourquoi construire des données Entrepôt

Quatrième, Structure de l'entrepôt de données 5, ETL Six, marché des données

Sept, SOYS
huit, Métadonnées




Que L'entrepôt de données

peut-il être compris comme suit:

en tant que système de stockage analytique.

C'est-à-dire que le nombre enregistre les données et les différentes données de l'entreprise sont à l'intérieur. L'objectif principal est d'analyser efficacement les données, suivi en fonction de sa production de Les données relatives à l'exploitation minière analytique ou à une application de données nécessitent des données, telles que des rapports analytiques d'entreprise et diverses déclarations, soutiennent les décisions commerciales.

La signification de ce qui précède est d'abord comprise, puis, de la tête, examine d'abord la base de données relationnelle, elle peut être divisée en deux types de base: Base de données d'exploitation et base de données analytique.

1, la base de données opérationnelle

est principalement utilisée pour les applications de soutien aux entreprises, soutenant le traitement des services réels ou une base de données de modèle d'entreprise. Il peut être compris comme une base de données commune (qui est souvent mentionnée dans la classe de développement en arrière).


2, base de données analytique

principalement en fonction de l'analyse des données, axée sur le soutien à la décision, en tant que magasin de données distinct, responsable de l'utilisation de données historiques à l'analyse statistique de la société du domaine .

Étant donné que l'opération de la base de données analytique est requise, carCela n'a également pas besoin de répondre strictement de certaines spécifications de conception de bases de données relationnelles, de sorte qu'il n'est pas approprié de le renvoyer à la base de données et qu'il est facile de provoquer une confusion, il est donc appelé un entrepôt de données.


Vous pouvez dire ici que le traitement des données peut être approximativement divisé en deux classes principales:

OLTP (transaction en ligne) et OLAP (traitement d'analyse en ligne).

1, OLTP (transaction en ligne) est la principale application de la base de données d'exploitation, plus se concentre sur le traitement de la transaction quotidien de base, y compris les données à déduire.

2, OLAP (traitement d'analyse en ligne) est l'application principale de la base de données analytique, analyse les données de manière multidimensionnelle, qui suit.


Quelles sont les caractéristiques de l'entrepôt de données
par rapport à la base de données, l'entrepôt de données a les caractéristiques suivantes


(1) faire face au sujet

L'entrepôt de données charge les données de plusieurs systèmes d'entreprise ensemble via un domaine de sujet et est construit pour une analyse de chaque sujet (tel que l'utilisateur, la commande, les biens, etc.) et la base de données opérationnelle est de supporter divers services. Établir. (2) Intégration


L'entrepôt de données sera avec les données dans différentes bases de données Source.
(3) historique

Par rapport à la base de données de type d'opération, les données de l'entrepôt de données sont établies pour l'analyse des données d'entreprise. Les données seront donc généralement chargées. Après une longue Temps, le premier sauve généralement pendant quelques mois et ce dernier peut être plusieurs années voire des décennies.


signifie que l'entrepôt de données contient des instantanés de données provenant de différentes périodes de temps de leur temps. Après ces instantanés de données, l'utilisateur peut-il résumer, générer des données Rapports d'analyse dans chaque étape historique.

(5) Stabilité

Les données de l'entrepôt de données n'effectuent généralement que des opérations de requête, rarement supprimées et mises à jour. Mais vous devez charger et rafraîchir les données.

Troisièmement, pourquoi construire un entrepôt de données , il est d'analyser efficacement les données.

Direz-vous que vous pouvez prendre des données directement à partir de la base de données d'entreprise?

n'est pas qu'il y ait plus de systèmes d'affaires. Lorsque l'entreprise est complexe, elle constatera que la structure est complexe, la saleté de données, difficile à comprendre, manque d'historique et à une requête à grande échelle. Business à une certaine taille, tout le monde a besoin de visageLe problème est de plus en plus complexe et approfondi, la demande des données n'est plus que des revenus d'hier, UV le mois dernier, mais "la relation entre les femmes âgées de 28 ans dans les activités de la Société et de la société planifiant" Ceci " Analyse du raffinement de classe, et il est difficile de souscrire de telles données de la base de données.

Après tout, la base de données d'entreprise consiste à prendre en charge la conception des entreprises, à ne pas interroger et analyser les données.

4, Structure de l'entrepôt de données

peint un diagramme structurel avec axure, comme suit: Simplement, les données ETL aux nombres dans l'entrepôt, le numérique est ensuite intégré et statistiques sur le Données, puis sortie à chaque application de données, les modules impliqués dans les figures et seront introduits séparément.


5, ETL
ETL représente:

Extraction d'extraction, charge de charge de conversion.

(1) L'extrait


extrait les données spécifiées de la source de données, les données sont requises, toutes les données à extraire, certaines données de source ne sont pas une valeur pour l'analyse, ni la Valeur Il peut générer, ce qui est bien inférieur au coût de la mise en œuvre et de la performance de l'entrepôt de données requis pour stocker ces données et ne sera pas extraite.




Convertit des données à un format spécifié et effectue le nettoyage des données garantissant la qualité des données.
Conversion de données, telle que comprenant la conversion de codage (m / f- & gt; mâle / femelle), conversion de champ (balance-gt; BAL), la conversion de l'unité de mesure (CM- & GT; M), Conversion de la taille des particules de données. Les données du système d'entreprise stockent des données très détaillées et des données dans l'entrepôt de données sont analysées, il n'est pas nécessaire de décharger des données du système d'entreprise en fonction de la taille des particules de l'entrepôt de données.

Nettoyage des données, tels que le nettoyage des données incomplètes, des données d'erreur et des données en double, etc.

(3) Chargement (charge)


Chargez les données converties dans l'entrepôt de données cible Le chargement peut être divisé en deux types:

1, Loading total de la quantité: Chargez toutes les données une fois.

2,

Chargement incrémentiel: En règle générale, la première fois est chargée, mais elle est toujours chargée au deuxième cycle ou au troisième cycle, il faut de grandes ressources physiques et temporelles. Il est possible que certaines sources de données ne changent pas et certaines sources de données ne puissent augmenter qu'une petite quantité de données. Les données de la source de données ne considère que le nouvel enregistrement modifié et les enregistrements nouvellement insérés sont le chargement progressif. L'ETL est susceptible d'être un lien avec la plus grande ressource fastidieuse dans le développement de l'entrepôt de données, car le lien doit organiser des données désordonnées dans les principaux systèmes d'entreprise et coordonner la différence de métadonnées, la charge de travail est très importante. est également une partie importante de la construction d'un entrepôt de données, qui est relativement importante pour les liens ultérieurs des entrepôts de données.


Sixième, marché des données

Le marché des données (DM) peut être compris comme un "petit entrepôt de données", généralement confronté au département, un seul sujet ou des applications spécifiques, et le neurone de L'une et l'autre.

Marché indépendant des données:

a sa propre base de données source et son architecture ETL ATL;

2,

Données non indépendantes: Sans ses propres données source, ses données proviennent de l'entrepôt de données. Lorsque l'utilisateur ou l'application n'a pas besoin de / inutile / ne permet pas d'accéder à l'ensemble des données numériques, vous pouvez accéder directement au marché des données et fournir à l'utilisateur un "sous-ensemble" d'un entrepôt de données.

La compréhension simple est qu'une structure est complètement et numérique, il existe ETL, puis stocke et calcule eux-mêmes; l'autre est d'utiliser les données traitées avec un numérique pour la combiner à nouveau. Il peut être mieux compris que les données sont liées plus tard.

Sept, ODS

ODS:

Le nom complet est le magasin de données opérationnelles, le stockage de données de fonctionnement. Les données après la stockage de la base de données commerciales majeure sont stockées est une couche de données dans la source de données, et l'objectif principal est de se concentrer.

La plupart d'entre eux sont classés en fonction de la classification des systèmes d'entreprise source, il existe donc une base de données d'entreprise distincte, et même avoir une certaine forme de paradigmes de données dans la base de données relationnelle.

Cependant, il n'est pas équivalent aux données d'origine et le format de données est unifié conformément au numérique numérique et est simple à nettoyer.

Huit, métadonnées

Metadata (c'est-à-dire des données, des métadonnées peuvent être divisées en métadonnées techniques et en métadonnées de service.

Les métadonnées techniques permettent de développer et de gérer des entrepôts de données, décrivent les données relatives au développement, à la gestion et à la maintenance des entrepôts de données, y compris les informations de source de données, la description de la conversion de données, le modèle d'entrepôt de données, le nettoyage des données et les règles de mise à jour, cartographie des données et accès Droits, etc.

Les métadonnées de l'entreprise sert des services de gestion et d'analystes d'affaires, du point de vue des entreprises, y compris les conditions commerciales, des données, des entrepôts de données, de l'emplacement des données et de la disponibilité des données, etc aident les hommes d'affaires mieux quelles données sont disponibles dans le Solution géographique des entrepôts de données et comment l'utiliser.

L'écriture ici, a constaté que le contenu a été, comme un modèle numérique, une superposition de données, OLAP et BI pour le laisser à nouveau.

Tenez un rapport d'analyse de données, a gravi 3 données l'année dernière, qui est prête à écrire trois rapports de données. Après avoir écrit une une, il n'y a plus de plus en dessous, et cela repassera l'heure précédente. Au moins, écrivez-en un, bien que je n'ai pas encore commencé un stylo.


Sujets

Catégories