Skip to main content

Semaine · Entretien | Posts Modélisation de données Warehouse

1, Qu'est-ce que l'entrepôt de données? Caractéristiques de l'entrepôt de données?

Premièrement, pour les décisions de support , le traitement des données analytiques faciales, il diffère des bases de données opérationnelles existantes;

Lundi Pour de nombreuses données de source uniformes,

, après l'intégration, la restructuration thématique et contient des données historiques et stockées dans l'entrepôt de données n'est généralement plus modifiée.
L'entrepôt de données

est une collecte de données de intégrée, intégrée, relativement stable, reflétant la collecte de données de changements historiques, , utilisée pour soutenir l'analyse décisionnelle des entreprises ou des organisations. 2 Quelle est la différence entre l'entrepôt de données et la base de données? La différence entre les bases de données de transaction et les bases de données pour prendre en charge les décisions de transaction

, la conception, la conception
, V.V.

(1) Les données sont

pour le bureau de livraisonTraduction données créées par les entreprises quotidiennes, souvent mises à jour; L'entrepôt de données est faisant face au thème , les données sont extraites de la base de données ou du fichier et ont été converties par une certaine règle. Analyse.
(2) La base de données est souvent utilisée

pour stocker les données de transaction en cours ; Le stockage de données de stockage est généralement stocké Historique des données .

(3) La conception de la base de données convient souvent à
TRI-style avec la plus grande précision et une disposition minimale minimale, avec bénéfiques pour les données d'insertion ; Les conceptions de l'entrepôt de données sont généralement étoiles et profitent à la requête
.

3, quelle est l'architecture de base de l'entrepôt de données? Source de données, ETL, Stade de données, SAO, Entrepôt de données, Datamart, OLAP, etc., peuvent être libérés pour chaque structure (1) Source de données est le système d'entrepôt de données


System Warehouse de données

comprend généralement de nombreuxDifférents types d'informations, y compris les différentes données de traitement de données, sont stockés dans les PDBM et de nombreuses données de document différentes.; Tous les types de lois, de réglementations, d'informations sur le marché et de concurrents sont en concurrence, etc.

(2) Stocker et gérer des données
La gestion de stockage et de la gestion des données est la principale

dans la clé de l'entrepôt de données . La méthode de gestion organisationnelle de l'entrepôt de données détermine qu'il est différent de la base de données traditionnelle et détermine également l'expression des données externes.

de la spécification de l'entrepôt de données, il a été analysé. Identifier quels produits et technologies pour établir des entrepôts de données ultérieures pour des données des systèmes d'entreprise existants, de nettoyer et d'intégrer l'efficacité, le thème de l'organisation.


Les entrepôts de données peuvent être divisés en Enterprise Data Warehouse et

Niveau de données de niveau de données

(souvent appelé données). (3) OLAP Server


TEffets utiles des données nécessaires effectives ,

organisées par des modèles multidimensionnels pour une analyse multi-niveaux, des tendances à plusieurs niveaux et explorent.
La mise en œuvre spécifique peut être divisée en: Rolap (traitement de l'analyse relationnelle en ligne), Molap (analyse en ligne multidimensionnelle) et Holap (analyse hybride de traitement).

ROLAP Les données de base et les données synthétiques sont stockées dans les RDBM; Molap

Les données de base et les données synthétiques sont stockées dans une base de données multidimensionnelle;

HOLAP Les données de base stockées dans les RDBM et les données synthétiques sont stockées dans une base de données multidimensionnelle.

(4) Outil frontal , comprenant principalement chaque outil de requête, outil d'analyse de données, outil d'exploration de données, outils de rapport et différents entrepôts de données ou outils de développement d'applications pour le marché des données. L'outil d'analyse de données principale est pour OLAP Server

. Outils de rapport, outils d'exploration de données principauxCiblé dans des bases de données.
4, conception du modèle, besoins professionnels et conducteurs de données
Il existe deux façons de construire des entrepôts de données:



Du début de la page du bas à M. Bill Inmon, "auto-baisse Une entreprise a construit un centre de données unique comme un entrepôt de données, dans lequel données sont intégrées, nettoyées , défectueux, standard et peut fournir une vue unifiée

Pour mettre en place un tel entrepôt de données, ne commencez pas à partir de ce qui est appliqué au support, mais de commencer à partir de l'environnement
analysez le Concepts, quel type de données atteindra oui et ce concept est terminé; (prendra en compte la conception complète de ) Ralph Kimball M. Rally "Murs sur" La façon dont il estime que la construction de l'entrepôt de données doit être
, selon les exigences applicables, téléchargez les données nécessaires,

ne pas attendre des donnéesLa flexion n'est pas chargée dans l'entrepôt de données. Cette méthode Le cycle de construction est plus courte , les clients peuvent voir les premiers résultats. (Pour besoin de clients , que ferez-vous?


Deux personnes doivent atteindre le même objectif: Entrepôt de données d'entreprise En fait, lors de la construction d'une donnée Entrepôt, il n'existe pas de spécifications difficiles à utiliser conjointement avec ces deux manières. 5, étape de la conception modèle ] Construire une méthode en cinq étapes d'entrepôt de données professionnelles:


(1) Détermination du thème


Identifier le thème de l'analyse de données ou de l'extrémité avant . L'objet doit refléter la relation entre Angle d'analyse (taille) et les données statistiques de données (mesure) dans un emplacement de certains bords pour déterminer le problème.

(2) Définir les données


Après avoir identifié le sujet, il est nécessaire de prendre en compte le seul nombre technique d'analyse. Ils sont généralement données de valeur de données , uneLe nombre d'entre eux n'est pas synthétisé; Certains peuvent être synthétisés pour fournir des informations utiles aux analystes.

La mesure est un indicateur Statistiques et conceptions sélectionnées et calculs Les indicateurs critiques complexes (KPI) peuvent être fabriqués sur différentes paramètres.


après avoir déterminé la mesure, il est nécessaire de considérer les données Résumé et tailles différentes. Synthétique.

Exemple:

Les données minimisent les données dans le système d'entreprise enregistrées et dans les exigences d'analyse futures, de temps exactement à la journée. [123.

Dans le processus de traitement ETL, le résumé des données de la journée et la taille des particules de l'entrepôt de données est "jour". Si vous ne pouvez pas confirmer si l'analyseur doit être correct à l'avenir ou non, nous devons suivre "principe de taille des particules minimum" .

Dans la table actuelle de TronG Warehouse de données Conserver les données de chaque seconde

, de sorte que les données seront résumées avant que le modèle d'analyse multidimensionnel (cube) soit défini.

Assurer l'efficacité des résultats analytiques.

(4) Déterminer la taille


La taille est

de chaque coin .


Exemple:

Nous voulons analyser le temps ou par région ou par produit. Le temps, la zone et le produit ici sont les tailles correspondantes. Sur la base de différentes tailles, on peut voir dans

et
peut également être analysé sur toutes les tailles.

Décentralisation (hiérarchie) et niveau (niveau).

Exemple: En taille, il a formé un niveau selon "cinq ans", dans lequel "année", "quart", "mois" "est devenu trois niveaux de ce niveau. Nous pouvons dessiner "Produits de classification de gros produits - produits" comme niveau, y compris "grands produits" "", "productionClasses pures "," produits "trois niveaux.

Nous pouvons mettre trois niveaux dans 3 écoles

dans la fiche technique, telle que la taille de temps; nous pouvons aussi
Peut utiliser trois tables, enregistrer des produits séparés, des sous-produits trois produits de pièces de données, tels que la taille du produit.

] lors du réglage du tableau de la dimension Vous devez utiliser la touche Agent

Le verrouillage du proxy est le numéro d'identification du type de valeur de données

(premier champ de chaque table), déterminez dans la tablette de première taille. Lors de la collecte, de la correspondance et de la comparaison de champs numériques, une performance de participation élevée. Dans le même temps, la serrure de l'agence est dans la taille du changement lent, a joué le logo de

sur de nouvelles données et des données historiques.
5. Créer des livres réelles

Après avoir déterminé les données et la taille réelles, il sera considéré comme étant à télécharger Board .

. Sortie de stylo, enregistrement de négociation de la Système d'entreprise Données originales de la table de tableEH sera mis en place. Notre approche est de relier les tables et les tables de taille brute pour créer des vérités. Lorsqu'il y a des données vides (source de données), a besoin pour utiliser des connexions externes , puis récupérez les touches proxy de chaque taille dans la table réelle, la table réelle sauf chaque dimension, la taille du verrouillage du proxy, A chaque données de données, ne doit pas être décrite. La plage de journaux dans la table réelle est plus et la principale clé composite de la clé composite est définie pour , pour atteindre l'intégrité des données et l'entrepôt de données basé sur l'optimisation des performances de la requête.

Sujets