En fait, l'entrepôt de données lui-même ne "produit" pas de données et ne nécessite pas de "consommer" de données. Les données sont dérivées de l'extérieur et ouvertes pour des applications externes. C'est pourquoi "entrepôt", non appelé "raison de l'usine. Par conséquent, l'architecture de base des entrepôts de données comprend principalement le flowflow de données, peut être divisé en données source à trois couches, entrepôt de données, application de données:
Des formes peuvent être constatées que des données d'entrepôt de données sont extraites de différentes données de source et de nivellement des applications de données multiples et des données sont ouvertes sur la couche ci-dessus après avoir coulé dans l'entrepôt de données et l'entrepôt de données n'est qu'une plate-forme. Pour gérer les données intégrées intermédiaires.
Entrepôt de données Les données disponibles de chaque source de données et de chaque conversion de données et trafic dans l'entrepôt de données peuvent être considérées comme ETL (extrait supplémentaire, interrupteur de conversion, chargement de téléchargement), ETL est le tuyau de données Entrepôt, c'est aussi qu'il peut être considéré comme du sang de l'entrepôtRAW, le maintien du métabolisme des données dans les entrepôts de données et la plupart des travaux de gestion et de maintenance quotidien des entrepôts de données consistent à maintenir la stabilité et la stabilité de l'ETL.
Brève clé d'introduction Après différents modules de l'architecture de l'entrepôt de données, bien sûr, l'entrepôt de données décrit ici est principalement référencé à l'entrepôt de données de site Web.
Premièrement, Source de données d'entrepôt de données
Pour le référentiel de données de site Web, cliquer sur la ligne de journalisation est une source de données principale, il s'agit des données de base de l'analyse de la page Web; Bien sûr, les données de base de données du site en outre, ce n'est pas quelques-unes, enregistrez des données de ce site et des différentes activités utilisateur. Pour les résultats de l'analyse de site, ce type de données est plus précis; D'autres types peuvent créer des documents et différents types de documents sur le site Web et différents types de données pour les décisions de la société.
Deuxièmement, le stockage des données des entrepôts de donnéesPris en planifiant la tâche quotidienne de l'ETL et stockée dans l'entrepôt de données comme caractéristique après la conversion. En fait, ce processus est toujours controversé, ce qui signifie que les entrepôts de données doivent stocker des données détaillées. Un point est que l'entrepôt de données est analysé, de sorte que le modèle d'analyse multidimensionnel de besoins spécifiques; L'entrepôt de données est un autre point de la perspective. Et maintenir des données détaillées, créez ensuite un modèle d'analyse spécifique basé sur des besoins de synthèse et des détails de traitement. Je suis plus de vues: l'entrepôt de données n'a pas besoin de stocker toutes les données brutes, mais l'entrepôt de données doit stocker des données détaillées et des données importées doit être organisée et convertie au sujet. Simplement mettre:
(1). Pourquoi n'avez-vous pas besoin de toutes les données brutes? L'entrepôt de données est analysé pour analyse, mais certaines données de source ne sont pas utiles à analyser ou peuvent être beaucoup plus faibles que le déploiement et la performance de l'entrepôt de données nécessaire pour stocker ces données. PortefeuilleSociété, nous connaissons la province de la province, la ville suffit, comme pour les utilisateurs qui ne peuvent être que sur la préoccupation de l'entreprise logistique, ou les remarques d'utilisateurs de blog ne peuvent être qu'un texte d'excavation, mais il n'est pas précieux s'il s'agit d'une fouille écrite. Pour enregistrer des détails de données? Des données détaillées sont nécessaires et l'entrepôt de données est analysé et les détails peuvent être modifiés, mais si nous ne stockons que les modèles de données mis en place en fonction de certains besoins, la demande claire des modifications aura de sens.
(3). Pourquoi voulez-vous faire face au thème? Le thème est la première caractéristique de l'entrepôt de données, principalement pour organiser des données raisonnables pour obtenir une analyse. Pour les données source, son modèle d'organisation de données est très diversifié. Format de données comme des clics qui n'ont pas été ouverts. Les données du festival de base de données du festival basées sur l'organisation opérationnelle OLTP, ne peuvent pas être analysées correctement et organiser des échantillons d'organisation sont vrais pour l'analyse, par exemple, pour organiser le journal DDans une page (accès ou session), les utilisateurs (visiteurs) trois thèmes peuvent améliorer considérablement l'efficacité de l'analyse.
Entrepôt de données basé sur les données de détail de la maintenance, où s'applique en réalité une analyse. Il se compose principalement de trois aspects:Ici, les données synthétiques ont mentionné une simple coïncidence basée sur une exigence spécifique (basée sur la synthèse multidimensionnelle dans le modèle de données multi-dimensions), une synthèse simple peut être le nombre total de pages,hits, matériaux uniques, etc.
Modèle de données multidimensionnel
Matériau multidimensionnel fournit une application d'analyse multi-angle multiples, telle que modèle de vente, modèle de flocon de neige, flocon de neige Le modèle basé sur une dimension temporelle, une taille géographique, etc peut être trouvé. Demandes croisées dans chaque dimension et taille géographique, ainsi que des zones basées sur le temps et la taille géographiques. Par conséquent, l'application de modèles de données multidimensionnelles est généralement basée sur le traitement des analyses en ligne etLes marchés de données font face à des groupes de besoins spécifiques seront également construits sur la base de modèles de données multidimensionnels.
Année, modèle commercial
Le modèle d'entreprise désigne ici les modèles de données basés sur certaines analyses de données et un soutien à la décision, tels que le modèle d'évaluation humaine utilisée que j'ai déjà introduit, des recommandations connexes, modèle d'analyse RFM, etc. ou modèle de planification linéaire, modèle d'inventaire, modèle d'inventaire, v.v.; Dans le même temps, les données de traitement des données peuvent également être complétées ici.
Six applications de données d'application de données1. Rapport d'affichage
Rapportez presque un morceau de données une pièce nécessaire à chaque entrepôt de données, affichez des données synthétiques de marketing et des données d'analyse multidimensionnelles pour les rapports. Fournir les données les plus simples et les plus intuitives.
2. Quoiement de mois
Toutes les données de l'entrepôt de données théoriques (y compris des données détaillées, des données synthétiques, des données de donnéesLes données multidimensionnelles et analytiques) ouvriront les requêtes, c'est-à-dire nécessaires à la fourniture de capacités de collecte de données flexibles, les utilisateurs peuvent interroger des données en fonction de leurs propres besoins et de fournir des fichiers externes externes tels que Excel.
3. Analyse des donnéesLa plupart des analyses de données peuvent être étendues sur la base du modèle d'entreprise de construction, et bien sûr, des données de polymère peuvent être utilisées pour fumer les tendances de la tendance, l'analyse comparative, l'analyse associée, etc. et modèle de données multidimensionnel. Une plate-forme de données multidimensionnelle fournie; Et certains échantillons de données provenant de données détaillées sont également un moyen plus courant.
4. Mining de données
Mining de données Utilisation de certains algorithmes avancés pour créer des données montrent de nombreux résultats surprenants. L'exploitation minière de données peut être élargie en fonction du modèle d'entreprise construit dans l'entrepôt de données, mais la majeure partie de l'exploitation minière des données démarrera directement à partir de données détaillées et d'entrepôts de données fournissant une zone de données de communicationComme SAS, SPSS, V.V.
Sept, Gestion des métadonnées
Méta Date, devrait être appelée des données d'interprétation, ce qui signifie des données de description des données. Enregistrez principalement la définition du modèle dans l'entrepôt de données, la cartographie de la relation entre chaque niveau, gardez une trace de l'état des données des tâches de l'entrepôt de données et de l'ETL. Le stockage de Super Data stockera généralement et gérera généralement les entrepôts de métadonnées, l'objectif principal est de rendre les conceptions, le déploiement, l'exploitation et la gestion de données peuvent coopérer et accepter. Enfin, j'ai une fin. Le stockage des données ne crée pas de données et ne consomme pas de données. Il est utilisé uniquement comme une plate-forme intermédiaire intégrée de données de stockage; La difficulté de l'entrepôt de données consiste à renforcer l'architecture globale et la conception de l'ETL, qui est également le poids de la gestion et de la maintenance quotidiens; La valeur réelle de l'entrepôt de données est affichée sur son application de données et sans application de données valide, elle perdra une signification pour créer des données d'entrepôt.