Skip to main content

L'établissement d'un entrepôt de données est un processus de résolution de l'application des problèmes de données d'entreprise. C'est une étape essentielle dans le développement de l'information d'entreprise à un stade donné et constitue également une base importante pour la gestion des données de développement. Le livre et l'article sur le marché sur le marché numérique, mais la mise en œuvre réelle est différente selon l'industrie, les exigences fondamentales de l'entreprise sont différentes de la technologie à la méthodologie.


Comment mettre en œuvre un marché numérique, ce document utilise d'abord l'entrepôt numérique dans l'industrie traditionnelle et la méthodologie de mise en œuvre de l'entrepôt de données est enseignée!


Analyse de la demande

L'analyse de la demande est la partie la plus importante du projet d'entrepôt de données. Le nombre est toujours desservant les affaires, en soutenant les affaires. Si l'analyse de la demande n'est pas exacte, personne n'est utilisé, il n'est pas facile à utiliser, sera d'une incidence directe sur l'utilisation des entreprises / client, éventuellement menant à la défaillance du projet. Afin d'éviter le pire des cas, l'aiguiseur n'est pas un problème, et le stade précoce doit faire attention à la recherche, à la fouille et à l'analyse de la demande et à utiliser des mesures scientifiques et des méthodes scientifiques rigoureuses pour faire une analyse de la demande.

Plusieurs expériences du processus de recherche effectif:

1, autant que possible d'analyser les besoins du côté métier / client guide l'autre partie à Décrivez en partie le cadre général et les détails de l'entreprise du projet, le meilleur moyen est de discuter du personnel et des concepteurs de la demande basés sur des prototypes, ce qui corrige ainsi la compréhension des besoins commerciaux réels.


2, les problèmes qui doivent être mis en œuvre dans la réalisation de la mise en œuvre de l'entrepôt de données peuvent être clairement déterminés. Celui-ci est dans beaucoup de fosses, il est pressé, le côté de l'entreprise est toujours connu pour le projet, et même s'il est promu, il peut prendre la lumière, comme dans la première phase, pendant une longue période, longtemps -Term, le projet générera beaucoup de poussée et de tirage, lécher la confiance de l'autre.


Donc, sur la base de la discussion sur la demande, il est nécessaire de comprendre le flux de travail de l'entreprise. Bien sûr, si vous avez déjà la connaissance des affaires riche de cette industrie, elle peut être épuisée dans la recherche de la demande. Il Peut être possible de laisser l'autre partie compléter la conception fonctionnelle du système d'entrepôt de données conformément à ses propres idées.

3, la classification du groupe de demande, l'utilisation finale du projet BI peut être divisée dans les catégories suivantes: requêtes de données, requête de rapport, décideurs d'entreprise


.

Les besoins de ces trois types de personnes sont complètement différents. Lorsque la communication, ils doivent distinguer


4, la recherche de la demande parfaite, Cela n'échange pas non plus besoin de changer. La réalité est incertaine dans de nombreux cas et la partie commerciale n'est pas digne de la demande de valeur. La demande aujourd'hui est un avenir à devenir B ne peut pas faire une étape, c'est normal, comme un projet de mise en œuvre de projet doit le faire. Attentes psychologiques.


En général, la partie de service peut fournir une partie de la partie de cadre globale de la demande ou une partie des besoins réels et ne peut pas prévisualiser l'avenir nécessaire pour augmenter la La demande, qui est également destinée à avoir un processus de cycle continu, de rétroaction, de sorte que le système ait une croissance continuellement améliorée.


Aucun risque, mais peut réduire les risques, la recherche scientifique est donc particulièrement importante. Ce qui suit est un modèle de recherche. Lorsque l'enquête sur la demande est terminée, il est nécessaire d'analyser, de résumer, d'organiser et de former enfin un rapport d'analyse de la demande complète.

La mise en œuvre des besoins commerciaux doit vraiment comprendre les objectifs stratégiques des décideurs d'entreprise. Sur la base de la mise en place d'un objectif de système de renseignement commercial, établissez un mode de gestion d'entreprise valide, développez une spécification de gestion de l'entrepôt de données détaillée de l'entreprise, concevoir des spécifications de la collecte de données et des flux de travail de l'ETL communs et clarifie la portée de la mise en œuvre des systèmes de renseignement et de la mise en œuvre. Afin d'améliorer l'analyse de l'analyse de la société, vous pouvez utiliser la technologie de réseau local actuelle et la technologie Internet pour réaliser l'enquête et l'analyse de diverses informations. En établissant un modèle de données professionnelles, analysant l'architecture du système des systèmes de renseignement commerciaux , Sources de données, évaluation de la qualité des données et diverses méthodes d'information, améliorent efficacement la capacité d'analyse et de prise de décision des systèmes de renseignement des entreprises d'entreprise.


Analyse logique de l'entrepôt de données

L'entrepôt de données peut être divisé logiquement en une base de données opérationnelle, une couche d'entrepôt de données, une municipalité de données, une couche d'application d'analyse de données et Signaler une couche d'affichage, son architecture est indiquée ci-dessous:




Le système ODS de design


Les SAO peuvent avoir deux formes: ODS Tableau tampon de données et ODS Vue d'information unifiéeRégion.
1 tampon de données ODS

Le tampon de données ODS est la première zone de stockage du processus de flux de données de service et l'entrepôt de données est mis en œuvre à partir de la source de données de chaque système d'entreprise. Et Chargé dans le processus du tampon de données ODS, permettant ainsi une plate-forme de données mondiale unifiée, qui est une base solide pour le processus d'extraction, de nettoyage et de conversion de données futures. Pour les sources de données des données, l'extrait peut être prélevé dans un incrément, qui est généralement extrait de manière totalement. Le tampon de données ODS a des fonctionnalités en temps réel et le système ODS intègre les données d'exploitation de production de chaque système d'entreprise isolé, forme une plate-forme d'échange de données d'entreprise unifiée.


2 ZONE D'INFORMATION UNIFIÉES ODS

ODS Unified Informations Zone Afficher la zone Afficher la sélection de différents types de données de source de service, les données sont extraites, nettoyées, converties et Le thème des données est basé sur l'intégration des données et les données sont classées et organisées, et l'utilisateur peut obtenir des données en temps réel relatives à un domaine en question via la zone de vue de confiance unifiée. Chaque système d'information et de la vue d'information Unified Business et ODS est accessible aux autres, ce qui peut générer des rapports de fonctionnement en temps réel et interroger une information totale récente.


3 Taille tampon de données ODS et ODS Informations unifiées Afficher les différences de surface

Le tampon de données ODS est principalement des entreprises que les données source extraient la fonction de fournir des tampons de données intermédiaires dans le Entrepôt de données. La plus grande différence avec la zone de vue des informations unifiées ODS est l'extraction de données, le nettoyage, la conversion, les règles de conversion chargées et le stockage des données. La zone d'affichage des informations unifiées ODS est entièrement stockée dans le sujet, fournissant aux utilisateurs des rapports rapides et des requêtes de données en temps réel. Les règles ETL du tampon de données ODS sont généralement simplement résumées, calculées, ou aucune transformation au milieu de la base de données opérationnelle. Les données de la zone de vue des informations unifiées ODS sont généralement tirées du tampon de données ODS.

4, Modélisation de l'entrepôt de données


Modélisation de l'entrepôt de données dans le passé, il y a eu une introduction détaillée, le modèle d'entrepôt de données est un ensemble de langues et de plates-formes pour les développeurs technologiques informatiques, les hommes d'affaires, les responsables décisionnels de communiquer entre eux. Pour les ingénieurs de modélisation de données, la compréhension profonde de l'entreprise est la tâche principale, car la modélisation des entrepôts de données est divisée en trois étapes de conception de modèle concept, conception logique modèle et conception de modèle physique, généralement conformément à l'ordre du haut en basModèle de conception.
Le modèle conceptuel est principalement la compréhension des règles commerciales du concepteur de modèle. C'est le niveau le plus élevé de modèle de données, qui couvre tous les concepts de base des affaires et des thèmes importants, la fondation pour la construction de modèles logiques futurs.


Le modèle logique est la décomposition, le raffinement du modèle conceptuel, divise le sujet de données en une relation entité et entité, sera généralement Papel comme modèle de conception.

Le modèle physique est une description de l'entité modèle sur la base d'un modèle logique, y compris le type de champ, la longueur, l'index et d'autres facteurs, et enfin transformé en une table physique stockée dans une base de données.



V. Modélisation du marché des données
La construction de Les foires de données générales reposent sur les résultats obtenus par analyse de la demande et la modélisation des serviettes de données est principalement conçue pour des faits et des dimensions. Par exemple, la table de relations de département des employés, si la table de fait contient du codage ministériel, les données peuvent être analysées au département. Si la table de fait contient le codage des employés, les données peuvent être analysées au ministère et analyser l'employé. Un tableau de fait comprend une métrique qui doit être analysée en plus du codage de la dimension à analyser. Par exemple, l'utilisateur utilise une table d'analyse d'analyse électrique. Sa description du thème est la consommation d'énergie de la région, du temps, des statistiques de niveau de tension, devraient recevoir une charge d'électricité et effectuer le contraste de la même période; sa dimension est la région, la durée, la tension Niveau, mestrics, y compris la consommation d'énergie, recevant de l'électricité, etc. La source de l'indicateur est la table des résultats de la facturation de l'entrepôt de données, la table d'informations de base de l'utilisateur. La dimension est généralement extraite de manière incrémentielle.






L'analyse dite source de données consiste à analyser et à résumer les données source, ainsi que la plage, le format, la méthode de mise à jour, la fréquence de mise à jour et la fréquence de mise à jour sont obtenues. Bonne qualité et mauvais processus.

L'analyse des sources de données fait référence à la situation de base de la source de données métier en recherchant les exigences et le contenu spécifique comprend quelles tables physiques, la relation entre la table, la table entre les tableaux et chaque champ de la table. Données Types et significations, etc. En règle générale, les sources de données commerciales ont généralement des données incomplètes, incohérentes ou uniformes s'il existe une règle d'entreprise dans diverses sources de données..


De plus, dans l'analyse, il est nécessaire de déterminer quelles données dans les données de source de service doivent être extraites. Afin de déterminer la méthode d'extraction appropriée, il est nécessaire d'analyser la source de données avant d'extraire. La plage d'analyse comprend généralement le format des données, la plage de données, la manière et la qualité des données est bonne. Dans le processus d'analyse, les résultats de l'analyse doivent être obtenus autant que possible, en formant un rapport d'analyse de source de données, après un rapport d'analyse de l'étude attentif, puis sélectionnez l'extraction appropriée, la méthode de chargement. Comprendre les caractéristiques de ces sources de données, il est propice à l'intégration et à l'unité des données lors de l'extraction ETL, assurant ainsi la qualité et la crédibilité des données.


Les sept, l'acquisition et l'intégration des données


L'acquisition de données et l'intégration existe dans le projet d'entrepôt de données à chaque étape du milieu. Un entrepôt de données est un rôle important qu'il sera intégré dans les données de chaque système d'entreprise et la spécification de données irrégulière est placée dans un entrepôt de données de manière facile à analyser et à s'appliquer. Le processus ETL est en réalité le processus de débit de données, à savoir de différentes sources de données à une base de données cible unifiée. L'acquisition et l'intégration des données sont le processus complexe consistant à compléter la construction de l'entrepôt de données, qui est lié à la qualité des données et constitue le fondement de la construction de projets d'entrepôt de données.


Huit, une application de données et un rapport de rapport

Le rapport est définitivement une chose douloureuse. Le format est complexe, la demande est modifiable et l'entreprise n'est rien pour changer la demande ou augmenter plusieurs. Bien que le rapport se sent très vieux, il s'agit en effet de quelque chose que le nombre total de valeurs numériques nationales est présenté.


Les gens font plus de rapports, font fondamentalement leurs propres outils, au moins un moteur, en fonction de leur propre compréhension structurée et des moyens dynamiques de définir les rapports requis et de sélectionner de manière flexible la requête requise. données et concevez le rapport de génération de style. Maintenant, utilisez généralement des outils de rapport professionnels à faible code pour effectuer des rapports, tels que FinerePort pour faire des rapports, améliorer l'efficacité du développement et l'analyse de la mise au point. Après tout, personne ne veut être impliqué dans le rapport.


Le mécanisme de la hiérarchique de données en liaison avec l'incitation précédemment, constatera que peu importe la couche de couche, il est nécessaire de signaler . Personnel pense que le rapport n'est pas produit avec le rapport, mais comment utiliser le rapport comme activité du projet.


La grande entreprise aura du personnel de projet responsable du rapport d'analyse de ce travail, l'analyse de la demande de rapport, la planification du système d'indicateurs et la classification de la gestion du personnel de base et la conception superposée autour de l'entreprise.

Pour l'employé de la base, le nombre de rapports utilisés est enregistré des données et des données de requête. Par exemple, le personnel du shopping parcourez les données pour voir la vente de marchandises, à temps à la réapprovisionnement, il existe également une entrée de données de vente quotidienne.


Pour certaines des personnes d'affaires, le rapport n'est plus un simple affichage et une entrée, qui dérivera certaines analyses, telles que le responsable des achats, il doit décider de la marque de marchandises. Acheté, à partir duquel le fournisseur est acheté, comment planifier les produits du magasin. Cette méthode consiste à voir quels produits pour voir quels produits sont achetés, à savoir s'il faut ajouter quelles marchandises de marque doivent être achetées, abandonner ces biens de marque ou promouvoir la promotion. Le discours plus haut est d'utiliser des données pour optimiser la structure des produits de base et choisir le fournisseur.


Pour la direction de l'entreprise, la surveillance du tableau de bord pour les indicateurs, l'analyse de la performance (temps, la latitude régionale, etc.). Et ce processus repose également sur des données pour faire des méthodes de gestion peut prendre des décisions selon les méthodes de gestion standard (si les employés jugent, le leadership est la prise de décision ...)



Sujets

Catégories