Skip to main content

4. Modélisation de la taille

4.1. Taille de la technologie de modélisation

La modélisation de la taille est le noyau du système DW / BI, il est la cible du système ETL, la structure des bases de données, les requêtes de support d'utilisateur tissu et les rapports de production. La modélisation pour atteindre trois objectifs de conception principaux, il est: afficher autant que possible les besoins des utilisateurs; Vous pouvez revenir à la requête dès que possible pour fournir aux utilisateurs; Fournir des informations pertinentes pour surveiller avec précision les entreprises de traitement potentielles.


Le modèle de taille peut rendre n'importe quoi aussi simple que possible, mais cela ne simplifie jamais. Dans les bases de données et l'intelligence commerciale, le modèle de taille est la structure préférée pour afficher des informations, plus pratiques que le modèle standard du système original typique. La taille de la modélisation est inférieure et le package d'informations est un portefeuille de services cohérent, avec une signification utilisateur. Ces catégories sont appeléesEst la taille, aide les utilisateurs à parcourir le modèle car toutes les catégories qui ne sont pas liées à une analyse spécifique peuvent être ignorées. Mais le plus simple peut ne pas dire que ce modèle est sûr. Le modèle doit refléter l'entreprise, tandis que les entreprises sont souvent plus compliquées. Si cela simplifie trop, il ne présente généralement que des données simplifiées et le modèle perdra des informations sur la compréhension des activités. Quelle que soit la modélisation des données, la complexité du contenu des données qui fabrique la plupart des personnes sera éventuellement prête à accéder aux systèmes DW et BI au moyen d'applications analytiques et de reporting structurées.

La modélisation de la taille fournit une meilleure performance de la requête, car dans la taille, la méthode anti-sécurisée est utilisée, en connectant différentes hiérarchies et tables de requête, le programme d'optimisation estime moins de liaisons de connexion, créant moins d'intermédiaires que des tables temporaires.

pour surveiller avec précision les processus opérationnels potentiels, doivent s'appliquerN une conception multi-conçue pour créer des modèles d'entreprise et de suivi précis. Le modèle de taille consiste en une ou plusieurs usine centrale et sa taille. La table réelle est située au centre, tandis que les tailles sont entourées autour d'eux, semblables à la structure étoile, le modèle de taille devient donc un modèle d'étoile.

4.1.1. Commission d'information

La table réelle est la table de base des modèles de taille et stocke de nombreuses données de performance. Les cartes de tension stockant les valeurs mesurées sont obtenues à partir du processus de traitement de l'entreprise dans un seul centre de données. Étant donné que les données de données sont accablantes pour la plus grande partie de tout centre de données, évitez de stocker leurs copies dans différentes parties de l'entreprise. Utilisez le terme "réel" représentant une valeur de service. Exemple: Profil de vente des marchandises pour la quantité de vente et les ventes de chaque magasin. Une donnée peut être prise à l'intersection de chaque valeur de taille.Moins (date, produit et magasin). La liste des valeurs de taille fournit une forme de particules d'une véritable bulletin d'information et détermine quelle est la valeur de la valeur de la valeur. Dans la conception actuelle de la table pour résoudre des problèmes importants:

Taille de particules (détails de la réalité): niveau détaillé d'informations contenant des informations appelées granulomes. Il est recommandé que la table réelle soit construite au niveau minimum d'origine - souvent appelé niveau atomique. Les tables de libération atomique fournissent une flexibilité complète et des données peuvent accumuler toute synthèse requise pour le moment ou à l'avenir. Chaque table réelle doit avoir une taille de particules. Par exemple: si l'élément de prévision mensuel et un article de commande de vente distinct sont inclus dans la même carte d'information, très déroutant et dangereux.

Additifs: L'augmentation réelle est très importante car les applications d'entrepôt de données ne font presque que récupérer des données peu fiables de l'événement. NPartir, il est souvent ramené des centaines, des milliers de rangées ou même des millions de marchandises, et la chose la plus utile à gérer beaucoup de biens est de les ajouter. Mais certaines vérités sont la moitié, alors que d'autres sont susceptibles d'avoir des relations sexuelles. Les événements qui sont ajoutés la moitié sont tout simplement plus des tailles, tandis que les événements n'augmentent pas complètement ne peuvent pas être ajoutés. Pour les événements qui n'incluent pas, si vous souhaitez le résumer, vous devez utiliser le comptage ou la moyenne, ou vous pouvez réduire tout pour tout imprimer. En raison du fait que ces producteurs, ce sera un travail lent et ennuyeux.

Données texte: Les données théoriques peuvent être une forme de texte, les données de texte peuvent être une description d'une certaine chose. Cependant, les concepteurs devraient essayer de convertir des métriques de texte en taille car la taille peut être liée plus efficacement avec d'autres attributs de taille de texte et consommer moins d'espace. Ne peut pas stocker des informations de texte en excèsDes abeilles de table réelles. Sauf si le texte est unique pour chaque ligne de la table réelle, il devrait appartenir à la table de taille. Le texte apparaît vraiment rarement dans l'entrepôt de données, car le texte est imprévisible comme le contenu du texte libre, presque impossible à analyser.

Options principales: L'option principale de la modélisation de données multidimensionnelles est un problème. Il contient une exclusion entre la performance et la gestion facile. L'option principale est principalement adaptée à la taille. Vous devez être une clé étrangère à la serrure sélectionnée par taille. Les touches de taille ont deux options: vous pouvez affecter une clé arbitraire ou utiliser l'identifiant dans le système d'exploitation. Toute clé est généralement juste quelques séries. Lorsque vous avez besoin d'une nouvelle serrure, le prochain numéro disponible est attribué. "Pour utiliser l'identifiant dans le système d'exploitation pour exprimer la taille, vous avez parfois besoin d'un bouton synthétique. Le bouton Collage est une clé qui inclut plusieurs colonnes. Toute clé est une colonne, généralement plus que l'activité obtenir. Par conséquent, les clés arbitraires peuvent souvent. rendre des connexions plus rapidement. ""Le dernier coefficient de la sélection est son impact sur la table réelle. Lorsque le réel est créé, vous devez affecter chaque dimension. Si la taille aura une chronologie d'activation pour faire fonctionner l'origine de l'historique des données, il n'y a pas de supplément travail lors de la création de la réalité. La connexion aura lieu automatiquement. Pour n'importe quelle clé ou tout identifiant historique, vous devez affecter la clé du fait. "" Il existe deux façons d'allouer la clé. L'un est la table de conversion de la maintenance et de l'entrepôt de données opérations. Autre est le stockage de verrouillage actif et, le cas échéant, stockez l'horodatage sous la forme de données d'attribut sur la règle de clic. "Le choix est donc effectué entre de meilleures performances de toutes les clés de clé et de manipulation." Combien de performances d'amélioration et augmentation La maintenance doit être évaluée dans votre propre organisation que vous. "" Si un choix, vous devez les créer en métadonnées. Ces informations sont nécessaires pour gérer et gérer les entrepôts de données. Si l'outil que vous utilisez ne masque pas le processus de connexion,Les utilisateurs peuvent également avoir besoin de comprendre cela. "
Cohérence: Si certaines données apparaissent dans différents événements, il est important de noter que si vous devez comparer ou calculer des événements dans différents événements, vous devez garantir car les définitions techniques des événements sont les mêmes. Si l'événement est différent. Si l'événement varie la définition de la table est cohérente et que ces constructions doivent avoir le même nom. S'ils ne sont pas compatibles, il devrait y avoir des noms différents, il devrait y avoir des noms différents pour dire aux utilisateurs de l'entreprise

Classification des événements: Board d'information sur les transactions, tableau d'instantané cumulatif cumulatif cycle.

Événements Livraison Traduction: données d'un espace dans l'espace ou du temps de réponse. Les détails de la transaction atomique sont une taille réelle et une table indiquée, cette taille correspondante pour assurer des points de données maximaux et des blocs de transaction. La carte de transaction peut être dense, ou il peut se débatcher car il ne sera défini que lorsqu'il y a une donnée. nCette table réelle contient toujours une taille que la clé étrangère pertinente peut également contenir des signes de temps précis et une dégradation précise. Les données doivent être cohérentes avec le détail de la transaction.
Facteur de tir périodique: le résumé de la table réel a grandi dans un certain cycle standard, tel qu'un jour, un mois. La taille des particules est périodiquement, au lieu de problèmes individuels. L'événement d'instantané contient généralement de nombreux événements, car toute donnée correspond à la table réelle est autorisée. Ces vérités La densité de sa liaison étrangère est unifiée, car même sans aucune opération pendant le cycle, elle insérera une ligne contenant des valeurs 0 ou null dans la table réelle.
Snapsheet accumulé: le fait que l'introduction réelle aura lieu le processus de démarrage et de fin entre des étapes prévisibles. Le processus de tuyauterie ou le flux de travail a un point de départ, le processus intermédiaire standard, la fin de la définition, ils peuvent êtreModélisation dans laquelle les tables réelles. Habituellement, en fait d'importants étapes dans la table comprennent des cours externes. Accumuler une ligne dans la table réelle, correspondant à un ordre spécifique, insérera une ligne lorsque la commande est créée. Lorsque le processus de pipeline survient, l'accumulation de la ligne de table est accessible et modifiée. La révision de la table d'informations photo cumulée est caractérisée en trois types. Outre les cours de devises liés à chaque étape des processus importants, accumulez des installations d'instantané contenant d'autres tailles et de la tailles de dégradation optionnelles. Clés étrangères. Souvent cohérent avec le détail du niveau de détail, correspondre à la jalon pour compléter la latence


4.1.2. Les dimensions


Le tableau de dimension contient une description de document de l'entreprise. Dans le modèle de taille conçu, la carte de dimension comporte plusieurs colonnes ou propriétés, fournissant une description de la rangée de la table de taille. La table de dimension a tendance à créer un nombre spécial de colonnesGrand, chaque taille identifie un seul mot-clé principal et la clé est la base de l'intégrité de l'application entre tout tableau réel qui y est connecté.


Les propriétés de la taille sont une source de liaison de labels de rapports de requête, de groupe et de base créés. Par exemple, les utilisateurs verront les ventes selon la "semaine" et "marque", puis "semaine" et "marque" doivent avoir des attributs de taille disponibles. La capacité de l'entrepôt de données est proportionnelle à la qualité et à la profondeur des caractéristiques de taille. Plus vous fournissez de temps aux attributs détaillés des capteurs d'entreprise, en tant que base de données que possible. Plus possible, plus de temps pour certaines zones de la colonne Attribut, l'entrepôt de données. Plus il est possible de veiller à la qualité de la valeur de la valeur, de l'entrepôt de données que possible.

Le meilleur attribut est le texte et discret. Les propriétés doivent être du texte réel et non du code. Par exemple, pour les produits, les propriétés typiques doivent inclure une descriptionThắm, une description longue, nom de marque, nom de catalogue, type d'emballage, taille et un grand nombre d'autres caractéristiques de produit.


Les dimensions décrivent généralement la hiérarchie du service. Par exemple, le produit est divisé en marques puis classées. Chaque taille de produit est stockée avec des produits liés au produit. Cependant, les informations décrivent le niveau de stockage très excédentaire, mais il est également basé sur la prise en compte de l'efficacité et de la requête faciles. Ce formulaire peut être appelé des flocons de neige non stockés dans le manque d'étiquettes et la mise en place d'une table de requête de marque distincte. Les dimensions ne sont généralement pas contrôlées et sont généralement très petites. Étant donné que la carte de dimension est généralement faible, la pratique améliore l'efficacité du stockage avec des vaisseaux ou des flocons de neige standardisés, de sorte que dans les applications réelles, utilise presque toujours l'espace des dimensions brièvement et accessibilité.

doit également être compris:Taille de dégénérescence, taille multi-niveaux, taille plate non normalisée, taille de flocon de neige. OLAP est divisé en taille: taille requise, taille normale, taille dérivée, taille hiérarchique. Multi-compétence: cohérence intégrée, changement lent, taille hiérarchique

4.1.3. La combinaison de l'événement et de la taille

par des données numériques de table réelles inclut des valeurs connectées à une dimension de table remplissant dans l'attribut Description. Cette structure de fonctionnalité STAR est souvent appelée schémas de connexion étoile. En ce qui concerne le plan de taille, vous devez faire attention à la première chose à faire de la pertinence et de la symétrie de son sexe. Configuration faisant référence à la compréhension des données facilement et facilement des utilisateurs; La pertinence a également amélioré les performances et d'abord, les entrepôts filtreront la table des dimensions, puis utilisent le terme table de ALBHIGHT pour répondre aux contraintes de l'utilisateur. Réalités toutes les tables réelles en une fois.


Les modèles de table de taille ontPeut être élargi naturellement pour répondre aux changements de demande. Le cadre éprouvé du modèle de taille peut résister au test causé par le changement de comportement des utilisateurs imprévus. Chaque taille égale et toutes tailles sont une entrée de pair à la table réelle. Chaque modèle logique n'a pas de déviation intégrée liée à certaines formes de requête attendues, aucune affaire de commerce ce mois-ci à optimiser par rapport au mois prochain. Personne ne veut que si l'utilisateur de l'entreprise utilise de nouvelles façons de mener une analyse commerciale, il est nécessaire d'ajuster les conceptions telles que des conceptions. Le but et la taille réelle des modèles de taille sont les suivants:

Au cours du processus de conception, une taille de particules optimale ou des données atomiques est la meilleure taille. Les données atomiques synthétiques sont les données les plus expressives. Les données atomiques doivent constituer la base de chaque conception actuelle. Par conséquent, l'attaque spéciale causée par l'enquête ne peut être trouvéeDans l'utilisateur de l'entreprise. Pour les modèles de taille, vous pouvez ajouter de nouvelles tailles à la solution, tant que sa valeur est définie de manière unique pour chaque ligne réelle existante. De même, vous pouvez rejoindre la table de fait dans la table de fait, tant que ses détails sont dans un plan horizontal constant possible. Les dimensions existantes peuvent être complétées avec l'attribut nouvellement attendu ou la taille actuelle peut être décomposée à partir d'un niveau de détail inférieur du coin d'un certain temps. Dans chaque cas, vous pouvez simplement ajouter de nouvelles lignes de données à la table ou à la modification appropriée à la table actuelle.

Un autre moyen de comprendre les éléments et les tables de taille est de les comprendre dans le rapport signalé. Comme indiqué ci-dessus, les propriétés de la taille fournissent le contenu de la création de cartes de rapport et de tables réelles fournissant la valeur numérique du rapport.


Enfin, comme souligné, les données du lien affichées doivent être sous la forme dimensionnelle.Cependant, il existe une relation naturelle entre le modèle de taille et le modèle standardisé. La clé de la compréhension de cette relation est de se rendre compte qu'un seul diagramme d'urgence standard décomposer généralement des schémas multidimensionnels. Un modèle de modèle standard à grande échelle pour les organisations peut mettre dans les ventes téléphoniques, les commandes de commande, les charges de facturation, les paiements des clients, les profits du produit, V.V. Dans une certaine mesure, la carte standard ER est une sorte de préjudice à elle-même, car il n'apparaîtra jamais dans une seule donnée dans un ensemble de données unique. On peut voir que les modèles standardisés ont l'air très compliqués, ce n'est pas surprenant.


S'il existe une carte standard existante, la première étape pour le convertir en un ensemble de modèles de taille consiste à scinder le diagramme ER en une gestion distribuée numérique, puis séparément. des modèles. La deuxième étape consiste à choisir des relations multiples multiples qui contiennent des usines ne connaissent pas les mots-clés numériques et l'ajout et eScellez-les sous la forme de tables réelles. La dernière étape consiste à respecter les tables restantes dans une planche à plat avec un mot clé de liaison unique qui est directement connecté à la table de fait, devenant la table des dimensions.

4.2. Processus de modélisation de la taille


La taille de la modélisation à son tour a un certain ordre: 1 Traitement des entreprises 2 Graines Taille 3-Dimensionnelle 4 Vérité.

4.2.1. Choisissez un processeur d'entreprise

Le processus de traitement de l'entreprise est une entreprise naturelle qui est généralement fournie dans l'organisation. L'écoute de l'avis de l'utilisateur est la plus grande efficacité du processus de traitement des entreprises. Lors de la sélection des stades commerciaux, le processus de conception des modèles de données doit avoir une perspective mondiale et croissante et devrait comprendre le processus d'entreprise global en fonction du point de vue général.

Le point important à retenir est que la gestion des affaires de ce document ne se réfère pas aux unités ou aux fonctions commerciales. En définissant la concentrationEntrer dans des processus de traitement des entreprises, des données cohérentes peuvent être envoyées à plus économiques dans l'organisation. Si le modèle de taille est défini sur la même zone avec la même zone, la possibilité de copier des données avec différentes cartes et conditions. De nombreux données diffusent dans des modèles de taille distincts, cela rendra les utilisateurs en conflit. Le meilleur moyen d'assurer la cohérence est de faire une libération jetable. Un processus d'émission unique peut également réduire le développement de l'ETL, ainsi que le fardeau de la gestion des données et du stockage du disque suivant.


4.2.2. Détermination de la taille des particules

La définition de la taille des particules signifie une description claire du représentant réel du représentant réel. La taille des particules transmet les informations de niveau détaillées associées à la valeur de forme réelle. Il a donné la réponse à cette question "Comment décrire le menu de la table réelle?


La définition de la taille des particules est une étape importanteCe n'est pas brillant. Lors de la détermination du niveau de priorité de la taille des particules est donnée pour obtenir les informations les plus atomiques pour gérer les entreprises, développer des modèles de taille. Les données atomiques sont les informations les plus détaillées collectées, ces données ne peuvent plus faire plus de segments. La plupart des données de l'assemblage au niveau le plus bas. Les niveaux atomiques montrent sa valeur dans l'application avec plusieurs applications chimiques. Données atomiques avec des hautes hauteurs. Les détails de la valeur réelle sont bons et atomes, en savoir plus, toutes les choses exactes qui savent sont converties en taille. À ce stade, les données atomiques peuvent être une excellente combinaison pour les méthodes de taille.

Les données atomiques peuvent fournir une flexibilité maximale pour l'analyse car il peut accepter des formes de liaison possibles et peut apparaître dans n'importe quelle image possible. La taille de la taille des données est stable et il est toujours prêt à accepter des attaques spécialesdes utilisateurs d'entreprises.


Bien entendu, il est toujours possible de déterminer le niveau de taille de particules plus élevée, représentant la collecte de données la plus atomique. Cependant, tant que vous choisissez un niveau de détail plus élevé, cela signifie que vous pouvez limiter vos propres tailles pouvant être plus petites. Un modèle de taille de particules moins faible est plus facile directement directement comme une attaque imprévue d'exigences de l'utilisateur détaillées. Un moyen de rassemblement est un rôle très important en tant que moyen d'ajustement, mais il n'est pas servi d'alternative à l'utilisateur pour accéder au bas des détails. Malheureusement, certaines autorités ont vaguement sur cette question et prétendent que le modèle de taille ne convient que pour des données sommaires et de critiquer ceux qui estiment que la méthode de modélisation de taille peut répondre aux besoins de la prévision des entreprises. De tels malentendus disparaîtront lentement lorsque les données atomiques détenues apparaissent dans le modèle de taille. [douzième3]

4.2.3. Le problème provient de la taille de la taille


est la suivante: "Comment les entreprises décrivent-elles les données obtenues à partir du processus de traitement de l'entreprise?" Vous devez utiliser un groupe pour avoir une valeur unique dans chaque donnée pour exprimer une riche description de toutes les situations possibles et porter des tables réelles. Si le contenu de la taille des particules est clair, la taille est généralement très facile. Grâce à la sélection de la taille, vous pouvez énumérer des propriétés de texte discrètes faisant chaque carte de dimension. Les exemples courants incluent: date, produits, clients, comptes et organisations.

4.2.4. Détermination pratique

Il est la quatrième étape du processus de conception est également la dernière étape, soyez soigneusement déterminé que les événements doivent apparaître dans des conseils actuels. La détermination des faits peut être faite en répondant à ce que vous voulez. évaluer. Les utilisateurs d'entreprise ont de fortes préoccupations pour analyser les données de performance de traitement économiqueIl. Toutes les informations disponibles pour la conception doivent répondre aux exigences de la taille des particules définies à l'étape 2. Le fait qu'il est clair avec une taille de particules différente doit être placé dans une table d'informations distincte. Il est généralement situé à partir des trois coins suivants:


Pour un comportement spécifique, établissant une table réelle avec une unité minimale d'activité comportementale. La définition des unités de fonctionnement minimum dépend de l'analyse des besoins professionnels. Par exemple: appel de site Web d'un utilisateur, un comportement de connexion Web, un enregistrement d'appel d'appel. Ce fait est principalement utilisé pour l'émergence de statistiques, de comportements, principalement l'apparition de l'analyse des données pour la distribution des entreprises, la comparaison de l'authentification des performances, V.V. Visant l'état d'un objet d'entité à l'heure actuelle. Nous stockons leurs instantanés à différentes étapes de cet objet entité, telles que l'équilibre de l'utilisateur, le nombre de personnes appartenant à la personneutiliser. Grâce à ce principal indicateur de quantité peut compter des entités dans différents cycles de vie.

Pour des sujets d'analyse et de surveillance importants des entreprises et des statistiques sur différentes activités commerciales de l'ensemble des entreprises. Par exemple, les membres peuvent effectuer ou participer à de nombreuses activités comportementales spécifiques. Ce fait est un total et un résumé des deux vérités. Il est principalement utilisé pour suivre et enquêter sur les activités de notre entreprise.

4.3. Digital dans le système de modélisation du système

Après une longue exploration, la classe est généralement divisée dans le processus de modélisation physique. Ce sont: événements de base, résumés de lumière, widgets de marché.

Détails: La taille des particules de base de la classe de base est bien, généralement similaire au détail de la classe ODS, mais le nettoyage, la normalisation et la commodité sur la base de données SAO. Une certaine intégration d'analyse peut être combinée avec les tables de clicAppliquer.
Résumé de la lumière (AGCH): Résumé basé sur les exigences de données de différents marchés, des données populaires abstraites et résume les détails des citants (par exemple, un articulation de calibre, de direction).

Sujet: Le marché est principalement créé sur une base de résumé de la lumière, car les données du résumé de la lumière sont biaisées, donc en fonction de la taille des particules et de la taille commune de ces événements.Intégrez-les à travers une interface de niveau supérieur.

Taille: Les jauges de taille sont synchronisées directement directement du côté de l'entreprise, en fonction du compteur de taille de la table réelle et de la table de taille est créée directement, V.V.


Sujets