Source: 智 智
Si vous gérez des données sous la forme d'un livre dans la bibliothèque, nous espérons les voir à les mettre sur des étagères; Si vous voyez des données comme une ville, nous espérons que la mise en page de planification urbaine est raisonnable; Si vous examinez les fichiers et les dossiers informatiques, nous espérons avoir une bonne méthode de répertoire en fonction de vos propres habitudes, pas un mauvais ordinateur de bureau chaotique, souvent trouvé un fichier. Je ne sais pas ce que c'est.
Le modèle de données est une organisation de données et une méthode de stockage mettant l'accent sur le stockage des données appropriées du point de vue du service, de l'accès des données et de l'utilisation. Le fondateur de Torvalds of Linux a un "grand programmeur": "Si les mauvais virages liés au code, le programmeur s'intéresse à la relation entre la structure de données et la relation entre eux", décrivent l'importance des données de modèle. Sexe. Avec un modèle adapté aux environnements de stockage de données de base et d'entreprise, de grandes données disponiblesPeut obtenir les avantages suivants.
Performance: le bon modèle de données peut nous aider à interroger rapidement les données nécessaires, réduire les E / S via des données.
Coûts: Un bon modèle de données peut réduire considérablement la fourniture de données inutiles et peut également obtenir des résultats de calcul de multiplexage, un stockage et des dépenses considérablement réduits. Frais de calcul dans les grands systèmes de données.
Efficacité: le bon modèle de données améliore considérablement l'expérience d'utilisation des données utilisateur et d'améliorer l'efficacité de l'utilisation des données.
Qualité: Un bon modèle de données peut améliorer l'incohérence des statistiques de la barrique des données et réduire la possibilité d'erreurs de calcul de données.
Par conséquent, il ne fait aucun doute que le grand système de données nécessite des méthodes de modélisation de données pour aider à mieux organiser et à stocker des données pour obtenir le meilleur équilibre entre la performance, les coûts, l'efficacité et la qualité.
1. Système de base de données relationnelle et d'entrepôt de données
e .F .codd est le nez ancestral des bases de données relationnelles. D'abord, il a proposé le modèle de relation entre le système de base de données pour créer la relation de base de données et la théorie des données relationnelles. Avec un grand nombre de bases de données relationnelles à grande échelle, tels que Oracle, Informix, DB2, etc les systèmes d'information d'entreprise modernes utilisent des bases de données relationnelles pour stocker, poignée et traitement des données. Les systèmes d'entrepôt de données ne font pas exception, un grand nombre de systèmes d'entrepôt de données sur la base de traitement des données et la capacité de stockage puissante base de données et de données modèles utilisés Basé sur la théorie de la base de données relationnelle.
Bien que l'archive et de l' infrastructure calculée des données récentes ont développé rapidement dans la distribution, noQuery technologie est également commune, mais quel que soit le système Groupe MaxCompute POO, Spark ou Alibaba, toujours en utilisant à grande échelle et des données le traitement, les tables de stockage de données sont encore utilisés, toujours en cours d'utilisationNG décrit la relation entre la théorie des relations de données, mais dans le champ de données volumineux, sur la base de ses fonctions d'accès aux données sur le modèle du modèle de données relationnel uniquement des options différentes. Une description détaillée et une définition des modèles, ainsi que d'autres théories de la base de données relationnelles constituent la base des champs de modélisation de données volumineux, la lecture de la base de données classique de la base de données de la base de données peut faire référence à des éléments associés, tels que "concept de système de base de données".
2. Méthode différente du modèle sélectionné et des systèmes OLAP OLAP
Les données principales à utiliser le système OLTP sont généralement accessibles au hasard, principalement pour répondre à la relation d'entité. modèle stocké dans des données 3NF pour résoudre les données de transaction et les problèmes convenus; et le système d'orientation principale des données d'OLAP lecture et écriture en vrille, les transactions ne sont pas liées à OLAP, son objectif principal sur l'intégration des données, ainsi que des requêtes complexesLes temps et les grandes données de performance de traitement, il a besoin d'utiliser des différents modèles de données.
3. Père Bill modelées un modèle d'entrepôt de données typique
Modèle ERentrepôt de données Inmon conception recommandée est un modèle 3NF de la hauteur du toute l' entreprise, avec une relation d'entité « entité - relation, ER » décrivant les entreprises d'entreprise, conformément au modèle théorique 3NF 3FN. La différence entre le système et l' entrepôt de données OLTP 3NF 3NF est qu'il se tient debout sur une perspective d'affaires pour les thèmes abstraits, au lieu d'un objet entité abstraite pour une relation spécifique de l' articulation des processus menstruel. Il y a les caractéristiques suivantes:
1 "et un examen complet de leurs transactions commerciales;
2" conditions très longues;
3 « A propos des capacités requises du modèle très élevés;
Le point de départ pour le modèle modélisant modèle entrepôt de données Er lEh bien, l'intégration des données, chaque système de données se rapporte à l'ensemble de l'entreprise en combinant des coins et des similitudes qui ont été incorporés et traités, des données analysées et des services de décision cohérents, mais ne peuvent pas être utilisés directement pour analyser et modèles de décisions divisées en trois étapes:
Modèle de haut niveau 1 ": une description de modèle abstraite élevée La relation entre les principaux sujets et sujets est utilisée pour décrire l'aperçu général des entreprises.
Moule entre 2 "Type: sur la base du modèle de niveau élevé élevé, les éléments d'objet d'objets sont modifiés.
3 "Les modèles physiques" sont également appelés modèles de base ": sur la base du modèle moyen, envisagez le stockage physique, tout en effectuant des propriétés physiques basées sur les performances et les caractéristiques de la plate-forme, peuvent également effectuer des tables de fusions, des conceptions de partitions, etc.
Le représentant le plus typique du modèle ER est un modèle financier de modèle logique CLe FS-LDM est publié par Teradata, basé sur des entreprises financières, elle adopte une abstraction élevée et résumant des services financiers, la négociation financière est divisée en 10 sujets et une conception basée sur la conception basée sur le plan financier. Les entreprises peuvent rapidement répondre correctement pour ajuster et développer ce modèle.
Le modèle de taille était maîtres des propriétaires de Ralph Kimball dans le domaine de l'entrepôt de données, son outil d'entrepôt de données - Direction de la modélisation de taille complète est une donnée la plus courante. Projet d'entrepôt Modèle classique Modèle Warehouse.
La modélisation de la taille est construite à partir de l'analyse décisionnelle, est une analyse de service à la demande. Elle se concentre donc sur la manière dont les utilisateurs sont complétés plus rapidement. Besoin d'une analyse, alors qu'il existe des commentaires de requête complexes à grande échelle. Les représentants typiques sont un modèle d'étoiles, ainsi que des modèles de flocon de neige utilisés dans certaines scènes spéciales. CeConçu pour être divisé en étapes suivantes.
Sélectionnez le processus métier d'analyser la décision. Le processus métier peut être un événement professionnel unique, tel que paiement, remboursement, v.v.; Peut également être un état d'événement, tel que le solde de compte courant, V.V. Il peut s'agir d'un événement commercial en série, vous obligeant à analyser certains événements actuels ou de statut ou d'efficacité de transfert de ligne d'événement.
1 "Choisissez la taille des particules: dans l'analyse de l'événement, nous devons revenir à tous les niveaux de segment requis, déterminant ainsi la taille des particules sélectionnées. Cliquez sur la règle de grain, une combinaison de la taille .
2 "Détermination de la taille: Après avoir sélectionné la taille des particules, le groupe doit grouper et filtrer la conception, y compris la taille et les propriétés de dépistage lors de l'analyse.
3 "Sélectionnez la réalité: Identifiez les indicateurs à mesurer.
Données du coffre-fort modèle
Données du coffre-fortComme DanlinStedt a lancé un modèle créé, c'est le modèle Source ER, le point de départ de sa conception, mais également pour intégrer les données, mais ne peut pas être utilisée directement pour l'analyse et les données de décision. Il a souligné que la mise en place d'une couche de données de base contrôlée doit également mettre l'accent sur les données historiques, la traçabilité et les atomes qui ne nécessitent pas une cohérence excessive de données de traitement et d'intégration; Dans le même temps, il est basé sur le concept d'organisation de la structure de thème de données d'entreprise et introduit le prochain modèle de traitement afin d'optimiser le modèle pour faire face à l'expansion des changements de système source. Le modèle Vault Data comprend les sections suivantes.
1 "HUB: est l'entité commerciale principale, par la serrure de l'entité, les touches remplacent la chaîne de l'entrepôt de données, la durée de charge, les données de nombreuses sources différentes
[ 2 "Liens: représentants de la relation entre hub. Ici, le contraste maximal est la relation entre le modèle ER comme une unité de balle séparéePeut, peut améliorer le modèle d'extension. Il peut décrire directement 1: 1,1: N et: n Relations, sans avoir à apporter des modifications. Il comprend une serrure de moyeu de remplacement, une durée de charge, des données de différentes sources.
3 "3" Satellite: est une description détaillée du centre, il peut y avoir beaucoup de centres de moyeu par satellite, y compris des verrous de remplacement, une durée de charge, un type de source, une composante centrale décrivant dans détails. Le moyeu de squelette pour adultes peut comprendre, puis relier le fil de chigament connecté à la colonne vertébrale, la colonne vertébrale sur le satellite de la viande. Voir les exemples ci-dessous, à partir du guide de modélisation de données, Hans Hultgren, comme indiqué sur l'image.
Modèle d'entrepôt Exemple de données
Modèle d'ancrage
Neo sur le modèle de voûte modèle a eTraiter plus de normalisation, lars. Rönnbäck L'intention initiale est de concevoir un modèle élevé évolutif, l'idée principale ajoute simplement toutes les extensions au lieu de modifications, de sorte que les spécifications du modèle à 6NF, devenant un modèle de structure de base KV, nous examinons le composant du modèle d'ancrage.
1 "NEO: similaire à la voûte de données de moyeu, au nom de l'entité commerciale et seulement la clé principale.
2" Propriétés: fonctions La capacité est similaire à celle Le satellite des tunnels de données, mais il est plus standardisé, toutes les structures KV sont des structures et des tables seulement ont un attribut d'une ancre.
3 "Cravates: est la relation entre l'ancre, décrivant la table seule, similaire à la liaison de données de la voûte, qui peut améliorer la relation de modèle intégrée.
4" 4 "4". Le type de liste, telle que le sexe, le statut, etc. peut être dans de nombreuses ancrages, tels que le sexe, le statut, etc. et attributs publics.
Sur la base de quatre objets de base ci-dessus, il peut également être divisé en historique et sans historique, dans lequel l'historique enregistre les données d'enregistrement dans la voie des horodatamps plus plusieurs enregistrements.
La personne qui crée un modèle d'ancrage a une grande évolutivité de cette manière, mais aussi beaucoup de participation à la question. Le fondateur du fondateur se trouve dans l'entrepôt de données, l'analyse de la requête est basée sur un petit nombre de champs, similaires à la structure de stockage de colonne, peut réduire considérablement le processus de numérisation de données, pour accéder aux performances du problème moins affecté. Certaines bases de données de la table de données coupent l'onglet "Base de données de fonctionnalités" telle que l'apparence de la Mariadb, un grand nombre d'activités participantes. Mais la situation réelle n'est pas le cas, qui est également discutée. Vous trouverez ci-dessous une carte de modèle d'ancrage "de la modélisation de modélisation de modélisation d'ancrage dans le développement de l'environnement de données, l'auteur Lars. Rönbäck", comme indiqué.
Modèle Diagramme d'ancrage
Note: Certains livres dans ce livre ont des termes spéciaux, des termes professionnels, des noms de produits, des noms de projet logiciels, des noms d'outils, V.V.Taobao "China" Société logicielle "