Top mots
Deux jours Il existe une affiche dans une pulpe très chaude, le thème discute vraiment de la modélisation des données, de sorte que je suis surpris! À ce stade, n'est-ce pas un programme de prix final et de nouvelles incitations? Cet article est un camarade de classe de Baidu en vomissement, et il semble être une vache, mais pourquoi des situations dans le travail réel?
"Quelles sont vos données construites vraiment?"
Données, la traction de données, une largeur, des logarithmes, une exécution de lots, des erreurs de recherche ... Il s'agit de l'activité quotidienne de la plupart des principaux ingénieurs de données, disant que le bon tissu de laine modèle? Pourquoi ai-je construit une table de largeur tous les jours?
Cette chère question est vraiment intéressante. Le pouls a été incendu, mais n'a pas dit de vrais points. Voici un ami, écrit modèle de données, la source théorique est deux grand-père, évitant impossibleL'étang copie du contenu. Cela semble être une petite vérité. Mais avez-vous déjà pensé à cette question, pourquoi poseriez-vous cette question?
Parce qu'il a vu
,
La faiblesse de Inmon
a suggéré la probabilité de succès dans la construction d'un projet d'entrepôt numérique? Plus de 80%,
Pourquoi?Certains géants dans le cercle de formation étudient également. Après avoir étudié Inmon, KIMBALL, une série d'actions majeures et un résumé de l'échec de la Société, attire enfin cette conclusion:
est si la logique du moine d'Inmon, du sommet de la construction complète, de la mise en œuvre Le cycle est généralement très long, généralement 1 à 2 ans.
Lorsque la mise en œuvre est terminée, il est probable que les gens nous demandent au moment de ne pas savoir qu'ils veulent le faire. Par conséquent, le père de Kimball est basé sur l'expérience de nombreuses années de projets de consultation, proposant de réduire la construction et d'améliorer le taux de réussite. C'est-à-dire que c'est souvent dit, modèle de construction de Kimball de bas en haut.
Bien entendu, des méthodes de construction complètes ont également été développées et les grands fabricants ont des modèles de sortie standard N pour différentes industries, telles que Teradata FSLDM, IBM BDWM, IAA, IW, SYBASE IWS, etc. au. Ce sont tous des points standard de l'industrie, qui peuvent être poussés directementP à la seconde moitié du modèle logique.
Le vieil homme d'Inmon a ensuite été optimisé avec KIMBall et a finalement proposé le concept d'usine d'information de l'entreprise CIF. À propos: Inmon et Kimball deux Big 佬 ne sont pas complètement coupés en ligne et CIF est également reconnu par KIMBALL et KIMBALL est également nié que les méthodes de haut en bas sont entièrement construites et de bas en haut. Viens. Mais même lorsque cela se trouve, la distance entre la période de construction numérique et les besoins de l'entreprise est toujours une faiblesse.
Dans le passé, cette faiblesse était correcte, car les changements de la population sont toujours conformes aux attentes et à la portée de la construction de KIMBALL, ont également une industrie des normes publiques du LDM, le taux de construction réussie est très rapide.
Mais! À présent! Da khanh est mort ~~~!
assis par
! Ceux-ci vous pouvez utiliser des ballesDharma pour obtenir un mois pour changer
? Dans chaque inmon, Kimball ne peut pas le faire! J'ai mis en œuvre des entreprises traditionnelles et des sociétés Internet. Dans les entreprises traditionnelles, fondamentalement, il est conçu, puis non géré, car les politiques d'évaluation des performances ne changeront qu'une fois par an.
Mais j'ai été époustouflé dans la société Internet! Leur performance est libérée une fois par mois! Ces
par conséquent, le nombre de cycles de construction d'entrepôt a créé une grande zone d'échec dans le projet numérique, à l'âge de l'Internet, une nouvelle fois amplifiant, devenant des places Faible Faible.
Modifier les affaires rapides, laissez-nous
pas de modélisation de temps!
Internet Numérique
Lorsque vous opérez, les camarades de classe de produits sont assis à côté de vous, vous regardez votre travail, vous sentez-vous? Je ne sais pas ce que tu ressens. Quoi qu'il en soit, quelqu'un se tient derrièreJe vais immédiatement commencer l'alarme physiologique originale dangereuse. Si vous étiez, sentez cela, comme un front, comme la gorge! J'ai hâte de quitter cet endroit immédiatement, mais aussi besoin d'arrêter une gifle dans votre poussée. Alors d'envoyer cette prostituée, nous ne pouvons que le tirer directement!
Nous mettrons beaucoup de scènes, comment gérons-nous des analystes de données, des activités et des camarades de classe de produits?
À cette promotion des affaires, il sera préférable, appellera les camarades de classe du nombre. Pas bon, lancez-le pour vous, le projet est en ligne la semaine prochaine, les données doivent également être lancées de manière synchrone.
est encore pire, le projet est en ligne, puis vous vous parlerez. Comment dites-vous? Dans
D'une part, la nouvelle entreprise n'a pas de modèle universel. D'autre part, il n'y a pas assez de temps. Vous serez rampé, modèle de modélisation, vous devez brosser la règlePremière entreprise? Mais de nouvelles affaires, le processus d'entreprise peut ne pas être capable de dire à personne.
OK, votre honte d'entreprise, voulez-vous voir des données? Mais de nouvelles affaires, même des données ne sont pas! De plus, il y a une pile de nouvelles fonctionnalités dans la conception, non,
"Même si vous avez 72 variantes, vous pouvez le faire, vous ne pouvez voir que le déplacement ou la perte de la largeur, le laisser partir.! Par conséquent, le groupe Internet recrute et relativement petit pour données construites dans une petite moitié de l'année, mais pour choisir d'excellents ingénieurs de données, les gens peuvent s'échapper immédiatement en direct, résoudre les devoirs, les planifications et les optimisations.
Y a-t-il une mise en page
Oui, oui, ne nie pas que la planche à dessin est actuellement de grands ingénieurs de données quotidiens aujourd'hui. Mais les camarades de classe, vous avez oublié un facteur très important. C'est l'histoire
Il peut y avoir des personnes qui voyagentLe nouvel horaire ne sais pas, Alibaba a Teradata, Oracle, Southast Rongtong, V.V.
Selon le respect des données à ce moment-là, il doit s'agir d'une plaque et du moment prescrit. Même alors, je suis allé à IOE, j'ai rejoint un groupe de personnes, mais la tradition de données était maintenant gravée.
ne nous laissera donc pas à un moment donné, ce qui nous permettra de tirer la largeur tous les jours! Venez, quel est le facteur le plus important dans le succès du succès de la quantité?
est une norme! C'est une spécification minutieusement effectuée! Vous n'êtes pas de
en outre, en raison de la popularité de la technologie de données importante et de l'exportation HLa partie supérieure de différentes scènes avec des exigences à haute efficacité, de grands services publics, tels que des formes larges, des bitmap, des filtres Buron, etc.
Avant Internet, la table de la largeur de personne n'est logique de la conception de la bibliothèque de services, conforme strictement à trois modèles, conçue pour restreindre la table. Certaines personnes pensent que la table étroite est l'école, la largeur est plus que l'école. En fait, ce n'est pas le cas. La distinction étroite n'est pas un champ, mais
est une école de secours
.
Si une table, tous les champs que vous souhaitez effectuer, incluez des identifiants, des valeurs de code, des valeurs, aucune connexion à d'autres tables, ce qui signifie une table de largeur. Bitmap est une information hautement compressée que les informations de chaque utilisateur sont 0, 1. Exemple: si l'utilisateur est en ligne, il est devenu une chaîne "01010011101101" super longue.
Une longue chaîne tous les jours, alors vous voulez aller en ligne pendant 7 jours, faites ces cordes à vraiUne action "et", sélectionnez toutes les valeurs. Pour le bit "1", l'utilisateur respectif est le résultat du désir.
Le filtre BURON est également très intéressant, le principe est une fonction de hachage + bitmap et des applications typiques recherchent rapidement ces informations. Devenez toutes les informations Hash a un numéro puis mappé sur Bitmap. Si vous souhaitez évaluer si vous devez avoir cette information dans la bibliothèque, accédez à cette photo pour la voir. Parce que c'est hachage, toutes les informations peuvent être définies, telles que des images, des connexions, des fichiers.
Tournant Intelligence
Il y a un nouveau jeu, il est manquant.
Exemple: verrouillage de proxy, premier, très chaud, utilisé pour séparer un système de code de code numérique et système de codes de système d'entreprise. Maintenant, je dois convenir d'identifiant ou utiliser l'ID d'origine. Par exemple: Zip Tableau, c'est un bon moyen, les dernières données et les données historiques sont ensemble et les modifications apportées au statut peuvent être tirées à tout moment. Mais maintenant nC'est un magazine extrêmement stocké.
Merci de votre lecture, ce contenu partagé est terminé.Ce compte public est actuellement sur 3 000 mots, vous fournissant le partage d'excellents domaines de données.