Skip to main content

Top mots

Deux jours Il existe une affiche dans une pulpe très chaude, le thème discute vraiment de la modélisation des données, de sorte que je suis surpris! À ce stade, n'est-ce pas un programme de prix final et de nouvelles incitations? Cet article est un camarade de classe de Baidu en vomissement, et il semble être une vache, mais pourquoi des situations dans le travail réel?

"Quelles sont vos données construites vraiment?"



Données, la traction de données, une largeur, des logarithmes, une exécution de lots, des erreurs de recherche ... Il s'agit de l'activité quotidienne de la plupart des principaux ingénieurs de données, disant que le bon tissu de laine modèle? Pourquoi ai-je construit une table de largeur tous les jours?


Le livre est situé?

Cette chère question est vraiment intéressante. Le pouls a été incendu, mais n'a pas dit de vrais points. Voici un ami, écrit modèle de données, la source théorique est deux grand-père, évitant impossibleL'étang copie du contenu. Cela semble être une petite vérité. Mais avez-vous déjà pensé à cette question, pourquoi poseriez-vous cette question?

Parce qu'il a vu
,

de , contrairement à lui opérer . Qc, pourquoi réserver et travailler? Est-ce que c'est couché sur le livre? Le livre ne signifie pas ci-contre, redimensionnement lentement et tables de taille de photos? Pourquoi ne l'utilise-je pas? Quelles sont la table zip d'un stockage extrême? Y a-t-il une serrure proxy? Votre ali est très vache, le modèle est construit, tirez simplement la largeur tous les jours? Hé, je veux connaître la réponse à cette question, je dois passer à l'ancien compte et parler du point de la super douleur de l'entrepôt de données.


La faiblesse de Inmon


a suggéré la probabilité de succès dans la construction d'un projet d'entrepôt numérique? Plus de 80%,

a échoué Est-ce un peu comme "plate-forme entre données" au cours des deux dernières années?

Pourquoi?Certains géants dans le cercle de formation étudient également. Après avoir étudié Inmon, KIMBALL, une série d'actions majeures et un résumé de l'échec de la Société, attire enfin cette conclusion:

est si la logique du moine d'Inmon, du sommet de la construction complète, de la mise en œuvre Le cycle est généralement très long, généralement 1 à 2 ans.


Lorsque la mise en œuvre est terminée, il est probable que les gens nous demandent au moment de ne pas savoir qu'ils veulent le faire. Par conséquent, le père de Kimball est basé sur l'expérience de nombreuses années de projets de consultation, proposant de réduire la construction et d'améliorer le taux de réussite. C'est-à-dire que c'est souvent dit, modèle de construction de Kimball de bas en haut.


Bien entendu, des méthodes de construction complètes ont également été développées et les grands fabricants ont des modèles de sortie standard N pour différentes industries, telles que Teradata FSLDM, IBM BDWM, IAA, IW, SYBASE IWS, etc. au. Ce sont tous des points standard de l'industrie, qui peuvent être poussés directementP à la seconde moitié du modèle logique.

Le vieil homme d'Inmon a ensuite été optimisé avec KIMBall et a finalement proposé le concept d'usine d'information de l'entreprise CIF. À propos: Inmon et Kimball deux Big 佬 ne sont pas complètement coupés en ligne et CIF est également reconnu par KIMBALL et KIMBALL est également nié que les méthodes de haut en bas sont entièrement construites et de bas en haut. Viens. Mais même lorsque cela se trouve, la distance entre la période de construction numérique et les besoins de l'entreprise est toujours une faiblesse.

Dans le passé, cette faiblesse était correcte, car les changements de la population sont toujours conformes aux attentes et à la portée de la construction de KIMBALL, ont également une industrie des normes publiques du LDM, le taux de construction réussie est très rapide.

Mais! À présent! Da khanh est mort ~~~!


Voir notre environnement actuel sur le marché, vous pouvez rencontrer des personnes qui ne fournissent pas de données

assis par

! Ceux-ci vous pouvez utiliser des ballesDharma pour obtenir

un mois pour changer
? Dans chaque inmon, Kimball ne peut pas le faire! J'ai mis en œuvre des entreprises traditionnelles et des sociétés Internet. Dans les entreprises traditionnelles, fondamentalement, il est conçu, puis non géré, car les politiques d'évaluation des performances ne changeront qu'une fois par an.

Mais j'ai été époustouflé dans la société Internet! Leur performance est libérée une fois par mois! Ces


par conséquent, le nombre de cycles de construction d'entrepôt a créé une grande zone d'échec dans le projet numérique, à l'âge de l'Internet, une nouvelle fois amplifiant, devenant des places Faible Faible.

Modifier les affaires rapides, laissez-nous
pas de modélisation de temps!

Internet Numérique

Lorsque vous opérez, les camarades de classe de produits sont assis à côté de vous, vous regardez votre travail, vous sentez-vous? Je ne sais pas ce que tu ressens. Quoi qu'il en soit, quelqu'un se tient derrièreJe vais immédiatement commencer l'alarme physiologique originale dangereuse. Si vous étiez, sentez cela, comme un front, comme la gorge! J'ai hâte de quitter cet endroit immédiatement, mais aussi besoin d'arrêter une gifle dans votre poussée.

Alors d'envoyer cette prostituée, nous ne pouvons que le tirer directement!

Nous mettrons beaucoup de scènes, comment gérons-nous des analystes de données, des activités et des camarades de classe de produits?


À cette promotion des affaires, il sera préférable, appellera les camarades de classe du nombre. Pas bon, lancez-le pour vous, le projet est en ligne la semaine prochaine, les données doivent également être lancées de manière synchrone.

est encore pire, le projet est en ligne, puis vous vous parlerez. Comment dites-vous? Dans

D'une part, la nouvelle entreprise n'a pas de modèle universel. D'autre part, il n'y a pas assez de temps. Vous serez rampé, modèle de modélisation, vous devez brosser la règlePremière entreprise? Mais de nouvelles affaires, le processus d'entreprise peut ne pas être capable de dire à personne.


OK, votre honte d'entreprise, voulez-vous voir des données? Mais de nouvelles affaires, même des données ne sont pas! De plus, il y a une pile de nouvelles fonctionnalités dans la conception, non,

avez-vous modélisé

"Même si vous avez 72 variantes, vous pouvez le faire, vous ne pouvez voir que le déplacement ou la perte de la largeur, le laisser partir.! Par conséquent, le groupe Internet recrute et relativement petit pour données construites dans une petite moitié de l'année, mais pour choisir d'excellents ingénieurs de données, les gens peuvent s'échapper immédiatement en direct, résoudre les devoirs, les planifications et les optimisations.

Y a-t-il une mise en page
Oui, oui, ne nie pas que la planche à dessin est actuellement de grands ingénieurs de données quotidiens aujourd'hui. Mais les camarades de classe, vous avez oublié un facteur très important. C'est l'histoire

Il peut y avoir des personnes qui voyagentLe nouvel horaire ne sais pas, Alibaba a Teradata, Oracle, Southast Rongtong, V.V.

Selon le respect des données à ce moment-là, il doit s'agir d'une plaque et du moment prescrit. Même alors, je suis allé à IOE, j'ai rejoint un groupe de personnes, mais la tradition de données était maintenant gravée.


Il y a toujours des gens à vomir, et ceux qui disent Ali sont, ils ont des privilèges de données et ils frappent. Hey, mon cher, savez-vous pourquoi faisons-nous cela? Est-ce très amer B? Toujours parce qu'il n'y a pas de mots? L'entreprise va bien, juste pour que nous puissions travailler.

ne nous laissera donc pas à un moment donné, ce qui nous permettra de tirer la largeur tous les jours! Venez, quel est le facteur le plus important dans le succès du succès de la quantité?


est une norme! C'est une spécification minutieusement effectuée! Vous n'êtes pas de

qui vous se soucie? Qui agit selon vos normes? Vous avez introduit une variété de normes, normes etEntreprise vous accélère: en ligne ce soir! Que pouvez-vous faire? Par conséquent, il s'agit exactement du ministère des données Ali avec suffisamment d'autorisations (pouvoir), posant une règle très solide, a un fort développement de la peau d'Ali. Donc, j'ai complètement cru en ce contenu écrit dans la "grande route de données" de Ali. Un, à cette époque, il y avait une perception de données très consolidée; Deux, Ali a une bonne fondation de groupe de données; Trois, l'équipe de données permet de très haut (puissance).


Trois points, de sorte que les groupes de données d'Ali enregistreront au moins des processus de modélisation en raison des exigences déraisonnables de l'unité commerciale. Bien entendu, de nombreuses sociétés Internet ont également commencé à faire attention à la construction d'entrepôts de données et ont beaucoup de disposition numérique. Il y a aussi beaucoup d'informations sur ma main. Les étudiants intéressés peuvent être modifiés télécharger pour apprendre.


Le nouveau numérique est collecté

en outre, en raison de la popularité de la technologie de données importante et de l'exportation HLa partie supérieure de différentes scènes avec des exigences à haute efficacité, de grands services publics, tels que des formes larges, des bitmap, des filtres Buron, etc.

Avant Internet, la table de la largeur de personne n'est logique de la conception de la bibliothèque de services, conforme strictement à trois modèles, conçue pour restreindre la table. Certaines personnes pensent que la table étroite est l'école, la largeur est plus que l'école. En fait, ce n'est pas le cas. La distinction étroite n'est pas un champ, mais

est une école de secours
.

Si une table, tous les champs que vous souhaitez effectuer, incluez des identifiants, des valeurs de code, des valeurs, aucune connexion à d'autres tables, ce qui signifie une table de largeur. Bitmap est une information hautement compressée que les informations de chaque utilisateur sont 0, 1. Exemple: si l'utilisateur est en ligne, il est devenu une chaîne "01010011101101" super longue.


Une longue chaîne tous les jours, alors vous voulez aller en ligne pendant 7 jours, faites ces cordes à vraiUne action "et", sélectionnez toutes les valeurs. Pour le bit "1", l'utilisateur respectif est le résultat du désir.


Le filtre BURON est également très intéressant, le principe est une fonction de hachage + bitmap et des applications typiques recherchent rapidement ces informations. Devenez toutes les informations Hash a un numéro puis mappé sur Bitmap. Si vous souhaitez évaluer si vous devez avoir cette information dans la bibliothèque, accédez à cette photo pour la voir. Parce que c'est hachage, toutes les informations peuvent être définies, telles que des images, des connexions, des fichiers.

Tournant Intelligence


Il y a un nouveau jeu, il est manquant.

Exemple: verrouillage de proxy, premier, très chaud, utilisé pour séparer un système de code de code numérique et système de codes de système d'entreprise. Maintenant, je dois convenir d'identifiant ou utiliser l'ID d'origine. Par exemple: Zip Tableau, c'est un bon moyen, les dernières données et les données historiques sont ensemble et les modifications apportées au statut peuvent être tirées à tout moment. Mais maintenant nC'est un magazine extrêmement stocké.


Il y a aussi un changement lent, en mouvement rapide et similaire.Vous savez aussi quelle est la perte?Vous pouvez vous parler dans la conclusion ~

Merci de votre lecture, ce contenu partagé est terminé.Ce compte public est actuellement sur 3 000 mots, vous fournissant le partage d'excellents domaines de données.

Sujets