Skip to main content


1, à partir de maintenant,

première classe, qui est la classe de collecte de données


]

Chaque gamme de produits de l'entreprise crée certaines données commerciales, telles que l'achat d'une ligne de service de commerce électronique d'utilisateur (voyage au panier), la collecte de données, les données de commande, etc.

Lorsque le nombre d'utilisateurs a augmenté, la plupart sont stockées dans la base de données des entreprises; Il existe également un comportement de navigation utilisateur, en cliquant sur le comportement, ces comportements seront un point d'inhumation correspondant et les données créées sont généralement stockées sous forme de fichier journal.

Que ce soit les données de la base de données d'entreprise ou des données de fichier journal, nous devons les mettre dans la station entre les données à stocker uniformément. Les ingénieurs de données générales utiliseront des outils de synchronisation de données plus matures pour synchroniser des données de base de données de données en temps réel aux centres de données,En même temps, extraire des données de journal de décalage hors ligne comme "T-1", intégrées les unes aux autres.


2,

La deuxième couche est la classe de calcul de données


de la plate-forme entre les données pour synchroniser plusieurs données de la gamme de produits, la quantité de données est relativement grand.

La quantité de données est déraisonnable en utilisant un stockage régulier. L'industrie utilise souvent un modèle de classe pour stocker de grandes données.


La stratification principale des données comprend une couche de données active (ODS), une couche de données dimensionnelle (DWD), une couche de données détaillée (DWD), une couche de données de données (DWS) et une couche de données d'application (ADS), etc.

3,

La troisième classe est la classe de service de données

après l'introduction des données, comment l'obtenir et l'utiliser? Les données MTTRES fournissent généralement des services en tant qu'interface, des développeurs pour intégrer des données dans une interface de demande, offrant des produits de produits de produit différents et des appels téléphoniques d'appel ]

4,

LLe quatrième est la couche d'application de données


Les produits de données sont divisés en plusieurs produits de données pour les produits de données internes, ciblant les produits de données pour les métiers. Pour les produits de données internes, il est souvent utilisé pour les produits / opérateurs et les dirigeants de sociétés de services. Les produits / opérateurs sont plus intéressés par des données détaillées.

Exemple: , si le produit actif de commerce électronique continue de diminuer, comment les aider à trouver la raison en termes de données; Les dirigeants sont plus intéressés par les données de marché, telles que des décisions avec un développement de produits à grand écran sous le fonctionnement de chaque gamme de produits au cours de la dernière année.

Pour les produits de données utilisateur, certaines applications créatives peuvent être développées sur la base de données dans des données, telles que des marchandises personnalisées, veuillez oublier "Trouver des personnes" au lieu de trouver des "personnes", d'améliorer la probabilité de correspondance de correspondance correspond à des correspondances et augmentez également la probabilité d'ordreutilisateur. Les produits de données pour les commerçants peuvent fournir des services de données pour les traders basés sur les données intermédiaires de données, telles que les produits de commerce électronique basés sur la vente de données de vente sur la population et la commercialisation de l'école, du magasin, etc.

Deuxièmement, l'ère de l'illumination: l'apparence de l'entrepôt de données

L'entrepôt de données est le thème, intégré dans la gestion et la décision du plan de la société, avec des données Collection Heure liée, sans rapport avec le temps.


Pour vous aider à comprendre les quatre éléments de l'entrepôt de données, je donnerai un exemple de commerce électronique.


Premièrement, dans la scène de centre commercial électrique, il existe une base de données qui stocke l'ordre des commandes et une autre entrepôt de données définit les données associées aux membres. Construire des entrepôts de données, d'abord synchroniser des données de différents systèmes d'entreprise en stockage de données unifiées, puis trier les données dans le domaine de la rubrique.

Le nom de domaine du sujet est leL'abstraction de haut niveau des processus métier, tels que des biens, des transactions, des utilisateurs et du trafic peut être utilisée comme nom de domaine à thème, vous pouvez le comprendre comme un entrepôt de données de répertoire

Les données d'entrepôt de données sont souvent stockées. Promptement, retient souvent plus de 5 ans et des données dans chaque partition sont ajoutées. Façons, il ne peut pas être mis à jour pour un profil.

Révolution de la technologie: de Hadoop à Lake Data

Un produit Internet réussi peut être supérieur à 100 millions, comme le titre que vous connaissez familier, accrocher, la main rapide, la musique de Néase Cloud , produisant des centaines d'utilisateurs milliardaires chaque jour, il est difficile de se développer pour les entrepôts de données traditionnels, absolument impossible de transporter une telle quantité de données

Un type de données de type devient une table et des données de L'ère Internet sauf les données structurées de la base de données des entreprises, ainsi que des données d'entrée de l'application, Web ou Web ou auxiliaire.des serveurs d'entreprise, vendez habituellement une structure. Même pas de texture. L'entrepôt de données traditionnel a des exigences strictes pour les modèles de données, avant d'entrer dans les données dans l'entrepôt de données, le modèle de données doit être prédéfini. Les données doivent être stockées selon le kit de stockage de conception de modèle

Lessa Quatre valeur de données: données dans les données


Dans E Enterprise - Commerce, il y a un système de chaîne d'approvisionnement et Le système de la chaîne d'approvisionnement créera une décision d'ajouter des marchandises en fonction des profits, des stocks, des données de vente publique et de l'opinion publique des marchandises, puis appuyez sur le système d'achat


Si vous êtes le patron de la société.

Si vous développez des données, lorsque vous avez besoin de nombreux besoins, vous devez les plaintes, trop de besoins, trop peu de personnes, pas terminées


Si vous êtes actif, lorsque vous êtes actif, Vous voulez des données, le développement vous dira qu'au moins une semaine, vous savez si c'est trop lent, vous pouvezPas plus?


La racine de ces problèmes est que les données ne peuvent pas être partagées! Celles-ci

Douleur avant celles-ci étaient: données de données, les données intermédiaires sont difficiles à partager, ne peuvent pas accumuler

, le noyau des données, c'est une répétition Calcul pour éviter les données et les données transmises et l'application de données est activée.


Après avoir construit des données maintenant, il est très inconfortable. Le taux de recherche et développement d'applications de données n'est plus limité aux vitesses de développement des données. La nuit, nous pouvons script, éclosons de nombreuses applications de données, ces applications créent une valeur de données



Pensée:


1 Si le prochain L'arrêt de données importantes est la station de données, quelle est la prochaine étape des données dans les données?

L'école d'application principale des données actuelles est toujours les données d'emplacement intelligentes, la station suivante des données est la station de centre d'intelligence artificielle.(Station de Chine), aucune phrase, données et caractéristiques ne détermine la limite ci-dessus des machines d'apprentissage, des algorithmes et des modèles dans une approximation illimitée.

2 Quels sont les champs de développement de données?


(1) Le fondement entre les données en temps réel reconnaît le budget.

(2) Données en ligne sur le cloud, prenant une compréhension K8 K8, réalisant en ligne de déploiement hybride hors ligne, améliorant ainsi l'utilisation des ressources.

[12) (3) Smart Metadata Management + Analyse avancée, réduisant le seuil d'analyse des données, libérant plus d'informations de données



]

(4) Code d'automatisation du bâtiment, en faisant automatiser la construction de code ETL, libérant des performances de recherche supplémentaires de données Et même pour que notre personnel non technique puisse remplir un traitement de données simple.


(5) Âge des produits de données, produits de données pour différentes industries et liés aux chosesLes tubes du système, tels que des tailles analytiques basés sur des indicateurs, diagnostiquent automatiquement des indicateurs

3, des couches de données et des données spéciales de classe ODS?

Les données sur les données de données et les SAO n'ont rien à faire, dans le lac Data, pas seulement des données SAO, mais également des données DWD, DWS, DM, de la publicité. Les données du lac ont mentionné une base de données uniformément stockée, puis lit les données du format de données, telles que Hadoop, vous pouvez voir comme un lac de données.


Pour ODS, il s'agit de la couche de données d'origine de la hiérarchie de données, comme avec d'autres couches de données, qui peuvent être stockées dans le lac de données intégré dans HDFS

4,

Quelle est la différence entre l'entrepôt de données et l'entrepôt de données?

Tableaux entre les données construits pour la première fois sur le lac Data, puis l'accent mis sur les capacités de définition de données des données, soulignant uniquement les données une fois, en évitant le modèle de développement de la cheminée et souligner éventuellement l'instruction de l'application. et données de données DLe portail de données des données de données et le stockage des données dans les applications de données et le stockage des données via la station de service et de centre de données peuvent être considérés comme hérités. Méthode de conception pour modéliser la taille de l'entrepôt de données











. ] . . 5 Comment les applications de données de données sont-elles? Mots tridimensionnels de l'efficacité, de la qualité et du coût. Premièrement, de manière efficace, les données de données sont entièrement améliorées dans la recherche et l'efficacité de la recherche de données, l'efficacité des résultats de l'analyse des données et de l'efficacité et des effets, nécessite l'application de données d'origine au minimum des temps. R & D Au minimum, vous pouvez maintenant être raccourci en 2-3 jours, contribuant à améliorerRépétez considérablement les données de l'application de données, pour appliquer les données à la répétabilité ne subirait plus de la vitesse de développement des données. 6, comment atteindre le partage des données? L'un est un partage de données, on partage l'interface. Au départ, j'ai beaucoup de petits barils numériques dispersés, dans le même petit, également en ligne avec l'application, présenté un traitement de données de cheminée. Mais nous avons maintenant une table entre données uniformes, construisant une station entre des données uniformes, nous devons donc réutiliser des modèles, en mettant l'accent sur en cliquant sur les graines, la vérité est uniquement usinée. Et dans les données de conception de données, nous avons également introduit un facteur de référence du modèle tel qu'une mesure du modèle de multiplexage, de sorte que vous pouvez utiliser les données autant que possible. De plus, la réutilisation des données est basée sur une détection efficace des données, trouver rapidement des données, comprendre des données étroitement liées au travail.Gestion des métadonnées. Le sachant, le sachant, inévitable, sachant comment il ne sait pas comment il est, bien que la Mongolie sache, mais pas nécessairement, c'est ce que nous devons comprendre l'apprentissage les pratiques!Merci!

Sujets