Bonjour tout le monde, je suis un petit analyste de données blancs avec une chaîne. Aujourd'hui, le patron m'a soudain dit que nous devions faire une transformation numérique, toutes les données doivent être ouvertes, vous devez l'utiliser! C'est une décision majeure acompressée! La demande sous le patron, à quel point êtes-vous difficile? J'ai donc consulté une industrie de données.
Qin Shihuang's Histoire estime que tout le monde est très familier. Qin Shihuang est une série de mesures culturelles pour former une série de mesures culturelles pour former une série de mesures culturelles. Tout d'abord, il a d'abord détruit Han, Chu, Wei, Zhao, Yan, Qi, Unified, achevé l'unité du territoire terrestre; Deuxièmement, après l'unité des États-Unis, le système d'empereur et le neuf nettoyage de trois jours, le Le comté de la pratique nationale Le système de comté est pratique
L'équilibre est équilibré et les ventes de biens de marché doivent être clairement marquées;
Culture, abolir les six pays originaux, la pratique Le petit sceau de la dynastie Qin;
Regardez la construction numérique: l'architecture globale est divisée en matière de modélisation de la dimension, de réglementation inverse et de spécification de modèle unifié, spécification de développement, type de données , etc ...... Collection après les données, vous pouvez ouvrir les secteurs d'activité de l'entreprise.
Qu'est-ce qu'un entrepôt de données?
Entrepôt de données Comme son nom l'indique, une grande collection de stockage de données, créée sur la base des rapports d'analyse d'entreprise et des objectifs de l'assistance à la décision, ainsi que de la projection et de l'intégration de diverses données commerciales. Il fournit aux entreprises une capacité de coopération de la Bi (commerciale de renseignement commerciale), de l'amélioration du processus d'entreprise, de la surveillance, du coût, de la qualité, de la qualité et du contrôle.
La partie d'entrée de l'entrepôt de données est une grande variété de sources de données et la sortie finale est utilisée pour l'analyse des données, l'exploitation minière des données et les rapports de données de la société. ▌
Pourquoi le modèle de données?Il n'y a pas de système de stockage de données pour l'entrepôt existe souvent ces points de douleur.
1. Incooussabilité des données
Différences de logique et de source de données, entraînant des différences de statistiques de données.
2. Coût de la maintenance Construction de données répétée, rapport de développement répété, frais de maintenance élevée avec certains investissements répétitifs.
3. L'efficacité des sources de calcul est faibleChaque modèle d'application ou une table large, les indicateurs de données sont répétés et une grande quantité de ressources de calcul est consommée. 4. Les indicateurs de données sont uniformes
Développement "La cheminée" conduit à des indicateurs de données à démonter dans différents systèmes et les indicateurs de données sont élevés.
▌
Donc, quelle est la caractéristique de l'entrepôt de données?
1. Sujet
Contrairement à la base de données conventionnelle correspondant à un ou plusieurs éléments, l'entrepôt de données est réellement conforme à la demande de l'utilisateur, intégrez les données de différentes sources de données. dans un niveau abstrait plus élevé, toutes les données autour d'un certain sujet.
Comment est le sujet ici? Par exemple, pour les entreprises de détail, "Analyse des passagers" est un sujet; "Analyse du comportement du conducteur" est un sujet pour les déplacements de gouttes.
2. Intégré
Les données stockées dans l'entrepôt de données proviennent de l'intégration de plusieurs sources de données, les données d'origine proviennent de différentes données. Les sources et le mode de stockage sont différents. Pour intégrer le jeu de données final, vous devez transmettre une série d'extraits, de nettoyage et de conversion de la source de données.
Deux plateformes à emporter sont acquises, je souhaite connaître les données de vente totales de ces deux plates-formes. Deux systèmes de commande sont similaires, mais le calibre de données est différent, que dois-je faire? À ce stade, vous pouvez utiliser l'entrepôt de données pour décocher les données. , par exemple
Système d'approvisionnement en entreprise de détail, système logistique, système de vente utilise souvent différents ERP, cette fois, vous souhaitez voir différentes données pour voir différents systèmes, l'expérience est très mauvais. À ce stade, l'entrepôt de données peut également être utilisé sur le terrain.3. StableQualitative
Les données enregistrées dans l'entrepôt de données sont une série d'instantanés historiques qui ne sont pas autorisés à être modifiés. Les utilisateurs ne peuvent interroger et analyser par des outils Analytics.
4. Dénaturation temporelle
Data Warehouse recevra de nouvelles données intégrées, réagit les dernières modifications de données.
▌
Quel est le problème avec l'entrepôt de données extrêmes?
1. Données pour améliorer la valeur des données
Imaginez qu'il existe un nouveau commerce électronique pour une entreprise à domicile après une itération de la version, j'ai constaté que Le chiffre d'affaires a diminué, mais je ne sais pas quel lien est perdu. Qu'ont-ils fait? Combien de temps y a-t-il? Le bogue de produit ou l'utilisateur ne sera-t-il pas utilisé? Dans ce scénario, s'il n'y a pas de données comportementales à prendre en charge, il est difficile de positionner pour une optimisation précise.
2. La superposition de données et la modélisation de la dimension améliorent l'efficacité des données
Si nous n'effectuons pas de données hiérarchiques, un ensemble de rapports est requis, qui est extrêmement compliqué et encombrant. Prenez un ensemble de données pour associer N Multi-Table, et également comprendre le sens des champs clairs, cette opération complexe ne peut s'appuyer que sur le développement de BI et les hommes d'affaires peuvent pouvoir extraire. Si nous effectuons une diapositive de strates, le tableau de la couche d'application ou prend temporairement un ensemble de chiffres n'est que les deux rapports; à peine devoir être développé, il peut être mis en œuvre directement dans la couche d'outil BI.
3. Réduisez les coûts opérationnels
Dans le cas d'un rapport numérique, le traitement, les données temporaires du rapport de données, le package d'interface de données est la sortie qu'il est nécessaire de développer en permanence et avoir un couplage sérieux, ce qui conduit à la montée du coût humain.
Pour, par exemple, le traitement des rapports de données, chaque besoin similaire nécessite une personne professionnelle, un développement de la BI, des tests, des produits, etc doit être compris les besoins en matière de données, utile des champsScène, valeur générée, indicateurs de mesure, etc. Le développement d'un rapport participera également à 4 caractères, 7 jours + travail.
1. DISPOSITION DU PETIT DU PETIT
représente plus d'environ 60% du développement conventionnel. 2. Logique de calcul des données Unified
La logique de base est largement encapsulée dans l'IDW. Il améliore également l'efficacité de développement future à l'avenir.
3. La performance est meilleure
Optimisation globale des flux de données, raccourcir les chemins de calcul de données. Les développeurs de code ont besoin de certaines personnes ayant une expérience dans le développement d'expériences, ainsi que des tests détaillés. Cela rend la performance augmentera du global aux détails.4. SAAS Service
Les services SAAS extrêmement disponibles peuvent rapidement déployer des terres, résoudre la plupart des besoins des activités commerciales de détail.
Ainsi, quelles entreprises adaptées à l'entrepôt de données??
1. Il existe une base d'informations, il existe des précipitations de données2. Complexe commercial, entreprise de groupe multi-États
3. Il existe une transformation numérique, Demande opérationnelle raffinée