Les actifs de données constituent le fondement des capacités de la plate-forme de données moyenne et de la santé des actifs de données directement liés au succès ou à l'échec de la construction de TED. Alors, comment évaluez-vous la construction et la gestion des actifs de données dans le processus de construction de données?
Non spécifications uniformes, différentes unités commerciales, différents développeurs ont découvert des habitudes et une conscience. Lorsque les normes d'accord de construction, il apportera des noms et des anomalies, modéliser les modèles peu coûteux.
Données faibles, des informations de métadonnées manquantes, des applications de données et des erreurs d'approbation, un manque de moteurs de recherche de carte de données efficaces et faciles à utiliser, apportera de nombreux modèles, mais les entreprises ne savent pas de répéter les roues.
Comment quantifier la performance des développeurs numériques? Le nombre de modèles du modèle est-il? Le nombre de problèmes de qualité des données est-il?
Gestion TMontez, gérer et gérer des données espère continuer à réduire les coûts de stockage et à calculer les données, mais en raison de la comptabilité des coûts épais, le coût ne peut pas être récupéré à des développeurs individuels. Pour les premiers camarades de classe, tant que les besoins de l'entreprise peuvent être achevés à court terme, ils ne paieront pas trop d'attention aux problèmes de coûts. Pour des tâches inefficaces de haute performance, les données froides manquent de sensibilisation à la sensibilisation.
1. Standard
Si le nom de la bibliothèque, le nom de la table, l'indicateur et le nom de champ répondent aux spécifications convenues, par exemple: la combinaison de Les passerelles, les routes, les noms de domaine de données, les processus métier, la formation de contenu de base des données peuvent être déterminés par le nom, pas le mélange chinois et l'anglais, abrégé, seuls les talents familiers peuvent savoir quelles tables font? utiliser.
Dans le processus de construction d'actifs, de groupes ou de pièces de données peuvent être résumés, soyez tUtile au processus ETL, bloquez le niveau système, surveillez le processus de développement de données inégal avant. Peut se référer à Dataphin d'Ali. 2. Enrichissant
, y compris des métadonnées technologiques d'actifs, des métadonnées font des affaires, etc. Les métadonnées peuvent fournir des installations décisionnelles plus précises pour les utilisateurs, réduire les coûts de communication et améliorer la complexité des données.
Exemple: personne responsable, description des informations des entreprises, des sujets, de la décentralisation, des étiquettes et des descriptions de champs et des documents d'utilisation de la logique. Les métadonnées techniques sont principalement utilisées par les développeurs de données, telles que le stockage, les petits numéros de fichier et la consommation de chaleur (près de Van X-Day).
Outre le système automatique, les autres métadonnées associées nécessitent des développeurs de données pour effectuer la normalisation et les mises à jour.
3. Modèle numérique parfait
Soutien au support et à l'assurance des entreprises, plus intense, plus, plus, plus, acquisition et réelMontrer des frais d'utilisation des données inférieurs. C'est-à-dire que lorsque l'entreprise a besoin de données, dans laquelle le modèle correspondant attend l'utilisation, au lieu des exigences et du développement de la communication de service d'accueil.
Par exemple, lorsque le responsable demande le responsable, vous participez à la construction d'un bâtiment numérique tous les jours. Qu'est ce que c'est maintenant? Avec l'amélioration des critères d'évaluation, la maturité de la construction d'entreposage peut être quantifiée. En général, une architecture numérique typique est la suivante:
Les tâches de traitement des données et les requêtes ADHOC peuvent être analysées statistiquement avec des journaux de sang et de la requête.
Exemple: Dans la requête de données, la requête Ratio directement des SAO, la comptabilité, le taux plus élevé, il existe un grand nombre de tâches basées sur le traitement de données d'origine, le modèle de modèle intermédiaire DWD, DWA, DWA réutilisé très mal. Techniquement, la requête de table directe ci-dessous, plus le nombre de données de numérisation de données, plus le temps de requête est long, plus la consommation de la requête de café est longue.Large et satisfaction des utilisateurs de données seront faibles. Il peut mesurer le support du support avec la vitesse de référence de la couche croix.
Classe DWD: Voir le nombre de tableaux de la classe ODS sont référencés par les classes DWT / DWA / App, en comptabilisant tous les onglets SAO actives.CLASSE DWT / DWA / Application parfaite: la vue Total des données peut répondre directement aux demandes de requête, combien de demandes de requête de données résument, si les données de résument ne peuvent pas répondre aux besoins, les utilisateurs des utilisateurs doivent utiliser des données détaillées, même des données brutes.
Ratio de requête de données Sumbecet: Compte de requête DWT / DWA / DWA / Application pour toutes les requêtes. La vitesse de référence inférieure de la couche inférieure, meilleure dans la spécification de conception du modèle entre données ne permet généralement pas la permission de référence croisée, telle que les données de la classe SAD ne peuvent être référencées que par DWD.4. Divertissement
est révoqué comme son nom l'indique, après la construction d'une propriété rembourséeVille, multiplexé est rouvert.
Le facteur de référence peut être utilisé comme indice de l'index de réglage des données entre. Plus le facteur de référence est élevé, meilleure réutilisation.
Facteur de référence: La fiche technique est lue, le nombre de modèles en aval moyens est la sortie. Par exemple, la table de la classe DWD est référencée par la 8ème table DWS. Le facteur de référence de ce tableau est de 8. Le coefficient de référence moyen de la classe DWD est pris par la classe DWD (avec une table de source inférieure). 5. Qualité des donnéesLa cause des problèmes de qualité des données comprend des problèmes de qualité de développement, la stabilité des grappes et les changements d'activité, etc., ne peut être trouvé que bientôt que la réparation du matin, la taille de la cote de la propriété est Principalement couverture des systèmes de surveillance, suivi du traitement des alarmes et du temps de traitement moyen. 6. Coût optimisé de la taille
La gestion des coûts de données nécessite un système d'évaluation et d'évaluation de la pointe de la fin des coûts.Former une sensibilisation et une optimisation. Par exemple, évaluer le nombre de tâches ajustées par chaque développeur de données et résultats de l'administrateur.
Optimisation des coûts, les préoccupations les plus courantes comprennent: le stockage des biens, le calendrier / circonstances sont convertis en coûts. Production de petites fusions de fichiers, notes de données chaudes et froid et stockage, HDFS, V.V.
7. Sécurité des données Avec la loi sur la sécurité des données et la méthode de protection des informations personnelles, le numéro de téléphone mobile, les cartes d'identité et autres informations, etc. L'interdiction interdit le transfert. Développement des données Il n'y a pas de processus de traitement crypté pour toutes les informations sensibles dans les travaux de données et constitue également l'une des tailles de santé d'actifs.Troisième, Calcul logique et application des points médicaux d'actifs
Scores médicaux: des premières données et développeurs de l'organisation, formant une quantité uniforme standard, une évaluation objectiveTravaux de construction de biens. Pour un seul modèle des meilleurs détails, il peut être visualisé à la santé modèle, responsable de tout le monde, formé depuis le début et du bas pour gérer et administrer.
Calcul de la logique Le département de la santé: au centre de l'attention de la société, l'indice d'évaluation confirme de nombreuses parties et facteurs de poids. À partir d'un seul tableau de santé, résumez les développeurs de données à caractère personnel, ainsi que la santé du groupe de données. Les indicateurs d'évaluation peuvent être criblés à partir de sept dimensions des chapitres précédents, notamment:
- Normes de construction: ne répondent pas à la forme de normes de construction ou de dénomination;
- Informations riches: Yuan Si les données sont manquantes, l'école décrit l'écrasement à 100%, le sujet est manquant, v.v.;
- Le taux de référence de la couche croix;
- Recevez: facteur de référence du modèle;
- Qualité des données: plage de surveillance, nombre moyen anormal (délai, erreur de données), heuretraitement moyen;
- Optimiser les coûts: les coûts de stockage, les coûts de calcul, près de X-jour, de petits numéros de fichier;
- Sécurité des données: Quelle que soit la manière dont les écoles sensibles ne sont pas désactivées.
- Quatre visualisation des mouvements de la santé et de l'administration des actifs, fournissant un bureau de bureau unique pour les employés de données, non seulement vous permettent de développer des itinéraires de routine, des normes, mais également de formuler et de réduire les normes de gestion des biens et de gestion.
Le principe fondamental de la conception du produit du bureau: Observation du statut d'évaluation, donnant des raisons et des actions d'exécution, une efficacité de la gestion quantitative. C'est: prendre un poste de travail tous les jours, sachant comment optimiser les améliorations et avoir fait une série d'actions.
Année, petite fourchette
Utilisation des points de santé d'actifs, des effets de construction quantitatifs et de la gestion de la propriété, vous pouvez le faire à partir de la gestion de téléchargement vers le haut ou des données de ligne. Travailleurs fournis selonSuivi, instructions d'exécution des actions, comparer les actifs précédents "marché", les points de propriété médicale peuvent guider davantage de biens et de gestion de travail raffinés.