1. La production de numérique en temps réel
L'entrepôt de données traditionnel traite principalement T + 1 (Certains également appelés données D + 1) (c.-à-d.: Produit aujourd'hui analyse des données Les résultats seront vus demain), le concept de T + 1 provient du commerce d'actions, est un système de négociation en actions, c'est-à-dire des actions achetées au même jour, d'aller au prochain jour de négociation à vendre.
Afin d'éviter les problèmes susmentionnés, les personnes se réfèrent au concept et au modèle de l'entrepôt de données afin de planifier et de concevoir un traitement de données en temps réel, sur cette base, à ce sujet, L'entrepôt de données en temps réel (numérique en temps réel).
Deuxièmement, la comparaison numérique hors ligne VS
Dit ici:
Hors ligne Grande architecture:
STOCKAGE HDFS, HIVE, MR, Calcul de l'étincelle hors ligne;
Lambda Architecture: Ajouter de nouveaux liens vers le traitement de données en temps réel Sur la base de la grande architecture de données hors ligne, nécessite une maintenance hors ligne et un traitement en temps réel deux ensembles de code;
Architecture de Kappa: Le traitement circonsenté, le traitement hors ligne et le traitement en temps réel sont intégrés dans un ensemble de code et le coût de l'opération et de la maintenance est petit, ce qui est la raison pour laquelle le chiffre est chaud aujourd'hui. L'architecture de Kappa est devenue une nouvelle tendance pour l'architecture de l'entrepôt de données.
Sélection de l'image:
Tempête / FLINK et autres temps réel Les cadres informatiques, recommandent vivement les flux, ses caractéristiques de «lot une» et des communautés open source actives, ont progressivement remplacé les tendances des étincelles.
Le premier considérez l'efficacité de la requête, suivie de problèmes tels que l'insertion, la mise à jour et sélectionnez Apache Druid, mais il existe un défaut de la mise à jour des données. Lorsque la sélection, faites attention à la recommandation de données à jour fréquente ne doit pas adopter le schéma. Bien sûr, il s'agit d'un problème spécifique de stocker cette pièce, et le HBASE, Redis, etc. dans différents scénarios est facultatif.
Schéma de rirircuit de données:
Nous rencontrons souvent le même nom de l'indicateur lorsque nous traitons les besoins de données quotidien-aux résultats statistiques incompatibles. Une fois que ce phénomène, les raisons et les coûts d'interprétation sont relativement élevés. Les anciens indicateurs devraient répondre à de nouvelles règles et à défaut de définir des changements fréquents dans le fait que le problème rencontré au cours du processus de construction du système indicateur.
V. Résumé
En résumé, le numérique en temps réel est principalement résolu que le problème de la rapidité des données, tels que le grand écran en temps réel, la surveillance en temps réel, le contrôle du vent en temps réel, etc. Le cadre d'apprentissage de la machine combiné peut également être traité de la recommandation en temps réel et obtenir des scénarios d'entreprise intelligents tels que des effets de livraison publicitaires en temps réel.