OLAP (traitement de l'analyse en ligne) Technologie d'analyse en ligne, principalement appliquée à l'outil BI ou OLAP / moteur / moteur / base de données. Il aide à analyser les données analytiques de données et d'exploitation de données à partir de plusieurs perspectives, à l'aide des besoins en requête de données multidimensionnelles et des rapports de traitement, le noyau est multidimensionnel.
Avec multidimensionnels, il y aura un passage à sens unique, bidimensionnel. À ce stade, vous devez construire le concept de "taille" dans votre esprit et utiliser la taille pour penser au monde autour.
Je donnerai un exemple de ventes de vêtement et de données généralement considérées dans la vente de produits sous forme de ventes, de coûts de vente et de bénéfices de vente. Le tableau suivant est un tableau de données bidirectionnel typique, qui est une taille de clé.
Si je veux augmenter la catégorie de vêtements sur cette table en deux dimensions, telle que le pull, la jupe, le jean, la jupe, les t-shirts, etc cette fois est l'après-midi et le type de vêtements, de chiffresQu'il s'agisse de ventes, de coût, de profit.
Ceci introduit le concept: taille, taille, catalogue, données
Taille: angle de classifier les données et les observateurs d'entreprise;
Hiérarchie de la taille: Selon la taille de la taille, une couche des propriétés fractionnées est un niveau différent de tailles prédéfinies. Par exemple, le niveau de la journée après-midi se compose de cinq, mois, jour;
Catégorie: Il s'agit de la valeur des éléments de données au niveau de la taille, par exemple, la liste de la taille de la date est la suivante: janvier, février, mars, v.v.;
Mesures: données utilisées pour décrire les conditions commerciales, par exemple, les ventes, les coûts et les bénéfices sont des données.
2. OLAP est un moyen d'effectuer une analyse multidimensionnelle
Les données de traitement logique de la technologie d'analyse multidimensionnelle OLAP ont été traitées d'abord à l'avance à des blocs de données, oui simple à comprendre la source de table. Source à un groupe de valeur unique sans répétabilité et résumé peut être créditéÉclore disponible. Lorsque les utilisateurs choisissent des requêtes ou une analyse multidimensionnelle, le résultat sera fourni dès que possible. Donc prend rapidement en charge une analyse des données extrêmes. Ceci est également lié à un point de connaissance: données CUBE, quel est le bloc de données?
Effectuer le statut des données de vente de vêtements Aujourd'hui, les données sont traitées dans des blocs de données, comme indiqué ci-dessous:
Les données de cube ont un nom élevé: Données multicoliques maquette. Par exemple, un cube de l'image ci-dessus peut être résolu par un modèle de données multidimensionnel:
Bien sûr, la taille de la table de vente réelle ne cessera jamais. Par exemple: après avoir augmenté la taille géographique, la taille du paiement, la taille de l'utilisateur, etc un modèle multidimensionnel est formé:
Cette illustration est appelée table pratiquement au milieu de l'image et de loin À partir de la table d'horloge, la table réelle est utilisée pour enregistrer des événements spécifiques, y compris les faiblessesFacteur spécifique.
Exemple: une personne (ID utilisateur) Achetez un produit (ID de produit) d'une certaine manière (heure d'identité) (heure ID), la table de dimension est la table réelle dans chaque champ de départ de champ, tels que les ID utilisateur,développez-les dans les dimensions, les noms d'enregistrement, les adresses, l'âge, le sexe des utilisateurs, etc.
À travers la table réelle de la table source, les formulaires dimensionnels pertinents sont formés et les entreprises liées aux entreprises et aux données ont de nombreux blocs de données, fournissant des données en fonction de différentes entreprises différentes.
multidimensionnels. L'analyse est des données sur les tissus sur des formes multidimensionnelles et utilisez diverses méthodes analytiques telles que des tranches, une découpe, une percée et une rotation pour permettre aux analystes ou au gestionnaire de requêtes de nombreux égards. Les données, obtiennent ainsi des informations précieuses.
Par conséquent, l'actif contient pour les blocs de données, notamment: le perturbateur, le rouler, les tranches, les tranches, la découpe (dés), la rotation (axe)Diamond: la pêche plus, de la prémisseLe niveau suivant, par exemple: les données de taille de Zhejiang, après le forage peuvent être divisées en Hangzhou, la ville de Ninh Ba, la ville de Huzhou, la ville de Shaoxing, etc. Données de taille;
Volume: et des moyens de forage opposés, d'une polymérisation élevée, telle que les ventes de données de vente à Beijing, Shanghai, Shenzhen, Guangzhou, résumé des données de vente dans la ville de première classe; Sera 2020 quatre résumé des données trimestrielles est de 2020 données totales, V.V. Tout appartient à la masse ci-dessus;
Slices: Choisissez une valeur spécifique pour l'analyse, telle que la vente de produits électroniques, ou uniquement un niveau détaillé de la province de la province de Zhejiang
Couper: les données sont supérieures à la taille de la tranche,sélectionnez les données dans une certaine dimension. Par exemple, sélectionnez les données de vente au premier trimestre de 2020 au deuxième trimestre, vente de produits électroniques et de nécessités quotidiennes;
Tourner: c'est-à-dire que l'échange de positions de taille, comme une carte à rangée et des colonnes tournantes sont basées sur le poissonC besoins différents, changez l'angle analogique. Par exemple, le produit d'origine est utilisé comme angle et la situation des ventes de différents produits est analysée après la zone et la taille de l'heure.
3. Catégorie
Dans le format de stockage de données OLAP peut être divisé en Rolap, Molap, Holap.
Rolap: basé sur des bases de données relationnelles, des bases de données relationnelles basées sur des bases de données relationnelles et des données multidimensionnelles sont stockées et affichées par des structures relationnelles. Les technologies open source couramment utilisées sont Presto, Impala;Molap: sur la base du déploiement du CLOAP de base de données multidimensionnelle, certaines tranches, des blocs de coupe sont les principaux moyens techniques, des vitesses d'accès plus rapides de données, mais la création de la base plus longtemps, les données sont stockées dans une multi-dimension. Cube, et la technologie source commune est souvent utilisée comme kylin, druide; HOLAP: est un OLAP mixte tel qu'une relation multidimensionnelle et une matrice, principalement sur la base des avantages de Molap et de Rolap.
quand leLa structure de données n'a actuellement pas la technologie OLAP parfaite parfaite pour la quantité de données, de flexibilité et de performance (débit et simultanément). Cela peut entrer dans la compréhension, en fonction de sa propre technologie des besoins en entreprise.
II. Comment est Olap?OLAP est utilisé pour nous aider à résoudre l'accès aux données, l'analyse de données rapide, les affichages de rapport, etc l'analyse multidimensionnelle OLAP comprend généralement: des sources de données d'entreprise, des entrepôts de données, Multi -Les modèles d'analyse de mode, génération de cubes multidimensionnels, production de cartes de production.
Sources de données commerciales: OLAP peut prendre en charge une analyse de connexion de source de données multiples, les principales sources de données incluent des sources de données de classe SQL, qui peuvent être divisées en une base de données et une analyse de base de données plus relationnelles, puis ont la base de données de NOQUERY Système de calcul de calque, de calcul de données et de la source de données de la couche d'API, source de données de la couche de données, etc.
Warehouse de données: après pDiffusion de données dans des sources de données de données, des données sont développées selon certains attributs d'entreprise, formant des stocks de données sur des stocks de données dans des entrepôts de données et la récupération des entrepôts de données lors de l'analyse du sujet de données de données. Modèle d'analyse multidimensionnelle: un modèle d'analyse multidimensionnel populaire a un modèle de flocon de neige et un modèle d'étoile.Modèle d'étoile: Divisez les blocs en tables et tailles réelles et tableaux de faits toutes les valeurs de champ importantes des données de l'indicateur et de la taille de la taille, de la décentralisation, de la catégorie, du V.V. De taille de stockage. Les tables de taille et les événements sont liés aux clés principales pour former un modèle d'étoile.
Modèle de flocon de neige: Pour des tailles plus complexes, de nombreuses tables peuvent être utilisées. Par exemple, la table exécute le nombre de ventes, les dimensions de la taille du produit, l'heure du conte, le type de produit, la taille d'adresse, le type d'adresse et d'autres tailles du pays, de la province, de la terre, etc. En construisant un modèle de flocon de neigeVous pouvez minimiser le nombre de stockages de données et des performances des requêtes de données pouvant être améliorées.Blocs d'analyse multidimensionnelle: Il s'agit du bloc de données que nous avons indiqué ci-dessus et que le bloc de données permet aux outils OLAP de faire une requête pratique et rapide.
Tableau des rapports: Nous utilisons l'outil BI pour utiliser le contact le plus fréquent avec la voie. En faisant glisser, les données sont affichées de manière bonne et intuitive. Il existe de nombreux composants de rapports, tels que des graphiques, des diagrammes de ligne, des cartes biaxiales (ou des graphiques de colonne), du lot distribué, V.V.
2. Le mode de réalisation de OLAP
est principalement divisé en étapes suivantes:
1) Stade de la demande
Analyse Besoins Bridge comprend: Les besoins interrogés (décrites de la taille, des thèmes d'analyse des affaires différentes, etc.), des exigences de performance (requises pour l'heure correspondante du système), des exigences techniques, des exigences de sécuritéet besoins prioritaires.
À la période de la demande, nous connaissons les connaissances commerciales connexes, c'est très important pour notre prochain lien de conception.
2) Phase de planification
Sur la base de l'analyse de la demande, il faut comprendre la structure générale du projet et le processus de planification de l'ensemble du projet en fonction de la technologie des règles et méthodes. Dans le même temps, il est nécessaire d'identifier les ressources nécessaires à l'ensemble du projet, y compris l'humanité, la formation connexe, V.V.
3) Phase de conception La phase de conception est la phase de conception la plus importante de la mise en oeuvre OLAP, y compris l'analyse, l'analyse de taille et la conception du modèle, ainsi que la conception de la table réelle. Parmi eux, le modèle analysé comprend l'objectif et le contenu du problème et la détermination, quelle est la quantité de profit des chandails vendus tout au long de l'année? Quelle est la tendance aux bénéfices des jeans dans la première année de 2020?Analyse de la taille incluseQuelles tailles liées à l'analyse correspond à la quantité de taille et de données dans chaque sujet.
4) Étadition du modèle de construction
Détermination des problèmes nécessaires aux exigences commerciales, déterminer la taille des particules et la valeur des données de l'analyse par analyse, inclut la taille de l'analyse. Par exemple, le coût de la vente d'informations sur les ventes est principalement analysé à partir de deux directions, de la journée à double sens et de vérifier finalement et vérifiant les propriétés du modèle.
5) Selon la phase de rapportÉtape de déclaration consiste à montrer que l'analyse entraîne des résultats visuels, clairs et certains outils de rapport matures peuvent être utilisés (par exemple comme Cognos). Vous pouvez également choisir votre propre analyse, une analyse multi-angle sur la base du modèle OLAP et montrer l'effet d'expliquer le problème.
III. Conclusion
OLAP peut réduire le seuil d'utilisation pour analyser des données, réduisant de manière significative les analystes de données de données et des données d'excavation de manière significative.Les données, créeront des produits, serviront de langue SQL et d'une analyse de données complète ou d'une design de requête par simple glisser-souris.
La technologie de traitement de l'analyse en ligne consiste à analyser des données, des données de requête et d'autres besoins pouvant répondre rapidement, l'outil BI est le dernier km des applications de données énergétiques, qu'il traite des besoins simples en matière de rapport ou aide en fait les entreprises à prendre des décisions fonctionnelles, que est de rendre les données réellement de la valeur. BI TOOUS souhaite remplir les besoins d'une manière rapide et meilleure et doit être jointe à la technologie OLAP.
Lorsque nous touchons une nouvelle chose que vous êtes encore inconnue, vous pouvez vous rendre à la recherche de la source, Logic Basic trouvera de nouvelles choses liées aux espions, après tout, debout sur l'épaule de géant. Fair d'aller, dans le processus de recherche, je peux savoir ce que le nouveau continent est devenu le prochain nouvel innovateur.