L'entrepôt de données sur le cloud computing est une collection, une organisation et un stockage régulier de services pour les organisations pour différentes activités (y compris l'analyse de données et la surveillance). Lorsque les entreprises utilisent des entrepôts de données en cloud computing, tout le matériel physique est responsable du fournisseur de cloud computing. Ils sont abstraits. Au cours des dernières années, alors que de plus en plus de sociétés ont commencé à utiliser des avantages informatiques en nuage et à réduire le centre de données physique, les entrepôts de données en nuage se poursuivent.
L'entrepôt de données sur le cloud computing comprend généralement un ou plusieurs pointeurs pointant vers la base de données, collectant des données de production dans ces collections. Le deuxième élément central de l'entrepôt de données de cloud computing est une forme de moteur de requête intégrée, permettant aux utilisateurs de rechercher et d'analyser des données. Cela aide les données minières.
Lors de la recherche d'un entrepôt de données sur le cloud computing, les entreprises devraient envisager de nombreuses normes. Déploiement existant du cloud. Chaque important fournisseur de cloud public possède son propre entrepôt de données, qui fournit une intégration avec les ressources existantes, ce qui facilite la déploiement et l'utilisation des entrepôts de données.
La possibilité de migrer des données. Considérez la possibilité d'organiser différents types de données et leurs emplacements de stockage, la migration efficace des données vers de nouveaux entrepôts de données est essentielle.
Options de stockage. Bien que les solutions d'entrepôt de données puissent être utilisées pour stocker des données, mais peuvent accéder aux services de stockage de cloud commercial, il existe une sélection de coûts inférieure. Dans la liste des principales sociétés énumérées dans la Datamation des médias de l'industrie, vous vous êtes concentré sur la fourniture de services d'entrepôt de données de cloud computing de haut niveau:
1, Amazon Redshift
valeur de l'acheteur potentiel. Comme Amazone entre dans le marché de l'entrepôt de données en nuage, RedShift est une solution idéale pour les organisations d'investissements dans AWS Tools et de déploiement.
Valeur clé / différence:
• La différence principale entre RedShift est qu'avec sa fonction SPE Ctrum, l'organisation peut utiliser directement le service de stockage de données de cloud AWS S3. Connexion de stockage de données, réduisant ainsi le temps et le coût requis pour commencer. • L'un des avantages des utilisateurs met l'accent sur la performance de Redshift, qui bénéficie de la requête de distribution et de l'analyse des données de l'infrastructure AWS et de l'architecture d'entrepôt de données de traitement parallèle.
• Nombre de S3 ou de Data LakeSelon le redshift, la colle AWS est intégrée à la colle AWS et la colle AWS est une extraction, une conversion, une charge (ETL) pour importer des données dans l'entrepôt de données.• Le stockage et le fonctionnement de l'entrepôt de données sont protégés par des stratégies et des outils d'isolation de réseau AWS (y compris le cloud privé virtuel (VPC)).
2, Google BigQuery
La valeur de l'acheteur potentiel. Pour les utilisateurs qui souhaitent utiliser des requêtes SQL standard pour analyser de grands ensembles de données dans le cloud, BigQuery est un choix raisonnable.
• En tant que service d'informatique en nuage entièrement hébergé, le réglage de l'entrepôt de données et de l'alimentation des ressources sont utilisés par Google. Traitement.
• La possibilité de interroger facilement des données via SQL ou par la base de données ouverte (ODBC) est la valeur clé de BigQuery, ce qui permet aux utilisateurs d'utiliser des outils et des compétences existants.
• L'intégration avec BigQuery ML est une distinction clé, qui intègre le monde des entrepôts de données et de l'apprentissage automatique (ML). Utilisez la BigQuery ML pour former des charges de travail de formation de machines sur les données de l'entrepôt de données.
3, Warehouse IBM DB2 La valeur de l'acheteur potentiel. Pour les organisations qui traitent la charge de travail, l'entrepôt IBM DB2 est un bon choix, qui peut bénéficier du moteur de base de données mémoire intégré de la plate-forme et du moteur Apache Spark Analyze.
Valeur de clé / différence:
• Intégrer le moteur de base de données de colonne dans la mémoire DB2, pour les organisations qui recherchent des entrepôts de données avec des bases de données hautes performances en termes de cette page, Cela peut être un grand avantage.
• Le moteur Spark Apache Spark est également intégré à DB2, ce qui signifie que les utilisateurs peuvent utiliser des requêtes SQL et des requêtes d'étincelles pour les entrepôts de données pour obtenir des idées.• Entrepôt DB2 bénéficie de la technologie Netezza d'IBM et des fonctionnalités de recherche de données avancées.
• La plate-forme IBM Cloud peut-elle ou AWS CloudLe déploiement du cloud est terminé et il existe également une version locale de DB2 Warehouse, qui est utile pour les organisations de déploiement de nuages hybrides. 4, Warehouse de données SQL Microsoft Azure SQL
La valeur de l'acheteur potentiel. Microsoft Azure SQL Data Warehouse est idéal pour toutes les entreprises, qui est attribuée à l'intégration avec Microsoft SQL Server, et il est souhaitable d'introduire facilement la technologie de l'entrepôt de données de cloud computing.
Valeur clé / Différence:
• Microsoft a émis la mise à jour principale de Azure SQL Data Warehouse en juillet 2019, y compris la mise à jour GEN2, fournie plus de fonctionnalités SQL Server et de sécurité avancée options.
• Les utilisateurs Microsoft existants peuvent obtenir le plus grand avantage de l'entrepôt de données Azure SQL, car sur les nuages publics Microsoft Azure et surtout, SQL Server pour la base de données a plusieurs intégrations.
• Microsoft est construit dans une énorme architecture de traitement parallèle par rapport au serveur SQL d'exécution local, ce qui permet aux utilisateurs d'exécuter plus de 100 requêtes simultanées en même temps.
5, entrepôt de données autonomes Oracle
la valeur des acheteurs potentiels. Pour les utilisateurs existants de la base de données Oracle, l'entrepôt de données autonome d'Oracle peut être le choix le plus simple, qui fournit une entrée connectée au cloud.
• La principale différence de Oracle est qu'il exécute un entrepôt de données autonome dans un service d'informatique en nuage optimisé, qui exécute Oracle Le système Hardware Exadata est Construit spécifiquement pour la base de données Oracle.
• Ce service intègre des services de cahiers et de rapports sur le Web pour partager l'analyse des données et obtenir une collaboration décontractée...
• La fonction de développeur SQL d'Oracle est une autre fonctionnalité clé intégrant une assistant de chargement de données et un environnement de développement de base de données.
6, Nuage de l'entrepôt de données SAP
La valeur de l'acheteur potentiel. SAP Data Warehouse Cloud peut être idéal pour les tissus des entrepôts de données qui souhaitent faire plus de transfert via des modèles pré-construits.
Valeur clé / Différence:
• SAP Data Warehouse Cloud est un participant relativement nouveau dans ce domaine, il est en mai 2019 Sapphire maintenant la réunion a été publiée pour la première fois.
• Le service Cloud Hana et la base de données de SAP sont le noyau de Data Warehouse Cloud, complété par la gouvernance des données et s'intègre au moteur de requête SQL.
• La principale différence entre la plate-forme est intégrée à un modèle d'entreprise pré-construit permettant de résoudre des entrepôts de données universels et des cas d'utilisation analytique d'industries et d'entreprises spécifiques.
7, flocon de neige
la valeur de l'acheteur potentiel. Snowflake est un bon choix pour les organisateurs qui doivent choisir différents fournisseurs de cloud publics pour des fonctions d'entrepôt de données.
• Différences de clé de la fonction de base de données de la colonne de flocon de neige, qui peut traiter des données structurées et de la moitié des données structurées JSON et XML.
• L'architecture découplée de flocon de neige permet aux calculs et au stockage, respectivement et fournit un stockage de données dans le fournisseur de cloud sélectionné par l'utilisateur.
• Le système crée une soi-disant entrepôt de données virtuel dans le flocon de neige, où différentes charges de travail partagent les mêmes données, mais peuvent courir de manière indépendante.• La requête est effectuée par SQL standard pour analyse et intégrer les langages de programmation R et Python.
7 Tableau de comparaison de l'entrepôt de données en nuage