Skip to main content

Les données importantes sont une technologie très populaire, apprenant de nombreuses données, ce qui signifie entrer dans l'industrie informatique interne. Cependant, il y a trop de données importantes et la technologie dans de grandes données, notamment Linux, Hadoop, Hive, HBASE, ZOODEPER, KAFKA, SCALA, SPARK, FLINK, V.V. Beaucoup de technologie, où avons-nous commencé à étudier? Quelle technologie est la plus forte demande et le potentiel le plus développé?


Parmi les derniers rapports de recherche sur les recherches de Forrester, 22 techniques et orbites ont été évalués au cours de la vie de données. Ces technologies ont des contributions majeures aux idées en temps réel, aux prévisions et aux données complètes.

1, Technologie analytique prévue

Il s'agit également de l'une des fonctions principales des grandes données. L'analyse de prédiction permet à la société d'améliorer l'efficacité des entreprises ou de réduire les risques en analysant, en évaluant, optimisant et déployant des modèles prédictifs en analysant de grandes sources de données. En même temps, pHGrace prédite de grandes données est également étroitement liée à nos vies. Taobao prédire ce que vous voulez acheter chaque fois que vous magasinez, Iqiyi est prédit. Vous voudrez peut-être voir ce que, les réseaux de lys et les autres sites de rencontres tentent même de prédire qui aimera toute personne avec n'importe qui ...

2. Base de données NOSQL mécanique


. NOSQL, non seulement SQL, signifie "non seulement SQL", mentionne des bases de données non relationnelles. La base de données NOSQL fournit un remplacement flexible, qui peut être étendu et moins cher pour des bases de données relationnelles, rompre le modèle de marché de base de données traditionnel. De plus, la base de données NOSQL peut mieux répondre aux besoins des grandes applications de données. Les bases de données NOSQL populaires incluent HBASE, REDIS, MONGODB, COUCHBASE, LEVERDB, V.V.

3, découvrir et explorer les connaissances


Soutenir de nombreuses sources de données différentes (telles que les systèmes de fichiers, les bases de données, les flux, les API et l'API et d'autres plates-formes et applications)Instruments et techniques d'informations d'exploitation en libre-service dans des entrepôts de données non structurés et des structures importantes dans des entrepôts de données non structurés à grande échelle et des structures à grande échelle. Par exemple, des techniques d'extraction de données et diverses plates-formes de données importantes.

4, gros outil de calcul de flux de données

peut être filtré, coïncidemment, enrichi et analysé à partir de plusieurs données de nombreuses sources de données complètes. La quantité de cadres peut être utilisé dans n'importe quel format de données. Le moteur de calcul de flux populaire aujourd'hui a des étincelles et des flux.


5, Structure de données de mémoire

permet d'accéder à faible latence et gère une grande quantité de données par accès à la mémoire (DRAM), la mémoire flash ou les données SSD dans des systèmes informatiques dispersés.

6, stockez des fichiers distribués


pour assurer la fiabilité et les performances d'accès du fichier, les données sont généralement stockées dans plusieurs nœuds de copie. L'Internet. Systèmes de fichiers distribués universelsY compris GFS, HDFS, Luster, CEPH, V.V. 7. Virtualisation des données

La virtualisation des données est une méthode de gestion des données permettant aux applications d'accéder à des données et de faire fonctionner des données sans avoir à élargir l'esprit. Des données détaillées, telles que les données de la source de fichiers, ou l'emplacement physique du référentiel de données et une vue d'utilisateur client unique, peuvent être fournies.

8. Intégration de données

À l'aide d'un outil anti-données, telle que Amazon élastique Mapreduce (EMR), Hive-Hive Apache, Apache Spark, Mapraduce, Hadoop et MongoDB, etc.

9, Préparation des données

Réduisant les achats, la mise en forme, le nettoyage et le partage de nombreux messages de données différents en désordre différent pour accélérer les données sexuelles.

10, Qualité des données


Utilisez un fonctionnement parallèle sur les entrepôts de données et les bases de données distribués et un ensemble de données à grande vitesse nettoyé et enrichissement.

Sujets