Skip to main content

Principalement les caractéristiques des données importantes, j'utilise Grantren pour 2012, avec des propriétés 4V, y compris des modifications à grande vitesse, des données diverses et une grande taille de données, peuvent créer une grande valeur. Cette définition, je pense que c'est une description comparative dans une opération complète et une comparaison. Parlant pour des changements à grande vitesse, comme Google 2 secondes pour compléter la recherche de page de nouvelles en ligne, une très grande quantité de données, chaque jour Google gère plus de 950 To données, le type de données est également très diversifié.


Dans notre compréhension des grandes données, il existe des facteurs clés à cet égard, l'une est des données, une technologie et une technologie. En fait, en bref, utilisez un exemple de cuisson à expliquer, de tout au long de la totalité des grandes données, c'est maintenant comme des explications différentes, nous pensons que les données importantes sont comme la cuisson mangeur, les données elles-mêmes sont des matières premières, grâce à la technologie, ces outils sont les pots dans le bol du pot, à travers tout l'outil pour ceux-ciN Mangez ceci, vous pouvez créer un plat très délicieux, c'est l'application de données importantes. La valeur totale des données importantes ne doit pas en valoir la peine. Il n'a aucune valeur et technologie traitée pour gérer ces données. Il est très précieux d'obtenir de grandes applications de données. C'est probablement un disant quelques changements et innovation de nos grandes données.



Premièrement, du rapport technique, le système informatique traditionnel a vraiment la structure de l'entrepôt de données traditionnel, principalement le traitement des données structurées et des relations informatiques et une architecture sont concentrées. Stockage partagé, les données sont abordées en calculant. Initialement, il a souligné que c'était un accent, qui mettait l'accent sur le développement de la performance de la taille des nœuds uniques. L'évolutivité à grande échelle est relativement limitée. Étant donné que les montants de données augmentent, des données provenant de milliers de fois des données, les données d'architecture et de traitement des données informatiques sont structurées, le mélange n'a aucune structure. Système informatiqueL'utilisation de stockage local est dispersée et calcule une architecture telle que ces données, soulignant que les extensions linéaires sont basées sur l'architecture générale X86, peuvent développer des marchandises de cent mille boutons.

Grandes technologies de traitement de données, nous avons d'abord déclaré que le traitement des données était divisé en deux parties, un aspect de l'analyse de masse et de la technologie, OLAP. Un autre processus est une application de requête et de transaction en ligne, y compris de grandes technologies de traitement de données, notamment Hadoop, MPP, NOSQL, des bases de données de mémoire, des calculs de flux et plus encore. Quel type de relation ces technologies sont-elles? Il suffit d'expliquer avec deux diagrammes, pour cette série d'analyses et de types analytiques, l'architecture de traitement traditionnelle traditionnelle originale que nous le savons, cette nouvelle architecture de traitement de données importante sont des produits commerciaux. Il y a une hadoop avec un lot distribué structuré et dispose d'un processus basé sur la mémoire à base de hadoop. Cadre de processusCalcul de flux, y compris les tempêtes et l'étincelle, des flux de données rapides pour les statistiques et le traitement rapide en temps réel. Dans les grands environnements de données, principalement son système et ses données pour gérer cette série d'analyses et d'applications, principalement une telle architecture.

Pour les requêtes de données et les applications de transaction, tout le monde sait qu'il existe Oracle pour des bases de données traditionnelles, car les volumes de données importants augmentent, la structure de la base de données récemment distribuée, y compris deux branches, soit une relation distincte. Base de données, comme une base de données MySQL et Oceanbase et une base de données non relationnelle, HBASE, Cassandra. Cela provient de l'architecture distribuée du logiciel. Avec le développement de la conduite matérielle, les bases de données de mémoire se sont produites progressivement, une nouvelle utilisation du nouveau développement des technologies matérielles, a une conception d'architecture logicielle, peut atteindre des changements plus élevés. performance. À cet égard, nous avons étudiéSécuriser certaines études sur ces technologies. Nous estimons qu'il peut y avoir des lignes supplémentaires, des lignes plus longues dans la recherche et le développement et l'application de notre pays.

Trois facteurs dans trois éléments introduits. Nous parlerons de données, des opérateurs, des opérateurs, j'ai beaucoup de données, y compris la Chine Mobile à titre d'exemple, y compris des données réseau, des données commerciales, des données utilisateur. Semblable à la signalisation, alarmant, gestion de réseau, données de réseau, informations commerciales, données opérationnelles, données de service à la clientèle, données utilisateur, y compris les informations de l'utilisateur, la commande d'entreprise, les articles de série, l'utilisation des entreprises, etc. Il existe un certain nombre de collections de système centralisées, notamment des utilisateurs géographiques et des données de domaine d'entreprise et en ajoutant le nombre de données de document chaque jour. O Gérer les noms de domaine, les signaux sont de 400 tonnes par jour. Il existe de nombreuses données chinoises, de texte et de données mobiles chine peuvent être une relation structurée, des données de type de table. NHCes données désormais chinois mobiles ne sont vraiment pas simplement une requête détaillée pour certains utilisateurs ou interrogent certains problèmes de réseau. Maintenant, je manipule et applique vraiment cela, nous explorons toujours ce processus.

Pour analyser les valeurs de données, nous avons également des données des opérateurs et, en fait, nous pensons qu'il est caractéristique ou précieux pour la demande. Les données Internet sont comme des données en nuage, les utilisateurs accèdent à leurs propres terminaux ou appliquent le contenu Internet ou le comportement du service Internet, qui sont des données sur Internet. Plus d'opérateurs sont de nombreux tuyaux. De cette perspective, les données Internet sont plus dispersées car les services sur des services très actifs et chaque application peut avoir une donnée très claire pour les utilisateurs. Le comportement des utilisateurs est très clair, très dispersé. Les opérateurs sont définis à partir de tous les accès des utilisateurs, d'informations dans cette zone. Les données Internet sont des données de contenu utilisateur, UGC,Les utilisateurs envoient WECHAT, WEIBO ou certaines recherches. Les opérateurs ont plus de données pour devenir des données comportementales des utilisateurs, un comportement de communication utilisateur, une consommation d'informations et des emplacements utilisateur déplacent ces orbites, V.V. À partir de ces caractéristiques, les données Internet incluent un grand nombre d'utilisateurs pour créer des données de contenu et la création d'utilisateurs de l'utilisateur peuvent clairement décrire les caractéristiques de l'utilisateur et effectuer une chimie utilisateur individuelle des services. Déplacez les données d'exploitation réseau liées au comportement des utilisateurs, au comportement de la communication et à la consommation d'informations et de l'emplacement utilisateur de l'orbite, une structure supérieure et une plus grande valeur dans la zone de réseautage social tendent les tendances et analysent les tendances du groupe et décider de l'aide.


Sur la base de ces opérateurs de données, nous pensons également constamment à des applications spécifiques que les opérateurs peuvent avoir dans de grandes données. Y compris la surveillance du réseau, y compris certaines activités commerciales, il existe d'autres valeurs pour uneNombre d'entreprises, y compris une gouvernance sociale, un soutien décisif et certains services de données.
Il s'agit d'un résumé de certains opérateurs de l'organisation de normalisation internationale TMF, y compris l'analyse des produits, l'expérience client, l'optimisation du réseau marketing, l'analyse de produits, l'expérience client. Points d'application et cas d'application spécifiques. Non détaillé ici, c'est un exemple, il s'agit également d'un cas basé sur une cas basé sur des données réseau mobiles. Ce processus est comme celui-ci, il s'agit d'une application de données de données mobile pour les données. Par exemple, un commerçant qu'il souhaite trouver le déménagement a déclaré que nous élargirons cette puce, je souhaite connaître les informations des clients et soutenir la décision à travers la planification des puces. Notre province est analysée via des réseaux et des données utilisateur, vous pouvez obtenir un accès aux marchands d'accès aux utilisateurs d'accès. Il indique qu'il a un magasin pour accéder à la distribution des groupes d'utilisateurs, la densité de la fouleConsommateur, heure de fonctionnement et caractéristiques de la foule. L'emplacement de l'information est dedans et l'accès normal est plus que cette zone et relativement proche. Le week-end, les personnes ont constaté qu'il existe de nombreux utilisateurs dans une autre zone pour accéder aux magasins et à analyser l'orbite et les utilisateurs convertibles de l'utilisateur peuvent être analysés. Selon ces informations, la répartition régionale des consommateurs, quelle région a quelques personnes qui visiteront ce magasin. L'objectif de cette population a une disponibilité, et a toujours une caractéristique du peuple. Ceux qui sont distribués de 25 à 35 ans sont supérieurs à 80% et ainsi de suite. Cela ne fera pas cela pour une personne, mais nous pouvons analyser ce groupe.

Cette entreprise dispose de ces données très déterminées à ce que les domaines me viennent à visiter, la volonté de l'acheter est assez forte. J'ai ouvert un nouveau magasin, selon la zone de planification des transports, l'inventaire, v.v ...C'est une personne plus utile pour les commerçants. Après avoir combiné un certain nombre de mobiles chinois, combinés au marketing mobile chinois, cette analyse de données et analyse des données rien à faire, il s'agit du canal promotionnel, des appels et des portes entières Les marchandises sont complétées et ouvertes. C'est la comparaison mobile des cas typiques, la société de notre société implémente un cas réel.

En fait, ce n'est qu'un petit exemple. Personnellement, je pense que nous pouvons déplacer des données dans cet aspect peut jouer une plus grande valeur. Vous êtes comme un rapport Baidu publié des vacances. Par exemple, combien de personnes ont coulé de la ville où les villes circulent de la part de ce problème peuvent être une analyse plus précise. Les flux de population, y compris le temps de débit, le mode de flux va s'entraîner ou voler pour l'obtenir. Très simple, la position du navire est située dans une position, l'utilisateur du plan éteint avant de monter à bord de l'avion, commencez l'avion, cette fois, le temps de flux,Temps de flux, il existe une analyse très détaillée de ce type de véhicule. Fournir le service des transports ou fournir des autres gestionnaires sociaux nationaux à jouer une valeur énorme. Parce que nous étudions actuellement cela, vous pouvez jouer une valeur dans les activités antiterroristes de certains pays. Par exemple, nous analysons un groupe de personnes qui sont souvent en contact, d'une province relativement sensible à une ville plus importante, et lorsqu'il rencontre une fonctionnalité, nous avons donné des plans de ce domaine pour mener une certaine gestion. Je pense que ces choses sont le seul avantage des données de l'opérateur. À l'heure actuelle, nous partagerons nos pensées et nos pratiques des données, technologies et applications.


Enfin, nous pensons que la nature des données importantes est ce dont la même chose, nous pensons que la nature des données importantes analyse maintenant les données sont de grandes données. En fait, des données importantes ne veut pas dire que des analyses DDonnées. Grandes données. Les données importantes ne sont pas modifiées par masse et nous avons analysé une partie des données d'échantillonnage ou une analyse de données spécifique. Une caractéristique de données importantes consiste à analyser l'ensemble des données. En raison de l'analyse de toutes les données, nous poursuivons une intégrité statistique plutôt que la précision absolue de données principale. Une autre conclusion importante est que les données importantes poursuivent vraiment une relation connexe et non la cause. Les relations sont principalement liées aux données, aux données entre données et données, au lieu de la poursuite réelle de la vérité. Populaire, lorsque nous constatons qu'une certaine fonctionnalité de données se produit, car cette règle peut correspondre au fait que cette règle peut correspondre au fait que cette règle peut être conclue, elle peut être énorme. Recréer une probabilité. Par exemple, le tremblement de terre ne peut pas expliquer différentes données, de nombreuses géologues inhabituelles ou données devant le séisme. Quel genre de relation causaleDirectement entre ces anomalies ne peuvent toujours pas expliquer maintenant. Toutefois, tant que ces données ont ces exceptions, cela peut se produire correspondant à l'événement tremblement de terre, ce qui est un cas typique. La nature de l'ensemble des grandes données est la structure, les statistiques, les lois et les prévisions. La première structure des données, puis suivre les statistiques, trouver la douane pertinente entre ce système de données est la loi et finalement la prédiction est effectuée.

Ici, c'est aussi un cas réel où la province fait. Nous avons un besoin. Le gestionnaire doit surveiller l'autoroute pour mettre en œuvre une congestion en temps réel, nous vous déplacons habituellement dans cette zone. Cette méthode consiste à déplacer la cellule sur la borne de téléphone mobile sur le réseau mobile et à convertir en continu des cellules dans le téléphone mobile. La transmission du fonds de commutation de réseau mobile détermine l'état de la mise en œuvre de la voiture sur l'autoroute pour obtenir une situation de trafic en temps réel. Ici j'utilise cet exemple pourExpliquer les méthodes statistiques n'est que de grandes données et des différences initiales. La méthode d'analyse traditionnelle d'origine Nous devons créer un modèle, c'est le schéma de la zone de couverture mobile, le point de commutation mobile et la relation de feuille de route correcte, si une voiture transférée d'un point à ce point, la distance, combien de temps, calculer Vitesse, calcul de cet article. Un problème est difficile et exactement des points de conversion des cellules concernés. Le point de conversion est l'intensité du signal aura une diminution différente, elle aura probablement une différence très incertaine ou très grande. Nous pensons à un moyen d'analyser de grandes méthodes d'analyse de données, ne poursuivant plus l'emplacement exact du point de conversion. Selon une analyse de données historiques, la distance statistique entre les points de conversion est calculée et la distance statistique entre les lignes lisses et la congestion entre les routes à différents moments. À 8 heures, cela peut prendre 5 minutes du point de vue du transfertProchaine conversion. Il faut 2 minutes ou 1 minute à dix heures.

Nous pouvons modifier ce formulaire de données via le nombre d'utilisateurs de cellules pour prédire le temps de congestion. Notre communauté a adopté beaucoup de statistiques historiques, toutes peuvent être des statistiques. C'est 20 personnes dans la communauté. Son trafic est de 10 par minute et 10 magasins sont sortis chaque minute et la vitesse correspondante est ouverte. Lorsque certaines personnes sont en retard, 50 personnes dans la communauté entrent dans le trafic sont de 20 par minute, sur 5, à ce stade, elle est considérée comme bloquée. Nous analysons les statistiques sur les relations pertinentes entre les données et les événements, nous pouvons prédire directement la congestion de la route. Situé dans le bureau peut le faire via une analyse de données réseau, vous n'avez pas besoin de savoir ce que vous devez faire avec de vraies routes. C'est un moyen de créer une analyse de données importante.

Voir les éléments de grandes données. Chaque nLa personne qui regarde cette photo, a un plat, a un outil, a une matière première et nous créons enfin une assiette, c'est l'un des facteurs. Tout le monde pense qu'il y en a, la chose la plus importante est ce chef, qui est une personne, lorsque de grandes données sont précieuses, la chose la plus importante est que nous pensons qu'il y a un rôle appelé Evil Ingénieur volonté ou scientifique, nous devons cultiver certains Les gens qui observent ces choses tous les jours. Les données sur ces données sont fréquentes, trouvez des applications très précieuses pour créer ces grandes données pour donner plus de valeur. China Mobile Research Institute Nous sommes actuellement importants de données et de technologies, nous avons maintenant beaucoup d'experts dans ce domaine pour le faire. Sur la base de nos données de réseau, des données utilisateur NOS ont fait une idée et un traitement de données, j'espère que ces données peuvent inclure ces données. un rôle plus important dans notre entreprise et joue TDes fuites de fuite dans notre entreprise et comprennent la gouvernance sociale et un autre soutien décisionnel.


Sujets