Skip to main content

Les données sont appelées la dernière matière première commerciale «Huile du XXIe siècle». La quantité totale de données utilisée dans les secteurs commerciaux, les zones de recherche et développement est très importante et augmentée en permanence. Pour Elsevier, 700 millions d'articles sont téléchargés à partir de ScienceDirect chaque année, 80 000 fichiers organisés sur SCOPUS et 1 300 chercheurs, 3 millions de chercheurs sur Mendeley. Pour les utilisateurs, il devient de plus en plus difficile et plus difficile de l'océan.


De nombreuses modifications visuelles avancées (telles que des diagrammes réseau, des modèles 3D, des cartes d'empilement) sont utilisées à des fins spécifiques, telles que des images médicales 3D, des simulations d'intersection Pine Urbain, une surveillance des catastrophes. Mais quelle que soit la complexité, des fins intuitives sont d'aider les lecteurs à identifier le modèle ou la tendance des données analysées, au lieu de fournir des descriptions longues, telles que: "Le bénéfice d'A en 2000 était de 2,9% plus élevé, bien que le bénéfice d'un 2001 a augmenté de 25%, le taux de bénéfice de 2001 était de 3,5%. "D'excellents éléments de visualisation résumeront les informations et organiseront des informations pour faire l'attention des lecteurs dans les points principaux.
Pour les services d'analyse d'Elsevier, nous avons cherché à améliorer l'analyse et la visualisation des données. Par exemple, il existe de nombreuses données sur la coopération de la recherche dans notre analyse de la performance de la recherche; Notre rapport est fourni par la science européenne (l'incorporation de la recherche et de la recherche sur la recherche des États-Unis et des États-Unis) contient des données de coopération transnationale et de coopération internationale, inappropriées d'utiliser les tables à deux dimensions directement et XY graphique.

Afin d'explorer l'histoire des données, nous avons utilisé le diagramme de la relation réseau pour déterminer la coopération entre les pays et comprendre l'impact de chaque partenaire.


Cet article fournit un guide visuel contenant cinq étapes. Pour utiliser des tables, des graphiques pour diffuser l'observation, certaines personnes expliquent que les résultats de l'analyse fournissent de l'aide. Se souvenir, concevoirPrendre un bon projet visuel est un processus répété répété.

Étape 1 - Question claire


Lorsque vous commencez à créer un projet visuel, la première étape consiste à supprimer la question à répondre ou à essayer de répondre aux phrases poser plus tard. "Comment ce projet visuel a-t-il contribué à lire?"
Tableau 1 - Trois enregistrements de la concentration de données



Figure 1 La bouse du gâteau ne clarifie pas la vérité, mais est fascinée. Cette image contient trop de variables

Le problème peut explicitement aider à éviter un problème commun que les données de visualisation: mettre des choses qui ne sont pas découvertes ensemble. Supposons que nous ayons un tel ensemble de données (voir tableau 1), y compris le nombre total d'auteurs, le nombre total de publications, le nombre total de références et leur taux de croissance spécifique.

La figure 1 est une mauvaise affaire de visualisation, toutes les variables sont incluses dans une table. Différents types de variables sont dessinés dans le même nombre, généralement pas un italienBonne idée.

L'attention du lecteur provoquera des variables relativement déconnectées.

Par exemple,
, le nombre total d'auteurs de toutes les organisations inférieures au nombre total de publications, sans signification ou d'exploration du nombre total de publications des trois organisations de recherche d'Athena University, de Bravo University, Organisation Delta . Il n'y a pas de sens de croissance. Le tableau encombré est très difficile à lire, il est difficile de gérer. C'est le cas lorsqu'il existe de nombreux axes médicaux, quelle variable correspond à tout axe n'est pas clair. En bref, la visualisation du gâteau ne clarifie pas la vérité mais est confuse.
Étape 2 - Après la visualisation de base

Détermination de la cible de la visualisation, la prochaine étape consiste à établir un graphisme de base. Il peut s'agir d'un tableau de cercle, de diagramme de ligne, de diagramme, de diagramme de dispersion, de diagramme de surface, de carte, de diagramme de réseau et de similaire, selon la main. Lorsque les informations principales du graphique, vous devez supprimer les éléments suivants: Quelle variable essayons-nous de dessiner?

Taille de x axeQu'est-ce qu'un arbre?

Y a-t-il une signification de la taille du point de données?

signifie couleur?
Nous avons essayé de déterminer la relation entre les tendances ou les variables?
Certaines personnes utilisent différents types de graphiques pour atteindre des objectifs similaires, mais ne le recommandent pas. Différents types de données que chaque type a le type de carte le plus approprié.
    Exemple: Le tableau de forme de la ligne est le mieux adapté aux performances et aux tendances liées au temps ou à une relation potentielle entre les deux variables. Lorsque les points de données dans l'ensemble de données sont trop volumineux, la visualisation est facile à utiliser des lots distribués.

    En outre, le graphique affiche la distribution des données. La forme du graphique peut être modifiée selon différents groupes, voir la figure 2. (Lors du dessin du graphique, l'essence consiste à dessiner le graphique pour indiquer le nombre de points de données dans la plage spécifique. Appelé l'écart de groupe.)



Figure 2 - Lorsque l'écart de groupe change, la forme du graphique est également pardonnée.y échange.

L'écart de groupe provoquera trop d'ondulation, de sorte que les lecteurs ne regardent que l'arbre mais ne peuvent pas voir toute la forêt. De plus, vous constaterez qu'après avoir terminé l'étape suivante, vous pouvez vouloir modifier ou remplacer le type de graphique.


Étape 3 - Déterminez l'indicateur le plus d'informations
Supposons que nous ayons une autre base de données du nombre de publications d'une organisation de recherche (voir tableau 2). L'étape la plus importante du processus de visualisation consiste à mieux comprendre la signification de la base de données et chaque variable. Comme on peut le voir de la table, dans cette zone (sujet A), l'agence a publié 39% de cette organisation, représentant 39% de cette organisation; 27 738 articles dans cette zone en même temps, représentant un total de 44% mondial. Notez que le pourcentage de la colonne B a plus de 100%, car certains postes sont marqués comme une variété de champs.

Dans cet exemple, nous voulons comprendre combien de messages ont été effectués dans différents domaines. Le nombre de publications estUn indicateur utile, mais non seulement cela et les indicateurs suivants présenteront plus d'informations:

Total des résultats de la recherche dans cette zone (B)
Activités mondiales dans cette zone

[1. De cela, nous pouvons identifier un indicateur relativement positif, 1,0 représentant le fonctionnement moyen du monde. Il est supérieur au niveau mondial, inférieur à 1,0 inférieur au niveau mondial. Données avec colonne B divisé par colonne D pour obtenir ce nouvel indicateur, voir tableau 2.



Tableau 2- Données avec la colonne B divisé par la colonne D pour obtenir un indicateur Nouveau: Activité relative ( colonne e).



Étape 4 - Sélectionnez le type de carte exacte
Maintenant, nous pouvons utiliser la carte radar pour comparer des indicateurs relativement liés et se concentrer sur les domaines de recherche / les plus bas. Par exemple, l'indice relativement opérationnel dans les codes G est le plus élevé (1,8), mais le total mondial de ce champ est beaucoup plus petit que d'autres zones (voir la figure 3). Une autre restriction deLa carte radar est qu'elle implique qu'il existe une relation entre les axes et cette relation n'est pas dans ce cas (toutes les zones non liées).


Figure 3 - Carte radar de l'indice relatif
Les données normalisées (telles que l'indice d'activité relative dans cet exemple), une méthode de transfert change de données très efficacement, mais doit utiliser le but de aider les lecteurs à obtenir des conclusions précises. Comme dans ce cas, seul le mécanisme cible n'a pas beaucoup d'importance sur un petit champ.

Nous pouvons mettre des publications et des niveaux d'activité présentés dans le même tableau pour comprendre l'activité de chaque campagne. Utilisation de la carte de la Commission de la figure 4, la zone de chaque pièce représente le nombre de longs articles et rayon indique l'indice d'activité relative. Notez dans ce cas, l'arbre de rayon est secondaire (et est généralement linéaire). Comme on peut le voir sur la photo, l'école B est mise en évidence avec le plus grand nombre (désigné par la région) et fonctionne.Relativement le plus élevé (indiqué par un paiement long).

Figure 4 - Carte de la Commission. Chaque bloc de cette image montre que le nombre de postes à long terme et de rayon indique des indicateurs positifs relatives (liste électronique).


Étape 5 - Faites attention aux informations importantes

La longueur du rayon peut être mesurée n'est pas facile. En raison de cet exemple, l'index actif 1.0 est relativement représente le fonctionnement global de ce champ, nous pouvons guider les lecteurs en fournissant une valeur de référence 1.0, voir la figure 5. Ceci est facile à commander Voir les zones du rayon en dehors de la ligne de référence.



Figure 5 - Carte de la Commission avec une ligne de référence d'index relativement positive
Nous pouvons également utiliser des couleurs pour aider les lecteurs à déterminer de nombreuses publications. Comme le montre la légende, un morceau de couleur est déterminé par le nombre de publications. Pour faciliter l'identité, nous pouvons également utiliser le nom du champ comme étiquette (voir la figure 6).


Figure 6 - La profondeur de couleur de la couleur de la carte de la rose représente le nombre de publications (couleurs plus lumineuses, autant de publications)


Conclusion


sont de nombreuses façons de visualiser des données. Les nouveaux outils et graphiques sont apparus, chaque type tente de créer un graphique plus attrayant qu'auparavant, plus favorable avec les informations de contact. Notre proposition est de se rappeler les principes suivants: Les projets de visualisation résumeront des informations importantes et la rendre plus claire et ne doivent pas être confondues ou utiliser de nombreuses informations pour rendre les lecteurs trop chargés.


Traduction: Wang Pengyu


VIA: dataartisan Data Craftsman Adresse originale: http: //www.36dsj Cet article Copie partagée, si elle Concernant les travaux, les droits d'auteur sur les droits d'auteur et d'autres problèmes, veuillez nous contacter pour supprimer la première fois (Micro Signal: LOVEDATA0520)

Sujets