Les données sont appelées la dernière matière première commerciale «Huile du XXIe siècle». La quantité totale de données utilisée dans les secteurs commerciaux, les zones de recherche et développement est très importante et augmentée en permanence. Pour Elsevier, 700 millions d'articles sont téléchargés à partir de ScienceDirect chaque année, 80 000 fichiers organisés sur SCOPUS et 1 300 chercheurs, 3 millions de chercheurs sur Mendeley. Pour les utilisateurs, il devient de plus en plus difficile et plus difficile de l'océan.
De nombreuses modifications visuelles avancées (telles que des diagrammes réseau, des modèles 3D, des cartes d'empilement) sont utilisées à des fins spécifiques, telles que des images médicales 3D, des simulations d'intersection Pine Urbain, une surveillance des catastrophes. Mais quelle que soit la complexité, des fins intuitives sont d'aider les lecteurs à identifier le modèle ou la tendance des données analysées, au lieu de fournir des descriptions longues, telles que: "Le bénéfice d'A en 2000 était de 2,9% plus élevé, bien que le bénéfice d'un 2001 a augmenté de 25%, le taux de bénéfice de 2001 était de 3,5%. "D'excellents éléments de visualisation résumeront les informations et organiseront des informations pour faire l'attention des lecteurs dans les points principaux.
Pour les services d'analyse d'Elsevier, nous avons cherché à améliorer l'analyse et la visualisation des données. Par exemple, il existe de nombreuses données sur la coopération de la recherche dans notre analyse de la performance de la recherche; Notre rapport est fourni par la science européenne (l'incorporation de la recherche et de la recherche sur la recherche des États-Unis et des États-Unis) contient des données de coopération transnationale et de coopération internationale, inappropriées d'utiliser les tables à deux dimensions directement et XY graphique.
Afin d'explorer l'histoire des données, nous avons utilisé le diagramme de la relation réseau pour déterminer la coopération entre les pays et comprendre l'impact de chaque partenaire.
Cet article fournit un guide visuel contenant cinq étapes. Pour utiliser des tables, des graphiques pour diffuser l'observation, certaines personnes expliquent que les résultats de l'analyse fournissent de l'aide. Se souvenir, concevoirPrendre un bon projet visuel est un processus répété répété.
Étape 1 - Question claire
Lorsque vous commencez à créer un projet visuel, la première étape consiste à supprimer la question à répondre ou à essayer de répondre aux phrases poser plus tard. "Comment ce projet visuel a-t-il contribué à lire?"
Tableau 1 - Trois enregistrements de Data Set
L'incident évident peut aider à éviter un problème commun avec la visualisation des données: comparer les choses qui ne sont pas découvertes ensemble. Supposons que nous ayons un tel ensemble de données (voir tableau 1), y compris le nombre total d'auteurs, le nombre total de publications, le nombre total de références et leur taux de croissance spécifique.
La figure 1 est une mauvaise affaire de visualisation, toutes les variables sont incluses dans une table. Différents types de variables sont dessinés dans le même nombre, Généralement pas une bonne idée.
L'attention du lecteur provoquera des variables relativement déconnectées.
Par exemple,
, le nombre total d'auteurs de toutes les organisations inférieures au nombre total de publications, sans signification ou d'exploration du nombre total de publications des trois organisations de recherche d'Athena University, de Bravo University, Organisation Delta . Il n'y a pas de sens de croissance. Le tableau encombré est très difficile à lire, il est difficile de gérer. C'est le cas lorsqu'il existe de nombreux axes médicaux, quelle variable correspond à tout axe n'est pas clair. En bref, la visualisation du gâteau ne clarifie pas la vérité mais est confuse.
Étape 2 - Après la visualisation de base
Détermination de la cible de la visualisation, la prochaine étape consiste à établir un graphisme de base. Il peut s'agir d'un tableau de cercle, de diagramme de ligne, de diagramme, de diagramme de dispersion, de diagramme de surface, de carte, de diagramme de réseau et de similaire, selon la main. Lorsque les informations principales du graphique doivent être claires, vous devez supprimer les éléments suivants:
Quelle variable.Un essai de dessiner?
Quel est l'axe X et l'axe?
Qu'est-ce que cela signifie?
Nous avons essayé de déterminer la relation entre les tendances ou les variables?
Certaines personnes utilisent différents types de graphiques pour reconnaître des objectifs similaires, mais ne le recommandent pas. Différents types de données que chaque type a le type de carte le plus approprié.
Exemple: Le tableau de forme de la ligne est le mieux adapté aux performances et aux tendances liées au temps ou à une relation potentielle entre les deux variables. Lorsque les points de données dans l'ensemble de données sont trop volumineux, la visualisation est facile à utiliser des lots distribués.En outre, le graphique affiche la distribution des données. La forme du graphique peut être modifiée selon différents groupes, voir la figure 2. (Lorsque le tableau de dessin, la nature dessine la carte de colonne. Pour afficher le nombre de points de données dans une plage spécifique. Cette plage est appelée Gap de groupe.
La figure 2 est un changement dans le groupe et la forme du graphique égalementchangement.
Le groupe est trop étroit, causant trop de ondulations, de sorte que le lecteur regarde juste à l'arbre mais ne peut pas voir toute la forêt. De plus, vous constaterez qu'après avoir terminé l'étape suivante, vous pouvez vouloir modifier ou remplacer le type de graphique.
Étape 3 - Déterminez l'indicateur le plus d'informations
Supposons que nous ayons une autre base de données du nombre de publications d'une organisation de recherche (voir tableau 2). L'étape la plus importante du processus de visualisation consiste à mieux comprendre la signification de la base de données et chaque variable. Comme on peut le voir de la table, dans cette zone (sujet A), l'agence a publié 39% de cette organisation, représentant 39% de cette organisation; 27 738 articles dans cette zone en même temps, représentant un total de 44% mondial. Notez que le pourcentage de la colonne B a plus de 100%, car certains postes sont marqués comme une variété de champs.
Dans cet exemple, nous voulons comprendre combien de messages ont été effectués dans différents domaines. Nombre de pressesm est un indicateur utile, mais non seulement ceci, les indicateurs suivants montreront plus d'informations:
Résultats de la recherche dans cette zone (B)
Activités mondiales dans cette zone
de ceci, Nous pouvons identifier un indicateur relativement positif, 1,0 représentant l'activité moyenne du monde. Il est supérieur au niveau mondial, inférieur à 1,0 inférieur au niveau mondial. Données avec colonne B divisé par la colonne D pour obtenir ce nouvel indicateur, voir tableau 2.
Tableau 2- Données avec colonne B divisé par la colonne D Obtenir un nouvel indicateur: Relatif niveau d'activité (barre électronique).
Étape 4 - Sélectionnez le type de carte exacte Maintenant, nous pouvons utiliser la carte radar pour comparer des indicateurs relativement liés et se concentrer sur les domaines de recherche / les plus bas. Par exemple, l'indice relativement opérationnel dans les codes G est le plus élevé (1,8), mais le total mondial de ce champ est beaucoup plus petit que d'autres zones (voir la figure 3).Une autre limitation de la carte radar est qu'elle implique qu'il existe une relation entre les axes et cette relation n'est pas dans ce cas (toutes les zones non liées). Figure 3 - Graphique radar d'indice relatif Normaliser les données (telles que l'indice d'activité similaire pour cet exemple) est un très courant. Méthode de conversion de données, mais doit aider les lecteurs à utiliser des conclusions précises. Comme dans ce cas, seul le mécanisme cible n'a pas beaucoup d'importance sur un petit champ. Nous pouvons afficher des publications et des niveaux opérationnels dans le même tableau pour comprendre l'activité de chaque école. Utilisation de la carte de la Commission de la figure 4, la zone de chaque pièce représente le nombre de longs articles et rayon indique l'indice d'activité relative. Notez dans ce cas, l'arbre de rayon est secondaire (et est généralement linéaire). Comme on peut le voir sur la photo, l'école B est très importante, avec le plus grand nombre (spécifié parZone) et l'opération relativement la plus élevée (exprimée par un paiement long). Figure 4 - Illustration de rose. Chaque bloc de cette image montre que le nombre de postes à long terme et de rayon indique des indicateurs positifs relatives (liste électronique). Étape 5 - Faites attention aux informations importantes La longueur du rayon peut être mesurée n'est pas facile. En raison de cet exemple, l'index actif 1.0 est relativement représente le fonctionnement global de ce champ, nous pouvons guider les lecteurs en fournissant une valeur de référence 1.0, voir la figure 5. Ceci est facile à commander Voir les zones du rayon en dehors de la ligne de référence. Figure 5 - Carte de la Commission avec une ligne de référence d'index relativement positive , nous pouvons également utiliser des couleurs pour aider les lecteurs identifier la plupart des publications. Comme le montre la légende, un morceau de couleur est déterminé par le nombre de publications. Pour faciliter l'identité, nous avons aussiPeut utiliser le nom du champ comme étiquette (voir la figure 6). Figure 6 - La profondeur de couleur de la couleur de la carte de la rose représente le nombre d'articles publiés (couleurs plus lumineuses, plus de publications) Conclusion Il existe de nombreuses façons de visualiser des données. Les nouveaux outils et graphiques sont apparus, chaque type tente de créer un graphique plus attrayant qu'auparavant, plus favorable avec les informations de contact. Notre proposition est de se rappeler les principes suivants: Les projets de visualisation résumeront des informations importantes et la rendre plus claire et ne doivent pas être confondues ou utiliser de nombreuses informations pour rendre les lecteurs trop chargés. Auteur original: Georgin Mop et Lei Pan Traduction: Traduction: Wang Pengyu VIA: Draftsman Data Attisan Adresse originale: http: http: // www.36dsj.com/archives/39986 Pour partager la réimpression, veuillez contacter d'abord nous supprimons (microchirurgie: LOVEDATA0520)