Si vous avez déjà étudié ou utilisé des algorithmes, il ne sera pas familier avec le concept d'importance de la fonctionnalité. L'algorithme est souvent utilisé pour prédire et les prévisions ne seront pas supprimées, sur la base des prévisions existantes de variables (x) (x) et des informations dans de nombreuses prévisions finales sont spéciales. Combien?
Par exemple: Si cela peut prédire demain, il pleut, le premier X est l'humidité de l'air demain, la seconde est ensoleillée ou Tianyin demain, X mardi est la température de demain, quatre x est demain. C'est un jour de la semaine. Il sera définitivement différent dans quatre x différents x. Effets de quatre x différents seront définitivement et nous appelons cet effet.
Quelle est la différence entre l'importance de la fonctionnalité et de l'importance basée sur l'interprétation des affaires? Il écoute généralement beaucoup d'analyse de données pour dire que l'algorithme est d'analyser de meilleures données, de promouvoir de meilleures affaires.
pour améliorer l'entrepriseP, vous avez besoin de vos résultats à expliquer, vous ne pouvez pas obtenir de modèle de boîte noire pour informer votre entreprise disant que le ciel pleuvra demain, comme pourquoi, ne savez pas. Ceci est définitivement non, nous devons donc expliquer nos résultats.
liés à l'importance de la caractéristique, la méthode de calcul de différents modèles est légèrement différente, mais un principe général est de contribuer plus précisément aux images de résultats des prévisions tissulaires et sont importantes. De nombreux modèles sont livrés avec des propriétés dotées de_importance, ce qui peut être trouvé pour marquer chaque fonctionnalité.
Points caractéristiques Faites-nous savoir l'importance de différentes caractéristiques, en plus de cela, nous souhaitons également savoir que dans d'autres caractéristiques constantes, certaines fonctionnalités de distribution importantes à l'intérieur ressemblent. Ceci est également une méthode prête, appelée carte dépendante partielle, le nom complet de l'anglais est des cellules redondantes, appelées PDP.
La première rangée de l'image montre le nombre moyen de revenus, le taux d'occupation moyen, l'âge de l'âge de l'âge de la médiane médiane, peut voir l'utilité linéaire, utilitaire inversée, les trois tendances non désirées. Le diagramme dans le coin inférieur droit reflète l'interaction entre les deux caractéristiques.
Après les caractéristiques des caractéristiques, chaque valeur des caractéristiques est en dehors de la relation d'impact prédictif, nous introduirons notre valeur de valeur protagoniste -Shapley aujourd'hui.
La valeur Shapley a été traduite en une forte valeur d'intérêt, il était équivalent à expliquer que son revenu et ses efforts étaient équivalents. Il existe un exemple de la distribution de l'actif classique:
Supposons qu'il y ait actuellement 1 million d'actifs, 1 million de personnes doivent être livrées à ABC trois personnes. Qu'est-ce qui est alloué? Il peut être entièrement alloué, ou il peut être attribué en fonction de la taille de la puissance de chaque personne. On sait que 50% des billets, B comporte 40% des billets etC a 10% des billets. Dans les deux méthodes précédentes, bien que l'attribut puisse être distribué, ce n'est pas le plus pour les points d'attribut pour quelqu'un. Par conséquent, à travers un bulletin de vote, il est déterminé comment assigner, les règles stipulent que lorsque plus de 50% des billets identifient certaines solutions, l'ensemble de la propriété peut être obtenu, sinon trois ne disparaîtront pas.
C peut proposer un tel diagramme, A: 70%, B: 0, C: 30%. Cette solution peut être A, C acceptée par A, car il s'agit d'une solution considérablement améliorée par rapport à la puissance des billets, bien que B est exclu, les billets de C (60%).
Dans ce cas, B créera un tel diagramme pour A, A: 80%, B20%, C: 0. A ce moment, A et B ont été mis en œuvre par rapport au profil que c'est cr, mais C rien, mais une, combinant des tensions B principalement (90%) ... Ce processus peut être fait.
Quel est le résultat de la distribution final? Sharp offre une mesure de droits de calcul. Il a donné une méthode de mesure de la force prioritaire cLe parti de jeu et le pouvoir prestigieux de sa théorie de la théorie s'appellent Sharp.
Les valeurs Charprions sont une valeur: En alliances peut varier, les participants contribuent à la contribution marginale de l'Alliance et divisent toutes les alliances possibles.
À propos des taux d'intérêt nets peuvent être trouvés:
https://wiki.mbalib.com/wiki/%E5%A4%8F%E6%99% AE% E5% 88% A9% E5% 80% BC
Ce qu'il faut calculer si utilisé pour illustrer l'importance spécifique si la caractéristique importante de la fonctionnalité est appliquée pour le modèle ??
Pour chaque fonctionnalité (X), l'effet de chaque élément d'échantillon Cette fonctionnalité est calculée sur l'effet des résultats prédictifs, puis l'impact de tous les échantillons est noté, c'est le résultat prévu de cette caractéristique. Le niveau d'impact global.
Comme indiqué dans l'image ci-dessous, car RM augmente, la valeur de RM a également augmenté:
Figure ci-dessous important CToutes les fonctionnalités utilisées dans le modèle de dessin, chaque ligne représente une fonctionnalité, des caractéristiques de représentation des couleurs, de plus en plus de couleurs, la valeur de cette fonctionnalité, l'arbre horizontal indique la valeur spécifique pour prédire l'effet de l'importance de l'importance:
Voici l'impact de chaque échantillon dans chaque échantillon sur le résultat de prédiction obtient l'importance de chaque caractéristique:
environ Calcul de la valeur de formulation en Python, une bibliothèque est prête à être utilisée.GitHub Link est la suivante:
https://github.com/slundberg/shap
ci-dessus est une méthode permettant de calculer une importance caractéristique basée sur le prix comme des affaires.