Premièrement, les premiers mots
Nous savons qu'il existe de nombreux paramètres pouvant être ajustés, tels que n'importe quel type de fonction de base dans les valeurs SVM et C et les profondeurs de l'arbre décisif. Dans la sélection caractéristique, le modèle de base sélectionné, nous pouvons améliorer la précision du modèle en ajustant ces paramètres du modèle. Il existe de nombreux paramètres pour chaque modèle et chaque paramètre a de nombreuses valeurs différentes. Comment devrions-nous ajuster, la méthode la plus simple consiste à essayer. Sklearn fournit une telle bibliothèque de sorte que le processus d'essai d'essayer de se déplacer manuellement, il s'agit de GridSearchCV, il combinera la valeur de différents paramètres, puis exporter un ensemble de paramètres.
Lundi, démontrant le paramètre GridSearchCV
Estimateur: Le modèle de base est utilisé, tel que SVCPARAM_GRID: Les paramètres requis, représentant des points: Précision sous forme de dictionnaire ou de liste de classification standard N_JOBS: Numéro de fonctionnementChanson (quantité), la valeur par défaut est 1, si défini sur -1, indique que tous les processeurs de l'ordinateur sont utilisés sur IID: Supposons que les données ont la même distribution dans chaque CV (pli), perte Le ventricule minimal est le total des dégâts de chaque échantillon au lieu de la perte moyenne de toute urgence. Refit: La valeur par défaut est correcte, le programme sera basé sur les paramètres optimaux obtenus avec des unités de formation à la vérification croisée et à la réécrution de tous les kits de formation et les développeurs disponibles en tant que paramètres tissulés la meilleure image pour évaluer les performances. CV: Nombre de combinaisons d'authentification croisée, la valeur par défaut est 3, lorsque l'outil estimé est une méthode de croix Stratialitedkprint lorsque l'outil de classification, d'autres problèmes utilisant KintVverbose: Logerbose: le processus de journalisation, Type Int, 0: Ne pas entraîner la sortie, 1: Sortie, & GT 1: Pre_Dispatch Sortie Pour chaque modèle enfant: Contrôlez le nombre de travaux, en évitant trop d'erreurs de mémoireGridsearchCV
CV_RESULTS_: Dictionnaire utilisé pour exporter les résultats de CV, peut être un dictionnaire peut aussi resterLa forme de numppy, et peut également être convertie en format de trame de données best_estimator_: en recherchant des paramètres, les objets ne sont pas disponibles pour best_score_: Typage du flottant lorsque le paramètre Refit = Faux, meilleur best_params_: via le score de réseau Obtenez par la partition]
Quatre, Méthode GridSearchCV
Décision (x): renvoie la valeur fonctionnelle décisive (la distance décisive dans SVM) Predict_proba (x): renvoie la valeur de probabilité (certains catalogues ont renvoyé quelques colonnes) valeurs) prédisent ( x): Retourne le point de résultat prédictif (0/1) Point (x, Y = Aucun): Fonction renvoie get_params (Deep = True): renvoie le paramètre estimé approprié (x, y = non, groupe = no, fit_params): Exécutez tous les paramètres de la transformation des données (x): Utilisez la formation en X) Température5, PrwearchCV
. CV_RESULT a quatre groupes, ce sont deux noyaux et deux groupes aléatoires de C ensemble. Le procédé actuel correspond uniquement au modèle avec une petite quantité de données et ne correspond pas à une quantité excessive de données.