Skip to main content


1. Définition par défaut


Personnes naturelles Parrainant les entreprises L'un des actes suivants est défini comme étant défini Une violation du contrat:


Après l'expiration du contrat, il n'est pas mélangé et retourné.


(2 comptes ne créent pas de produit pour s'assurer qu'il est forcé de contenir l'étiquette


(3) d'autres situations personnalisées telles que les différends JSA se produisent.

2. Intégration et nettoyage des données


(1) Source de données

Les données sont principalement prises à partir des établissements de données internes de la plage de données interne de données.
] (2) Données intégrées



Premièrement, les informations par défaut du client sont combinées à la lettre du client des informations, pour les informations par défaut du client correspondant aux informations de crédit.

Étape 2, Supprimer des variables Avec une base de modèle, tels que le numéro de contrat, les fonds de talents, etc.

étapesTroisièmement, les mêmes échantillons d'échantillons ont été consolidés selon certaines règles, créant une seule fois des échantillons de modèles de modélisation (par défaut du client: la première fois par défaut, l'application finale, les clients ne sont pas par défaut: la première application pour deux entreprises).
(3) Échantillon identifié


Après avoir analysé les données intégrées décrites ci-dessus, la fenêtre de modélisation sera déterminée et le point d'observation sera applicable au financement des clients pour le temps de compagnie. Le temps de performance est l'année prochaine après la demande; Et exclure inactif.
(4) Données de nettoyage


Première étape, la valeur d'erreur est nettoyée, les données d'erreur sont généralement converties en données en raison d'une entrée ou d'une raison inhabituelle























.








































]


.

] La deuxième étape, manque d'hygiène de valeur, en analysant l'exploration, d'un côté , supprimez un indicateur de suppression grave (absence de 20%), d'autre part, pas plus de 20% d'indicateur effacé le manque de valeur, la valeur continue utilisée des variables moyennes, nominales, de commande et de variables séparées et nombre de nombres remplis; La troisième étape, la valeur inhabituelle est nettoyée, pour des variables continues, elle est considérée comme inférieure à 5% des points et plus de 95% de la population de données est une valeur inhabituelle et un nombre de 5%. et les numéros de positionnement de 95% sont utilisés. Les variables restantes déterminent la valeur d'exception en fonction de la situation de service et du remplacement correspondant. . Étant donné que la taille de la valeur d'information (iv) détermine que l'indice de la variable a le degré d'influence due aux variables, les valeurs de données de la variable nominale et peuvent être calculé, puis les variables sontOrganisez selon la valeur d'informations, sélectionnez donc une variable avec une certaine capacité à prédire la capacité. Comme une variable préliminaire. La recette calcule la valeur d'information (IV) comme suit: En général, la valeur IV est inférieure à 0,1, prédisant la valeur faible IV est de 0, 1-0,25, Prévu en général, la valeur IV est comprise entre 0,25 et 0,5, elle devrait être meilleure, la valeur IV est supérieure à 0,5 et devrait être forte. Après avoir calculé la valeur IV de chaque variable, la valeur IV est agencée et la variable de puissance prédictive est sélectionnée. Étapes analytiques, utilisez la régression variable logistique unique, en raison de la variable par défaut, la valeur par défaut est 1, ne viole pas 0, la variable de valeur une fois après traitement de traitement, veuillez analyser les résultats de la régression de chaque variable, sélectionnez la valeur P de coefficient de régression. inférieur à 25% (de manière significative) et AR supérieure ou égale à 0 (distinction). (2) Variables de typeSupprimer des niveaux élevés de pertinence Nous estimons que lorsque le facteur de corrélation entre les deux variables est supérieur à 70% est une variable de corrélation élevée, lorsque deux variables sont élevées, des variables sont retirées. Partie troisième, Variables de distribution 1. Convertissez des écouteurs auto-transformés (US) la formule de conversion de la La variable indépendante est la suivante: 2. Argument de déformation Pour les variables de type, utilisez généralement des équivalents de séquence (comme Split avec dix engrenages, une vitesse supérieure à 10 %), ou conjointement avec des conditions commerciales, rendez ensuite chaque interrupteur effrayant mentionné ci-dessus et près de WoE, le pignon ou le saut est déraisonnable pour réduire le nombre de fichiers. Pour les variables nominales et les commandes de type, si les options sont plus nombreuses, elle peut être combinée à la signification économique et à la conversion malheureuse décrite ci-dessus est effectuée, l'emplacement géographique de la WOE est un cas. 3.Selon le criblage du module , la variable après la sélection principale est suivie de la méthode ci-dessus, en fonction de la méthode décrite ci-dessus, la suppression ne peut pas créer une variable de non-réponse la signification du sens économique. Quatrième calcul, transformer et calculer le poids Détermination du changement et calcul du poids en utilisant le modèle de régression logistique. 1. Utilisation du modèle logistique Pour revenir, en raison de la variable par défaut, la valeur par défaut est 1, aucune reproduction d'environ 0, la variable indépendante est la donnée après le dépistage et que nous convertissons, Les données sont équipées de résultats de régression initiaux obtenus; 2. Modèle logistique de dépistage, éliminant les variables négligeables et incohérentes avec la signification de l'économie et ajustant la situation des entreprises, ce qui conduit au système de régression Nombre de variables . 3. La formule du poids de l'indice du poids de calcul est calculée sur la base du coefficient de régression des résultats: Poids de HIndex: 1. Configurez chaque point de distribution et déterminez le rapport principal [1) Configuration de chaque point de distribution variable Combinée à une expérience d'experts, des points de configuration pour chaque figure variable, variable et de structure, comme suit Dictionnaire: ] [2) Déterminer la principale citation La principale citation est principalement intégrée principalement aux solutions hybrides d'opinions expérimentées et d'unités d'entreprise, définissent la principale mesure standard. 2. Déterminez les notes de crédit Configurez chaque index pour marquer des points et des produits de poids.Et trouver un score complet, le contrôle synthétique est la principale citation pour obtenir des évaluations de crédit internes.

Sujets

Catégories