Crédit Xiaoli, nous sommes définis comme une petite quantité et aucune hypothèque, entièrement basée sur Comportement de prêt de crédit. Les petits microphones peuvent faire face aux individus (2c) ou pour les petites entreprises (2B). Pour les entreprises de classe 2C, il s'agit souvent d'un petit prêt de crédit à court terme. Il s'agit d'un prêt accordé pour résoudre la suspension de la consommation temporaire de l'emprunteur dans un délai d'un an et que ce montant mesure 200 000 yuans et inférieurs, et des garanties sont nécessaires. Prêts de crédit RMB. Pour les entreprises 2B, car les besoins de crédit des petites entreprises sont des "courts, petites, régulières, d'urgence", de petites caractéristiques à court terme sont similaires aux prêts au détail, aux exigences plus élevées pour les fonds.
Petit micro-crédit avec des raisons de marché profondes. Au niveau de 2b, les petites et ultra-petites entreprises sont discriminées et encombrées par des institutions financières traditionnelles, VOh, l'argent dans le fonds conduira éventuellement à la malnutrition des petites et des micro-entreprises. Pour des raisons, principalement de petites micro-entreprises n'ont pas assez d'actifs hypothécaires. Les prêts bancaires traditionnels nécessitent souvent des entreprises de fournir une garantie complète. Les micro-entreprises développent l'étape principale, les fonds restreints doivent être utilisés sur le couteau. Seule une petite quantité peut être utilisée pour acheter des actifs immobilisés tels que l'immobilier terrestre. Par conséquent, les banques traditionnelles ont moins de produits dans de petites micro-entreprises. Cela provoque des besoins financiers pour les petites entreprises et les produits micro et bancaires. D'autre part, de nombreuses petites et micro-entreprises sont incomplètes, provoquant ainsi des informations asymétriques. Les banques ne savent pas si elles ne savent rien de suffisamment. En fait, pour les banques, liées aux grandes entreprises commerciales, de petites entreprises de crédit microscopique ont plus de coûts, ce qui ne conduit pas assez de prêts bancaires. En revanche, sur la plate-forme INTERNET, des informations asymétriques diminueront dans une certaine mesure, et les fonds de fonds sont amarrés directement sans frais de transaction et certaines plates-formes de commerce électronique ont commencé à fournir des talents qu'il s'agit pour les petites et moyennes entreprises sur leur propre plate-forme. Services de crédit.
Prêts importants de la Banque et des petits prêts de micro
En ce qui concerne 2C, des prêts de crédit personnellement pour acheter des voitures, à la maison Décor, voyages et autres consommations, mais ne peuvent souvent pas payer le prix d'achat. En général, il y a un bon crédit, une personne a été fixée à la maison et à un revenu stable et peut être appliquée aux prêts créditeurs. L'audit de crédit traditionnel a toujours les inconvénients suivants: faible efficacité, vitesse lente et mauvaise précision. Parce que ces problèmes existent, il est difficile de s'adapter à l'audit de crédit Internet. D'autre part, les cartes de crédit sont limitées à la popularité de Pooper. Par conséquent, seuls les produits basésLe secteur financier ne répond pas aux détails du montant du prêt et de gagner du temps. L'apparition du crédit en ligne correspondra à ce processus plus rapidement pour réduire les coûts de temps.
Depuis le lancement de Babble, les produits de finance Internet sont apparus comme une pluie. Internet mobile pénétrant progressivement tous les aspects du financement traditionnel et l'objectif est d'inclure davantage de personnes ayant des coûts moins élevés, plus d'échantillons, une meilleure expérience. La plate-forme de crédit réseau a été convertie en un prêt de petite taille d'une manière, de sorte que les individus et les individus aussi petits et les individus ont de nombreux canaux financiers et ce processus est plus pratique.
2. Plate-forme d'entreprise
Étant donné que de vastes prêts en microbrie ne sont pas ainsi d'acceptation et de garantie. Le seul crédit d'individus ou d'entreprises, de sorte que ses lettres et ses importance sont. Le point principal de notre préoccupation est de savoir comment utiliser la plate-forme INTERNET pour nous aider à remplir ce processus rapidement et avec précision. Ma Yun a dit dans une lettre interne au personnel d'Alibaba pour contrôler DT ERA DT (Technology Technology) active les objectifs de la productivité de l'ère informatique du point de départ. Avec le développement de la technologie informatique, les grandes activités de données deviennent plus réalistes, les entreprises basées sur de grands services de demande de données continuent de comparaître. Les grandes données dans le marketing sont devenues une publicité dans un marketing précis "me rétrécissant" et dans le contexte des finances sur Internet, l'application de données importantes dans le secteur financier augmente progressivement.
Le 5 janvier 2015, la Banque populaire chinoise a publié une notification de la mise en œuvre d'un bon travail de concouplement concolion, a annoncé les 8 premières organisations recevant un crédit personnel. Liste, 8 organisations: Tencent Junxin Co Ltd Sésame Credit Management Co Ltd Shenzhen Qianhai Information Centre Co LtdJun, Pengyuan Junxin Informations Co Ltd Zhongzheng Information Co Ltd, La Kara Credit Management Co Ltd Huase Junxin Informations Co Ltd Centre de crédit de crédit de la Banque centrale est la base de données de base La base de données et l'agence de crédit personnelle approuvée fourniront des services et des innovations supplémentaires. Par conséquent, sur le fondement du crédit, les héros profiteront de leurs propres données.
Comment utiliser de grandes données sur Internet sur la plate-forme B2C ou P2P afin de compléter le processus de contribution, que nous souhaitons continuer à renverser la tradition aujourd'hui. L'objectif de cette étude est de configurer le modèle de prévision de pointage de crédit d'un utilisateur en collectant des données comportementales de l'historique des utilisateurs. Les données de cet article sont collectées à partir d'une petite entreprise de crédit. Pour des raisons de confidentialité des données, cet article masquera certaines informations et des résultats d'analyse des données, mais n'affecte pas l'objectivité de QUQAnalyse saoudienne.
Spécifiquement, nous appelons la société à fournir des données telles qu'un petit port de prêt (anonymement pour la société), l'entreprise de Xiong Xiaoyan Company, dont 2B Business et Business 2C. La société a obtenu des scores uniformes de crédit d'utilisateur pour les services 2B et 2C grâce à une analyse intégrée des données, appelée Bear to Divide. Mais Xiong est divisé en tous les produits et tous les utilisateurs, notant de crédit pour des produits spécifiques pour prédire la précision de la prédiction par défaut de l'utilisateur. Xiong Xiaoyan espère établir le modèle de pointage de crédit d'un utilisateur pour des produits spécifiques via un support de données et un ciblage devrait prédire les violations contractuelles des utilisateurs en appuyant les données. Niveau supérieur que le niveau d'ours universel. La compréhension visuelle des services 2B et 2C de la société peut être tirée à partir de la figure 3, y compris différents produits pour différents utilisateurs. Par exemple, Chi Beer est un produit personnalisé pourUtilisateur Bear Point 400. Vous pouvez commencer la vie de crédit dans votre application client mobile. Cliquez ensuite sur "Square Bear" pour entrer la page du produit, suivez pour demander aux utilisateurs de vous inscrire et de remplir des informations personnelles.
Figure 3 Little Bear Lange Company Aperçu du produit
Dans ce cas, il correspondra aux informations de l'utilisateur collectées. Les informations comportementales de la transaction utilisateur dans la base de données et les utilisateurs de l'utilisateur de la société ont appliqué des produits «Bear Branch», configurant des modèles de pointage de crédit. Ce modèle de crédit sera mis en place à partir des objectifs commerciaux et est établi avec la plate-forme d'entreprise. Le modèle prédire le pointage de crédit de l'utilisateur comme une référence et des instructions sur la question de savoir si le niveau de l'entreprise peut être accordé des prêts aux utilisateurs ou non. Les processus de collecte de données spécifiques et de processus d'hygiène variables se concentreront sur le deuxième chapitre et le modèle établi sera introduit dans CHSoins infirmiers 3.
Deuxièmement, description des données
1, Collection de données
Un actionnaire de la société XIONG Xiaoyan a un canal de paiement tiers. Il peut donc être collecté uniquement des utilisateurs. Les informations de transaction via des cartes bancaires et des utilisateurs enregistrés peuvent être enregistrées par canal de paiement tiers et le numéro de téléphone humain utilisé peut être enregistré et les données comportementales historiques de l'utilisateur peuvent être recherchées. Cette source de données a ses propres avantages uniques, évitant directement les principaux problèmes de l'industrie traditionnelle de l'information de crédit: a. Taille plus de temps spécial pour les particuliers ou les entreprises et ne peut avoir une notation globale en trois dimensions complètes; b. Les données financières Falette sont grandes, telles que des niveaux d'autosuffisance, si les utilisateurs exagèrent le niveau d'entreprise pour obtenir l'approbation des prêts, les petites entreprises de prêt sont difficiles à confirmer; c. Manque d'autres données pour la vérification croisée, faire la fiabilité de l'évaluationréduction. Mais les données collectées par Xiong Xiaoyan sont beaucoup plus riches que les données traditionnelles. Xiong Xiaoyan a recueilli des "carrés d'ours" correspondant à près de 30 000 informations enregistrées de l'utilisateur, de l'enregistrement de l'application avec près de 4,5 millions d'informations, ainsi que d'autres informations, la durée de la communication que cette transaction est de plus d'un an. Près de 10 000 utilisateurs par défaut, près de 20 000 utilisateurs ne violent pas l'utilisateur contractuel. Il convient de noter que ce formulaire est que les échantillons de données sont extraits pour le modèle qui ne montrent pas le ratio utilisateur par défaut dans de vrais utilisateurs enregistrés et que les utilisateurs ne se contractent pas.
Spécifiquement, la structure de données utilisateur enregistrée par l'utilisateur correspond au produit «Square Bear» de la société Xiong Xiaooyan se compose principalement des quatre échantillons suivants, des conseils d'information sur les échanges, des tableaux d'utilisateur des tableaux, des tableaux d'information de la classification des entreprises , ainsi que des panneaux d'informations sur la carte bancaire, la relation entre elles est illustrée à la figure 4. Ces quatre formes sont reliées par des mots-clés.Différent, spécifiquement comme suit: a. La carte d'information de l'utilisateur peut correspondre au numéro de téléphone mobile et au coefficient de transaction de l'utilisateur, un numéro de téléphone mobile correspond à de nombreux événements de transaction; B. Classification des informations de classification peut transmettre le numéro de marchand et le coefficient de transaction correspondant, de nombreux événements de transaction peuvent être créés dans certains marchands; c. La carte d'information sur la carte bancaire peut correspondre aux premiers chiffres de la carte bancaire (appelé la norme de carte) et le numéro de carte dans la transaction réelle du tableau.
Informations variables spécifiques incluses dans les quatre formes suivantes:
Informations de l'utilisateur: numéro de téléphone mobile, canal d'enregistrement (enregistrez-vous une application mobile ou inscrivez-vous pour un site Web), carte d'identité (fournie avec crypté Données), l'heure de connexion la plus récente, le temps d'inscription, etc. Avant d'extraire des données.Catégorie de marchands: Code horaire, marchands, Merpplex Niveau 1 Code de classification, Niveau 1 Code de classification, Nom Classificateur Vendeur 2, PHAN Type 3, Marchand Land 3 Nom, Merchant 4 Code Classification, Merchant 4 Nom de classification, etc.
Table d'information de la carte bancaire (type de carte d'information): la carte est la première carte (quelques données de la carte bancaire détermine quel type de carte bancaire), la longueur (telle que les 6 chiffres des plus 6 chiffres) détermine le type de type de carte, la première longueur est 6), le type de compte, le compte de type nom (comme une carte d'enregistrement ou une carte de crédit), le code de carte, le code bancaire, Nom de banque, etc.La liste réelle des transactions: Désoction (chaque foire a été développée des flux), numéros de téléphone mobile échangés, temps de négociation, nombre de vendeurs, factures, montants de paiement (numéro de paiement par des factures totales), des quantités de facture, des frais de manutention, etc.
En bref, quatre tables peuvent être assorties avec différents mots-clés, afin de négocier plusieurs lignes d'un utilisateur peuvent correspondre à la section suivante, nous traiterons l'extrait de variable de données décrit dans détail.
Figure 4 Structure des données de l'utilisateur Segment Bear
2. Collection de nettoyage des données
Tout d'abord, les quatre formes sont consolidées en fonction du mot clé. Chaque observation est basée sur un comportement de transaction utilisateur, y compris des informations utilisateur, des informations sur la carte bancaire, des informations de classification du vendeur, V.V avec un nombre total d'observations de près de 4,5 millions. La manipulation directe n'est pas une bonne solution, trop grande, et ce n'est pas simple. Notre objectif est de résumer toutes les informations pour chaque utilisateur, d'identifier les variables dérivées de l'utilisateur. Par conséquent, nous divisons les variables dans deux directions pour décrire les caractéristiques de l'utilisateur, à savoir la variable d'informations de base de l'utilisateur et la variable d'informations de classification de l'utilisateur. Ensuite, nous allons créer une définition détaillée.
Variables d'informations de base des utilisateurs
Activation des informations de base utilisateur créées ici, y compris des variables et des variables dérivées peuvent être collectées à partir de données, comme indiqué sur le sous-dernier.I:
[1) Les points d'ours de l'ours: En raison de l'amélioration initiale du point d'ours intégré intégré, nous allons combiner des "ours" comme une variable explicative "Bear", "Bear" est une entreprise d'entreprise Xiong Xiaoyan. Selon le système d'indice d'identification de l'entreprise réel, nous pensons qu'il a beaucoup d'expérience professionnelle et de connaissances de la plate-forme, il est donc probablement susceptible de prédire fortement. Le point inférieur est plus bas, plus peut-être par défaut.
(2, 3) Utilisateur, Utilisateurs: Vous pouvez extraire le sexe, l'information de l'âge de l'utilisateur et nous communiquons avec Xiong Xiaoyan Company. Les petits petits ours ne fournissent pas directement des numéros d'identification utilisateur. Les informations de carte d'identité sont cryptées.
(4) Enregistrement de l'âge de l'utilisateur:
(5) TRANSACTION PEN: Les utilisateurs ont commencé le nombre de transactions enregistrées depuis l'enregistrement de transaction d'abord.
(6) Tous les actes: la quantité moyenne de toutes les transactions enregistrées par l'utilisateur.
[7) TousComportement maximum: les utilisateurs ont le montant maximal de toutes les transactions depuis le premier trading. Cet index peut mesurer le comportement extrême utilisateur. Dans une perspective intuitive, plus possible les utilisateurs d'un comportement extrême.
( (8) Rapport d'emprunt: Comportement de l'utilisateur, Nombre de transactions avec cartes de crédit (ou cartes de crédit), Occuper à toutes les cartes de crédit ou de cartes de carte de crédit) Le taux du nombre de transactions. Cet indicateur mesure l'habitude de la transaction de l'utilisateur, par exemple, certaines habitudes de certaines personnes utilisant des cartes d'épargne directes pour la consommation et des habitudes de certaines personnes par mois à l'aide de cartes de crédit. Consommation, temps de retour, afin que vous puissiez consommer et affecter le plan financier de chaque mois. Les groupes d'utilisateurs de ces deux habitudes de cette consommation sont différents.
(9) Nombre de cartes bancaires: Il n'y a pas beaucoup de cartes bancaires nécessaires pour chacun de nous, et il y a trop d'utilisateurs en CMarchandises inversées pour des groupes d'utilisateurs normaux. Par exemple, si vous avez besoin de beaucoup de consommation de carte de crédit, cela peut ne pas être plus violé.
Avec les informations ci-dessus, nous identifions les variables d'informations de base sur 9 utilisateurs ci-dessus.
Variables d'information Les utilisateurs classés et les modèles RFM
Dans des problèmes convaincus, nous sommes souvent confrontés à une optique typique, à l'école, comme utilisateur comment ai-je un ensemble de systèmes de systèmes indicateurs Pour les individus qui correspondent à un ensemble de systèmes indicateurs mis en place? Dans ce cas, chaque utilisateur correspond à des dizaines de petites à des dizaines, de grande à mille et de la négociation réelle correspondant au modèle d'information de classification des marchands, nous pouvons le renvoyer aux différentes transactions différentes, telles que le shopping dans les supermarchés. Pour acheter des jeux de cartes, des frais de rémunération de l'eau et de gaz électrique, V.V. Pour chaque type de comportement, il est nécessaire de calculer les mêmes variablesG avec chaque individu selon le moyen standard de mesurer les caractéristiques d'une personne correspondant à une variété de comportements. À cette fin, nous introduisons le modèle RFM utilisé dans le marketing (voir Recherche par Arthur Hughes, Institut de recherche sur le marketing de base de données américain).
Figure 5 Diagramme de modèle RFM
Dans le champ Marketing, le modèle RFM est utilisé pour mesurer la valeur du client et les outils importants et les moyens du client. bénéfices. Ce modèle décrit la valeur globale des clients via un comportement d'achat client récent, une fréquence d'achat globale et de la quantité d'argent a passé trois indicateurs, comme suit:
R (Tabeau de ligue), une consommation récente, uniquement à temps pour acheter maintenant la distance. En théorie, la proximité de la dernière fois de consommation doit être des utilisateurs relativement positifs. Par conséquent, ces utilisateurs peuvent également avoir une réponse à la fourniture de biens ou de services instantanés. Et nous voyons souvent que pour les gensRecevoir les spécialistes du marketing de 31 à 36 mois pour que les utilisateurs reçoivent des spécialistes du marketing de 0 à 6 mois d'utilisateurs.F (fréquence), consommation de fréquence, ce qui signifie que le nombre d'achats au cours de la période d'achat est créé pendant une durée limitée. Les utilisateurs sont le plus souvent produits, l'utilisateur client le plus élevé.
M (monnaie), moyenne de tous les montants de consommation d'utilisateurs. Grâce à cette cible, selon la loi "Pareto", signifie que le chiffre d'affaires de 80% de la société provient de 20% des clients.Dans ce cas, nous redéfinirons ces trois indices et utiliserons ces trois indicateurs pour résumer les caractéristiques de l'utilisateur créant un type de comportement, comme indiqué dans le tableau 1. Depuis ces trois indices. Impossible de mesurer la volatilité de l'utilisateur pour créer un comportement, nous ajoutons un S (écart type) pour mesurer la volatilité du comportement de l'utilisateur. Par exemple: acheter le comportement de la classe de cartes de jeu, nous pouvons déterminer R pour acheter l'intervalle de l'achat de carte de jeu le plus récent de l'utilisateur et F.Putain est le nombre d'utilisateurs qui achètent la carte de jeu dans un an (compte tenu du temps d'inscription de l'utilisateur différent. Le nombre de fréquences utilisées ici doit être normalisé par l'âge de l'utilisateur, ce qui signifie nombre total d'utilisateurs. La définition des utilisateurs d'âge sera détaillée Ci-dessous), M est défini comme la quantité moyenne d'utilisateurs qui ont acheté la carte de jeu dans un an, s définit la norme d'écart du montant de la carte de jeu pour l'achat de chaque utilisateur. Nous enregistrons toutes les variables telles que les noms de catalogue pour ajouter des indicateurs, tels que R.
Les indicateurs indiquant que l'utilisateur de l'âge de l'âge d'un an, crée un certain comportement d'un certain comportement au cours d'une cinquième année d'ici un an. Le nombre moyen d'actes dans un certain comportement réel est produit dans un délai d'un an, l'écart type de ce type de comportement a une différence standard
Classification comportementale de l'utilisateur de la carte d'information de la carte bancaire et de la carte de classification des marchands, selon la scène de l'entreprise, nous avons extrait les catégories suivantes, chaque catégorie correspondant aux éléments que nous avons identifié quatre indicateurs de la RFM. La liste comprend:
) (1) Classe de prêt: Décrivez le comportement de transaction de l'utilisateur à l'aide d'une carte d'épargne. Différentes habitudes utilisateur, la tendance à appliquer des cartes d'épargne et des cartes de crédit peuvent également être différentes.
(2) Classe de consommation: Portrait du comportement de la consommation quotidienne des utilisateurs. Le nombre de comportements de consommation quotidiens est différent et la capacité de rembourser les utilisateurs peut varier.
(3) Catégorie de crédit: Portrait Petit comportement de prêt avant les utilisateurs. Avant que les utilisateurs disposent d'autres prêts de consommation pouvant être utilisés pour consommer des prêts, il peut avoir un meilleur statut de crédit.
(4) Couche de transfert: Décrivez le comportement de transfert de l'utilisateur. Les utilisateurs surmonter souvent qUA Les petites applications de prêt des ours peuvent différer de ceux qui ne transfèrent pas.
(5) Calcul de la classe: Comportement de transaction de recharge de portrait. Si les frais d'appel de charge et le montant de la recharge peuvent signifier que le groupe d'utilisateurs est différent.
(6) Classe publique: Le comportement de la transaction décrit en tant qu'utilisateurs, électricité, coûts de gaz. Combien de paiements publics peuvent également indiquer que la population de l'utilisateur est différente.
(7) Classe de jeu: Décrivez le comportement de l'utilisateur à acheter la carte de jeu. Les groupes d'utilisateurs jouent souvent à des jeux peuvent être différents de ceux qui ne jouent pas à des jeux.
(8, 9) Quatre grandes cartes bancaires et cartes bancaires de taille moyenne: Quatre grandes banques comprennent les banques chinoises, les banques agricoles chinoises, la banque industrielle et commerciale chinoise, les biens de construction chinoise de Ngan, les grandes banques extensibles comprennent
Banque de marchands chinois, Banque de développement de Shanghai Pudong, Banque industrielle, Ping une banque, etc. CL'installation Evil de cet indicateur a deux raisons pour les raisons suivantes: a. Cartes de salaire de différentes entreprises, les petites entreprises commerciales utilisent souvent des cartes bancaires de banques de taille moyenne; B. La carte de crédit pour quatre lignes principales est plus conservatrice, afin que je puisse postuler à quatre cartes de crédit majeures. Les gens peuvent différer des groupes d'utilisateurs utilisant d'autres cartes de crédit bancaire.
(10) Carte de platine et jaune: Vous pouvez correspondre à la carte bancaire. Quel type de carte bancaire, tels que la banque de marchands de Chine Banque Bank Bank. Nous recherchons la carte Gold et le nom de la carte Platinum de la banque correspondant et correspondant à chaque utilisateur. Nous croyons initialement que les utilisateurs avec des cartes Platinum et des cartes jaunes sont capables de payer des dettes plus élevées. Le groupe d'utilisateurs est donc différent.
En résumé, nous avons extrait 10 types et 4 indices de chaque catégorie, un total de 40 variables d'informations classées pour des descriptions complètes toutes les transactions d'un utilisateur.
Résumé de lEt résumer des données
pour la qualité des données, nous avons supprimé «l'enregistrement de l'âge de l'utilisateur» moins de 10 jours, la raison de l'observation de l'utilisateur avec moins de comportements, pas suffisamment pour afficher une caractéristique d'utilisateur stable. En outre, après la description des données, le modèle est défini, nous effectuons toutes les données de manière continue pour vous connecter et standardiser. Étant donné que tous les échantillons proviennent du comportement de transaction, il n'est pas nécessaire de supprimer des variables de données tant que l'utilisateur dispose du comportement de transaction et de la variable d'informations classifiées n'est pas manquante.
Enfin, nos données sont constituées de 28 8816 utilisateurs, dont 9,115 utilisateurs par défaut, les utilisateurs de 19701 ne sont pas par défaut. Combinée à 9 variables d'informations de base des utilisateurs, nos données sont composées de 49 variables de traduction, qui comprend également la compréhension et la pensée des entreprises. Ceci est plus complet et complet d'explorer de manière préliminaire et d'essayer de décrire tous les comportements utilisateur.
Troisièmement, la modélisation des donnéesU
Dans la section de modélisation, nous analyserons d'abord la description de base de certaines variables pour illustrer les caractéristiques des variables, puis créer une logique de régression de la logique construite pour des effets prédictifs.
1. Description Analyse
Pour des considérations de confidentialité des données, nous ne cumulons que 6 variables dans lesquelles 6 variables sont analysées. La carte de la ligne de la boîte fournit des informations importantes sur l'emplacement et la dispersion des données, en particulier lors de la comparaison de différentes données globales. Ici, nous analysons les données en comparant la carte de la caisse. Nous utilisons 0 pour exprimer l'utilisateur par défaut, 1 signifie de ne pas violer les contrats d'utilisateurs.
(1) L'oue est divisé par la valeur par défaut, que ce soit ou non. Comme on peut le voir dans la case de la boîte, il existe une différence significative dans le diagramme de la boîte de l'utilisateur sans casser l'utilisateur contractuel, indiquant que le score de vitesse a une meilleure distinction pour violer les utilisateurs du contrat et des non-contrasts.
(2) Nombre de GHJe négocie est par défaut. Comme on peut le voir dans la boîte de la boîte, les utilisateurs ne violent pas plus que la production de contrats et de numéros de trading plus élevés.
(3) Tous les comportements de tous les comportements sont par défaut. Comme on peut le voir à partir de la carte de la boîte, les utilisateurs ne violent pas la violation de l'utilisateur contractuel, toutes les valeurs moyennes sont élevées.
(43] (4) Carte de débit F et si elle a de la même manière: par la carte de la ligne peut être dessinée, la carte de débit de l'utilisateur n'est pas par défaut Violation des utilisateurs contractuels. Indique que la carte de débit utilisateur n'est plus défectueuse.
[53] Quatre séries MAIRE M et s'il s'agit d'une violation du contrat: Selon la carte de la case, les quatre cartes principales des utilisateurs ne violent pas les contrats élevés de l'utilisateur, moyen d'utilisation des utilisateurs Plusieurs cartes bancaires avec quatre rangées.
[12) R Crédit R et même des violations: de l'image, on peut en conclure que l'utilisateur ne fait pas défaut de créer des comportements de prêt à traversg utilisé pour créer des comportements de prêt, relativement proches de l'utilisateur par défaut.
Selon la description ci-dessus, nous avons pu observer que l'utilisateur par défaut dans le point extrait du point extrait et le non-contraste L'utilisateur expliquera plus sur les paramètres des caractéristiques de la variable. L'effet de prédiction est augmenté.
Diagramme de boîtier de tournage typique
2, Paramètres de modèle et résultats estimés
modèles modélisés dans ce cas. Les raisons sont conformes aux résultats de la régression logique, nous pouvons voir comment chaque variable envisage du fait que la variable par défaut, elle profite à l'explication du coefficient. Toutefois, en raison de variables excessives, nous sommes très difficiles à interpréter les coefficients attendus de toutes les variables, de plus, nous utilisons la méthode de BIC pour sélectionner le modèle. Par rapport à l'AIC, le nombre de variables sélectionnées par le modèle BIC sélectionné est faible et il est plus favorable avec le modèle estimé du modèle.
Tiny convanceNH du modèle de sélection IC est affiché dans le tableau 2. Factons de nombreux facteurs, nous enregistrons l'erreur de mesure estimée et la valeur spécifique de la valeur p, seul "*" est étiqueté la taille de la valeur P. Notez que lorsque le coefficient de régression est trop. Beaucoup, nous sommes difficiles à discuter des résultats des coefficients. Pour cette raison, nous classons des variables basées sur le risque positif et négatif du coefficient estimé, puis organiser en fonction de la taille de la valeur absolue. Figure 7 et Figure 8. En raison de l'analyse principale des effets prédites des variables autres que des "ours", nous ne dessinons que les coefficients de variables autres que "ours".
Nous n'expliquons pas la taille de chaque facteur et sa signification. Il convient de noter que nous pouvons résumer les caractéristiques des utilisateurs déraisonnables de la figure 7, ce qui peut résumer les caractéristiques de l'utilisateur contractuel à partir de la figure 8. Peut résumer des conteneurs visuellement plus et ne connaître pas l'utilisateur par défaut. Nous concluons des transactions en ligne, y compris, mais sècheLimite NG,
Si la commande variable est inchangée, plus le rapport entre les taux empruntés est basse, plus la capacité par défaut. Aller au quota sur la carte de crédit de la banque. Pour les clients qui utilisent souvent des cartes de crédit et à temps, les clients sont plus susceptibles d'être considérés comme bien considérés par les banques, afin que les utilisateurs puissent améliorer les lignes de crédit et s'ils n'utilisent pas régulièrement les cartes de crédit, elles ne peuvent pas être jugées. Par conséquent, le taux de prêt plus élevé, plus les utilisateurs utilisent des cartes de crédit et des utilisateurs font une bonne signification. D'autre part, les cartes de crédit destinées aux utilisateurs doivent être évaluées via un crédit bancaire. Les utilisateurs disposant de cartes de crédit modifieront les cartes par rapport aux cartes sans cartes de crédit.
La valeur estimée de la valeur variable Valeur PV Valeur estimée Dura Bear Point 26.301 *** Transfert R-0336 *** emprunté 1.752 *** - 0.254 ** * myg myg f0.438 ** * UTILISATEURS PUBLIC R-0230 Tous les comportements signifient 0.412 *** Quatre F-0.175 *** Nombre de transactions 0.136 *** Quatre R-0. 0.168 *** Carte de débit M0.083 *** Moyenne F-0.122 *** Moyenne M0.016 *** Moyenne R-0.119 ** Quatre matériaux M0.014 * Construction F-0.096 ** Crédit R-0. 0.922 *** Carte jaune F-0.083 *** Numéro de carte bancaire -0.674 ** * Transfert M-0.082 *** Crédit F-0.633 *** Public Pay M-0.062 ** Tous les comportements maximaux -0.474 *** M-0.059 * Transfert F-0. 0,386 ** * Crédit S-0.035 *** Public F-0.370 *
Remarque: *** Indique P & LT; 0,01, ** représente 0,01 p & lt; 0,05, * représentatif 00.05 p & lt; 0.1.
La probabilité est entrée dans la carte de débit par défaut de l'utilisateur. Cela indique que d'autres variables constants, plus la fréquence d'épargne de l'utilisateur est élevée, plus l'utilisateur peut être plus probable.
Si l'autre variable reste inchangée, la valeur moyenne de chaque comportement de transaction est grande, plus la valeur moyenne est grande, plus l'utilisateur par défaut est grand.
Contrôler d'autres constantes, le plus petit crédit R, plus les utilisateurs sont par défaut. CeDans le cas de la carte de la boîte observée précédemment, plus il est susceptible de produire des actes de consommation de prêts, plus il est susceptible de violer l'utilisateur contractuel. Notez si le comportement est créé par le comportement d'emprunt reporté pour le même comportement de prêt.Autres variables constantes, plus de cartes bancaires, plus il est probable, c'est l'utilisateur par défaut.
Gardez d'autres variables inchangées, la valeur maximale du comportement de l'utilisateur est plus grande, plus les utilisateurs par défaut sont capables. Cela vérifie également que notre conclusion précédente, le comportement extrême des utilisateurs, plus il est probablement l'utilisateur par défaut.Figure 7 Les résultats du modèle BIC sont un facteur positif
Figure 8 Sélection de BIC Le résultat est le facteur négatif
Prédire le modèle
Nous comparerons l'effet prédit des trois modèles suivants, en raison de la même variable médicale, que l'utilisateur par défaut par défaut (1, kLa hanche par défaut, 0, une violation de l'utilisateur contractuel): a. Seul le modèle de régression logique n'est défini que selon "Bear"; b. L'utilisation de toutes les 49 variables, y compris le modèle de régression logique est définie par les variables d'informations de base de l'utilisateur et les informations de classification des utilisateurs variables; c. Dans le modèle B, le modèle est défini par le modèle BIC sélectionné en fonction du modèle BIC.
L'effet de prédiction des données peut être utilisé pour indiquer la courbe ROC (les caractéristiques de fonctionnement du récepteur) ou la zone située sous la valeur de la courbe. La courbe Abscissa ROC est un taux faux positif (FPR), également connu sous le nom de spécificité, et prédit le modèle est faux, il est considéré comme 1 mais est vraiment 0 comptes d'observation pour tout important vraiment étroit. L'ensemble intégré est un taux positif réel (TPR), également appelé sensibilité, taux 1 et une observation déterminée en fonction de la prédiction du modèle, déterminée par la prédiction du modèle. La courbe ROC rapproche le coin supérieur gauche, montrant l'effet de prédiction du modèle est préférable. AUC est la zone sous la routeROC incurvé, plus la valeur de cet indicateur est grande, indiquant que l'effet de prédire le modèle est préférable. Il est généralement considéré comme suit:
La valeur réelle de la valeur réelle est de 0, indiquant la valeur réelle de 1, pour voir la La valeur réelle est 0. Le nombre d'observations indique que le nombre d'observations de valeur réelle est 1. Cet indice peut être compris que la non-violation des contrats de non-violation n'est pas inférieure au taux de la capacité de non par défaut.
Pour contraster le modèle, nous diviserons toutes les données de toutes les données dans des ensembles de données (80%) et des ensembles de données de test (20%) et estimer le facteur de retour du modèle sur le kit de formation. Tous les coefficients sont calculés dans les données de test, prédisent les capacités par défaut. La séparation aléatoire a été répétée 100 fois. Nous extrayons au hasard des courbes ROC une fois, comme le montre la figure 9. Parmi eux, le rapport représente les résultats prédits du modèle et uniquement des "points d'ours", représentant du modèle completPour les prévisions correspondant au modèle BIC et au BIC représentent les prédictions correspondant au modèle C. de l'image, on peut conclure que l'effet prédit du modèle B et du modèle C est approché, les deux sont beaucoup mieux que l'effet de prédiction du modèle . De plus, nous allons prendre la valeur moyenne de l'ACC de 100 calculs divisés au hasard. Pour les données industrielles secrètes, nous ne signalons pas les résultats d'amélioration absolue de l'ACA ici. Cependant, pour le modèle A, l'effet prédictif des modèles de modèle B et C augmentera relativement de 13,6%. Cela nous permettra directement de déterminer le statut de crédit de l'utilisateur plus précisément dans l'entreprise.
Figure 9 Le modèle de régression a comparé la courbe ROC
Déploiement des affaires
Petits prêts que l'entreprise est préoccupé par le fait que les avantages sont reflétés dans le rapport de revenu et de coût reflété dans la mauvaise créance. Cela signifie, il n'y a pas de revenu et de coût de Thi TLa rue actuelle. Par conséquent, il y aura des sociétés P2P comme la pluie et de diviser une partie de ce bénéfice. La petite entreprise de prêt actuelle peut filtrer les utilisateurs via un indice strict, garantissant ainsi que le taux de défaut est maintenu à un niveau inférieur, ce qui signifie que la société actuelle de prêt réseau peut ne pas avoir besoin de moyens techniques beaucoup plus complexes. Revenu élevé. Mais avec la saturation du marché, de plus en plus de sociétés participant à la compétition, dans un proche avenir, nous pouvons voir le taux de taux de défaut et le taux de retour. À cette époque, la guerre n'était plus le courage d'entrer sur le seuil de marché, mais ceux qui pourraient en réalité choisir des utilisateurs avec des utilisateurs réels, stabilisent les mauvais comptes.
Au niveau des entreprises, nous devons d'abord vérifier les résultats du modèle ci-dessus grâce à plus de données. Selon. Grâce aux différentes données fournies par Xiong Small Lange, nous avons vérifié ce résultat. Résultats prévus du modèle de base LICe qui précède peut être fait directement:
Utilisation de la proportion de non-contractants pour aider à déterminer si le prêt de l'utilisateur doit être approuvé ou non, les utilisateurs sélectionnés. Par exemple, le même utilisateur s'applique aux prêts prévus par l'utilisateur et au rapport proportionnel de 0,85 et le taux de non-conformité de l'utilisateur B est de 0,27. Ensuite, dans des conditions de budget de financement limitées, si vous ne pouvez approuver que les utilisateurs de prêt, vous choisirez des utilisateurs que les utilisateurs ont une probabilité plus élevée d'être plus élevés. C'est-à-dire que la prédiction du modèle peut nous aider à afficher l'utilisateur cible qui a acquis des prêts. Des prédictions précises seront en mesure de réduire nos coûts de prêt.
Améliorer les points d'ours dans l'application dans l'application avec une probabilité prévisible. Par exemple, la probabilité de prédire p est convertie en un score d'utilisateur q, q = 400 + 400 × p avec interrupteur linéaire. Par conséquent, vous pouvez mettre à jour les points d'ours sur la plate-forme, rendre les scores d'ours plus précisément.De plus, le modèle dans ce cas confirme l'importance des données du journal des transactions utilisateur pour le modèle de crédit et a également une signification instructive importante pour le développement des sources de données de développement. 5. Discussion sommaire Cet article traite du modèle d'évaluation du crédit dans le contexte du contrôle Internet. Il a prouvé des données comportementales historiques pour les utilisateurs par des cas spécifiques. La cote de crédit est importante. C'est la chose la plus importante que la plate-forme commerciale ait un rôle qui ne peut être remplacé dans les instructions de l'établissement et toutes les variables doivent être construites sur une compréhension approfondie des connaissances de la plate-forme professionnelle. En outre, cette étude de cas présente les instructions d'amélioration éventuelles suivantes: Dans les données, nous ne considérons que la situation par défaut de 01 variable, qui correspond à la valeur par défaut et non par défaut. Parmi eux, si le numéro de date par défaut est supérieur ou égal à 7 jours, il est défini comme portDinh, sinon ce n'est pas par défaut. Si vous pouvez enregistrer les journées réelles par défaut des utilisateurs en tant que variable continue, cela peut aider davantage à prévoir le modèle. Les données sont collectées dans ce cas uniquement via toutes les données de transaction d'une plate-forme de paiement tierce partie spécifique et que l'état de la transaction de la carte bancaire de l'utilisateur ne peut pas être affiché. Si toutes les données utilisateur peuvent être collectées, le comportement de transaction de l'utilisateur sera effectué pour un portrait complet et objectif. Dans cette étude de cas, les données de différentes plates-formes peuvent avoir des avantages différents pour l'évaluation du crédit. De 8 organisations de la Banque centrale, les sources de données des différentes organisations ont des caractéristiques différentes, afin de créer des données de différentes sources de données afin d'établir un modèle d'évaluation de crédit complet en termes de discussion. Par exemple, les utilisateurs peuvent différer du pointage de crédit de la plate-forme Jingdong et TAOB PlatformAO, est liée aux options de la plate-forme utilisateur. Toutefois, si vous pouvez évaluer un utilisateur complet en fonction des résultats de différentes plates-formes, il y aura des résultats plus précis.