La conception du modèle est une augmentation d'effet sur le fait que le modèle final soit atteint. Pour assurer la conception du modèle, la personne d'approbation devrait s'inquiéter de ce que la conception du modèle est évaluée. Résumé, attention particulière.
1, le problème doit être résolu
Ce modèle est dans l'application du processus d'approbation des nouveaux clients et le personnel d'approbation et les clients sont tenus de communiquer.Importer manuellement un certain nombre de valeurs de variables principales et dans de nombreux cas, le résultat du score du modèle doit être couvert. Ce modèle est en train d'utiliser le processus de conception et de développement de modèles. Considérant comment résoudre l'authenticité de l'authentification de l'information, les employés manuels entrent fiabilité, des cas d'approbation sont couverts par des scores de modèle, comment surveiller les performances et autres problèmes.
2, définition des variables cible
Dans cette définition, "12 maiNg to "est une fenêtre de temps", le prêt a au moins 60 jours ou plus de 60 jours de retard "est le moment de l'heure d'observation. Si le modèle doit satisfaire aux exigences des agences de gestion et des plans, cela ne répond pas aux exigences de Les agences de gestion; pourquoi choisir une définition comme d'autres définitions; clarifier le malentendu peut être créé, si la définition est au niveau du client ou au niveau du compte, la définition est que la performance entre la période d'observation reste la performance du temps à la fin. de la phase d'observation.
3, la sélection des échantillons
Les oignons doivent être décrits ci-dessous pour sélectionner des échantillons de modélisation: méthode de sélection des échantillons, si l'échantillonnage aléatoire et l'échantillonnage aléatoire (avec des échantillons aléatoires) , dans lequel procédé d'échantillonnage aléatoire comprenant des modèles aléatoires simples, un échantillonnage isométrique, un échantillonnage aléatoire multicouche, un échantillonnage de certains types courants; l'échantillonnage n'est pas connu de manière aléatoire sous le nom d'échantillon dédié, y compris un échantillonnage complet, la soirée de différence d'échantillonnageun cas d'échantillonnage extrême, cas d'échantillonnage typique des types courants; Taille, afin d'améliorer l'exactitude des performances et des tests, vous devriez essayer d'accroître la capacité de l'échantillon, mais devriez également envisager une faisabilité et des coûts économiques; échantillons de modèle, échantillons maintenir et vérifier la division des échantillons; Les échantillons peuvent avoir des écarts, si les conditions doivent être limitées par approbation, des modifications des facteurs externes dans les échantillons après la perte naturelle, des changements d'éléments externes, tels que tels que des caractéristiques de produit, la stratégie des concurrents, des cycles économiques, des facteurs saisonniers, etc.
4, Méthode analytique
La description de la méthode d'analyse doit inclure: Description du canal de collecte de données, principalement divisée en canaux en direct et canal indirect: le canal direct se réfère principalement à la première Données statistiques obtenues par des enquêtes statistiques. Si les informations personnelles du client sont remplies, les informations personnelles du client sont remplies par les clients et Phuong.Grandes données existantes éveillées. Les canaux indirects font souvent référence à des informations ou à d'autres sites Web Anciennes données obtenues par la plate-forme, telles que la prise de données avec Wind ou Bloomberg; Structure du modèle, selon la relation hypothétique de l'objet d'analyse en supposant que les lois inhérentes de l'objet et l'outil mathématique approprié, construisant différentes variables ou autres équations ou structures de mathématiques autres.
Au même moment, il doit également faire attention aux détails des détails, tels que l'architecture de distribution du client, l'architecture des enfants et la technologie informatique française et populaire populaire. le processus de modèle. Telle que la régression logistique, l'arbre de décision, la régression linéaire normale, l'analyse décentralisée, l'analyse de grappes, la série de temps, V.V.
Lundi, le processus de vérification du processus
Si le modèle est valide, il doit inclure: décrivant des échantillons de maintenance aléatoires, tels que la sélectionN Enregistrement de la mise au point (généralement 2/3) est une formation, mettant le reste en tant que kit de test. Choisissez une description standard, un ratio et des caractéristiques d'échantillons conservés au hasard; Vérifiez BOOTSTRAP, une méthode statistique importante dans les non-paramètres, effectuée dans la mise en œuvre de la technologie informatique.
Par exemple, lorsque l'ensemble peut être décrit par une distribution normale, sa distribution d'échantillonnage montre une distribution normale ou conformément à la T; Cependant, lorsque l'insatisfaction commune se produit de la distribution normale ou inconnue, nous utilisons des ordinateurs de simulation. Ou utiliser des méthodes d'analyse progressives plus efficaces; Confirmation croisée, la pensée de base est un groupe de données brutes dans le sens, une partie de la formation, une autre partie en tant que jeu de vérification, premier chèque de kit de formation, puis utilisez la vérification pour vérifier les résultats d'image des tissus pour servir d'indicateur de performance de la Modèle d'évaluation.
Les méthodes externes sont favoriséesG Piercing, authentification croisée en k-pli, validation criminelle une fois; Vérifiez les modèles externes, les modèles existants sont testés et évalués en collectant une efficacité externe du modèle. Troisièmement, les limitations du modèle
Les limitations du modèle peuvent être divisées en objectifs, incapables de fixer des restrictions et Les limitations des personnes peuvent être corrigées. Décrire les principales restrictions objectives, notamment: les limitations du système; Les limitations du modèle, V.v.; limite; restrictions d'échantillons; Facteur externe affectant le modèle, tel que la pression des concurrents, la pression du temps de conformité limitée, etc.
La configuration de l'efficacité des ressources limitées est principalement configurable, dans les conditions peut être utilisée. Le travail du projet est le plus court possible par le processus de progression; Le temps de modèle est planifié, contrôlé des boutons de temps effectifs, comme la concurrence ou la conformité externe, et doivent adhérer à être achevées dans une courte période.
V. Traitement des données
Comment mettre en œuvre le traitement des données est un lien très important. Pour ce lien, vous pouvez voir l'expérience domestique et internationale et vous pouvez faire attention aux aspects suivants. 1, Analysez la description de la source de données d'origine
L'évaluation des données de modélisation des clés comprend: Canal de collecte de données, telle que les données de données internes fournies par le marché, stockant historique données, entreprises tiers, etc. Nombre d'enregistrements d'échantillons de données et représentant la signification de chaque enregistrement; Nombre de variables de données; Temps de collecte de données.
2, décrivez les variables de modèle
La description de la variable de modèle doit inclure la valeur de la description et la variable correcte déterminée pour chaque variable. Signification. Lors de la détermination et de l'utilisation de variables, des noms de variables sont généralement définis comme le nom des données lues et décrites au nom de l'évaluation.RAW, au lieu d'utiliser des abréviations difficiles telles que A ou B2. Par exemple: lors de la rédaction d'un logiciel Apple, nous avons besoin de deux variables pour stocker les prix et les ventes d'Apple. À ce stade, vous pouvez identifier deux APS nommés.ple_price et Apple_Sold Variables. Lorsque vous exécutez le programme, les utilisateurs fournissent des valeurs spécifiques sur ces deux variables, ont l'air très intuitive.
La description de cette section doit inclure: Heure d'observation des performances variables cible: temps de rouleau de fenêtre ou méthode de fenêtres à temps fixe; Modèle d'observation du temps indépendant; Les variables cibles et les données variables indépendantes ont une courte omission du temps, si certaines variables ciblées montrent un manque d'observation, le temps d'observation des variables de modèle est inférieur à celui de l'observation.
4, Manipulation de la fréquence et de la valeur Manque de données de données valides
La description de cette section doit inclure: Fréquence effective de la fréquence d'échantillon variable de données du profil hÉquipement dans les échantillons d'enregistrements; Causes des données de données ou enregistrements, que ces opérations ont l'impact ou la déviation du modèle; Examiner la manière dont les différentes erreurs de données dans la source de données dans la modélisation.
Chaque modèle de variable indépendant est manquant; Si les lacunes de variables indépendantes ont une signification spécifique; Si la fréquence des valeurs est instable; L'importance des variables à défaut dans le modèle et la stabilité de la performance; Chaque méthode de traitement variable, y compris moyenne, moyenne, maximale ou minimale, meilleure ou pire valeur, traitement de transformateur, modifications de traitement multiples et modifications réduites, modélisation ou score ou refuser de causer des algorithmes à gérer, etc.
5 , Variables maximales, traitement minimal
La description de cette section doit inclure: maximum ou minimum de chaque variable; Méthodes de traitement maximum ou minimum; Effets de la valeur de ces variables et l'effet des performances d'enregistrement de données; Paramètres maximum ou sombreLe minimum de la cible est réduit, des algorithmes modélisés ou classés ou rejetés pour des réglages maximaux ou minimaux; Si ces paramètres peuvent empêcher les erreurs d'erreur pouvant survenir.
6, convertir des variables
La description de cette section doit inclure: la conversion de variables simples, telles qu'une chaîne de remplacement, des logarithmes et une ouverture, une boîte-cox, etc. Conversion polyvalente, telle que des variables, moins, des suppléments, la multiplication, V.V. Empêcher toutes les valeurs possibles; Utilisez le poids de la méthode de la preuve (misérable) (cette méthode dans l'évaluation écologique de l'ERA) peut être utilisée pour fournir une évaluation globale des risques associée à des données multiformes pour vérifier la valeur des informations.
Les facteurs externes peuvent affecter les performances des variables cibles Il s'agit de: environnement économique national ou région; Indicateurs macroéconomiques; Caractéristiques du produit des canaux voir; Stratégie de grands concurrents; éléments météorologiques; facteur de cyclePar saison, etc.
Approbateurs Le modèle doit atteindre la méthode et la performance attendues des méthodes de modélisation et du modèle du modèle. Diagnostic des buts et de l'évaluation, c'est une étape importante. Du point de vue de la mise en œuvre spécifique, l'évaluation devrait inclure au moins neuf aspects de ce qui suit.
1. Méthodes de segmentation sous-modèle
La méthode de segmentation de modèle (modèle supplémentaire) devrait inclure les suivantes: Normes d'optimisation et destination d'élément: Par exemple: Continuité d'aucune donnée, le Continuité des performances du modèle, une corrélation variable, une prédiction variable, etc des véhicules sélectionnés, tels que l'analyse de données historiques, l'analyse de paniers, les arbres de Bayes, etc. Soutien à une augmentation des données pour la performance du modèle après le segment, en particulier l'amélioration des performances suffit. couvrir le fardeau de l'augmentation de la complexité du modèle en raison du segment.
n converti ou consolidé le modèle, y compris: variable de compensation de fréquence; Fluctuations variables; combiner la transformation; Division des variables, divisant une collection en multi-couches, y compris des objets similaires; variables, tests corrélés, tels que l'utilisation de la matrice de coefficient de corrélation, le coefficient lié à LE LEA ou à la corrélation de Spearman; Différents modèles de division (modèles de division différents) essais hétérogènes, utilisez des statistiques carrées carrées pour vérifier que différents modèles proviennent de la même manière générale; Sélectionnez des variables: telles que les transitions, la sélection inversée, la sélection étape par étape, v.v.; Changements d'authentification croisée.
3, modèle d'optimisation standard
La description de cette section identifiera clairement les normes d'optimisation des modèles standard et les candidats sont le meilleur choix. Si plusieurs indicateurs doivent être sélectionnés, les critères de sélection des indicateurs multiples doivent être décrits, par exemple: valeur de KS, une décision marginale de réalisation, V.V. Pour les modèles, il faut respecter la réglementation, laLes exigences de supervision sont intégrées à optimiser les modèles de sélection.
4, Déterminez les paramètres de modèle
La description de cette section doit être clarifiée en sélectionnant le modèle, y compris: Comment identifier le numéro de participation des modèles; Comment choisir le modèle final de certains modèles de candidats; VIF (Vark vérifie le coefficient d'inflation de l'ICIE) et détermine si le modèle a de nombreux problèmes linéaires courants.
Description Cette section doit être décrite dans la configuration du programme utilisé, notamment: Traitement toutes les procédures d'origine pour les données, du début à finir; Le programme avec l'étiquetage et la description de la structure correcte, tels que la section de traitement de données, la sélection variable, une partie de comparaison du programme; Si le programme peut être convenu correctement, le référentiel peut être consulté, le programme si elle peut être utilisée par d'autres dans cette note spécifique.
6, modélisation détailléeProgramme
La description de cette section doit être choisie pour évaluer le programme modèle, notamment: le programme si l'étiquette est suffisante, la structure du programme est très facile à comprendre; Le nom de la variable est simple et facile à comprendre; Si facile à mal comprendre ou compliqué, il y a une étiquette spéciale; Le module est référencé par le programme avec un document correspondant; Le format de programme est approprié pour utiliser l'indentation et l'espace; Si l'auteur du programme est marqué; Il conserve toujours le bon équilibre entre les programmes de développement, d'exploitation et de programme.
La description de cette section devrait évaluer la capacité du modèle à prédire les actes ciblés, notamment: la modélisation des performances des échantillons; Les performances des échantillons non modélisants: si le modèle est différent, il est nécessaire d'expliquer différentes raisons de la performance; Attendre des échantillons futurs; Comment influencer les éléments incertains peut affecter les marquesMotifs utérins dans le futur.
8. Le modèle de capital est équipé ou excessivement
Tout modèle peut avoir des problèmes dans les accessoires d'ajustement ou de correspondance, une évaluation excessive peut être étendue à un certain nombre de niveaux différents. Si le modèle est utilisé pour correspondre au modèle avec des nombres décimaux, le modèle est utilisé pour vérifier le modèle avec des données analogiques ou d'autres données historiques, que ce soit une expérience ou des données ordinaires pour déterminer le modèle MINH, etc.
9, l'analyse restante
L'analyse restante: en supposant que l'hypothèse du modèle avec la différence restante, telle que l'utilisation de diagrammes de surplus de qualité des données d'échantillon, que le modèle de test répond à l'hypothèse de base pour mettre en œuvre des modifications supplémentaires pour le modèle; Utilisez le reste des anomalies et des valeurs d'impact, si la valeur d'exception est la donnée d'erreur, si l'erreur de journal est causée, elle corrigera les données pour améliorer l'effet de modèle; Si ce n'est pas raisonnable à cause des hypothèses du modèleh, le reste est normalisé comme important et le modèle de modulation doit être pris en compte; Si cela est dû à des facteurs aléatoires, il sera considéré comme ayant une valeur d'observation efficace et dédiée. Dans le même temps, les problèmes doivent être payés: si le reste est distribué au hasard; Que les changements dans un ou plusieurs enregistrements auront un impact important sur l'ensemble du modèle; Si différentes méthodes d'échantillonnage créent différents modèles ou une distribution restante.
Le personnel d'approbation du modèle doit évaluer les trois aspects suivants avant le modèle d'approbation final.
Il existe plusieurs versions différentes, telles que des modèles d'origine, des modèles de remplacement une logique commerciale simple et modèle de sociétés de tiers. Le modèle d'approbation du modèle doit comparer la version du modèle final et d'autres versions, notamment: Si ce modèle n'utilise pas ce modèle, comment le modèle d'entreprise sera-t-il élargi? TabouretÉchantillons intégrés approuvés par le modèle original ou nouveau et évalué l'impact sur les entreprises; Quels avantages doivent être approuvés par le modèle et d'autres modèles? Comment ces avantages sont obtenus, qu'ils rencontrent une logique commerciale de base; Le modèle dans le groupe client cible de l'application? Est-ce qu'il convient à la logique commerciale? Par rapport à la version d'autres modèles, sont-ils conformes à la nouvelle version du modèle du modèle? La technologie de contrôle de la technologie conteste les modèles existants et les modèles en ligne, tels que des étapes excessives et des modèles originaux ou d'autres règles.
La stratégie de surveillance du modèle doit inclure les éléments suivants: l'indice principal, la fréquence de surveillance et de fréquence; Suivi des processus de déclaration et de stockage du personnel; Pour les indicateurs de surveillance, les indices stables et les indicateurs de précision ne sont généralement que les normes les plus basses; Les indicateurs stables doivent inclure la surveillance de la stabilité des variables et des variables cibles du modèle.c fait; Comment déterminer comment déterminer l'indicateur de modèle; Modèle d'application glow s'il y a un changement, comment puis-je déterminer le changement du groupe client de destination? Comment suivre les performances du modèle? Si l'écran est autorisé et vérifié; Comment déterminer et un message d'erreur d'alarme si les données sont entrées? Schéma de sauvegarde pour les entreprises que le modèle échoue? Le processus d'identification d'un modèle échoue et redémarre le modèle de fonctionnement? Dans tous les cas, les modèles doivent être réévalués ou reconstruire le modèle? Spécifiez la valeur importante du représentant principal des indicateurs. 3, Plans futurs La planification future du modèle doit décrire la manière dont le modèle s'est amélioré davantage, notamment: Comment obtenir un autre échantillon objectif? Les échantillons globaux objectifs doivent inclure d'autres échantillons avec des activités commerciales normales, telles que les échantillons approuvés, devraient inclure toutes les performances deLes clients, non seulement par l'approbation du client; échantillons à proximité de la valeur importante du modèle d'approbation, que l'entreprise doit augmenter le coût de la collecte d'échantillons pour les modèles futurs;Quel est le coût du coût des coûts et des échantillons de processus de collecte? Quelle est la peine de non-être? Quelle est la grande orientation des futurs plans d'entreprise? Comment collecter de manière stratégique des modèles de modèle avec les activités de développement des affaires? Existe-t-il d'autres sources de données ou une technologie de modélisation pour améliorer encore la Performance du modèle?