La vente au détail est l'une des applications commerciales importantes de la science des données et des mines de données. Les zones de vente au détail ont d'innombrables données et un grand nombre de problèmes d'optimisation tels que les prix d'optimisation, les réductions, les recommandations et les niveaux d'inventaire, etc peuvent être optimisés en analysant les données.
Tous les canaux de vente au détail, ce qui signifie dans tous les canaux de marketing en ligne et hors ligne, la gestion des relations clients et l'augmentation de la gestion des stocks ont créé de nombreuses données connexes, contribue à améliorer considérablement l'importance et la capacité des données - décider de l'orientation.
Bien qu'il existe de nombreux ouvrages d'extraction de données dans le système client de marketing et de gestion, tels que [BE11, AS14, PR13, etc, mais la plupart des livres sont comme des scientifiques de données manuelles, des algorithmes concentrés et une méthodologie, et en supposant que les personnes ont décidé Le centre des résultats des analyses pour la mise en œuvre des entreprisesp.Dans cet article, nous avons essayé d'utiliser une approche plus stricte et une vision systématique pour explorer comment les modèles économiques sont basés sur des fonctions de données et cibles. Prendre des décisions automatiquement. Dans cet article, nous décrirons une plate-forme de gestion de revenu fantastique, basée sur les données du détaillant et contrôler de nombreux aspects des stratégies de vente au détail, telles que les prix, le marketing et les entrepôts.
Nous nous concentrons sur deux raisons principales après avoir combiné des cadres économiques et des méthodes d'exploration de données:
Nous pouvons trouver des centaines de manuels économiques concernant le modèle économique de détail, en raison du marché, des réductions, de la concurrence, etc Recherche approfondie au cours du siècle dernier. Cependant, de nombreux modèles de paramètres très paramètres (c'est-à-dire strictement déterminés par des formules avec des paramètres limites) et ne peuvent pas être des problèmes modèles modérés dans le monde réel. Mais l'exploitation minière fournit beaucoup de technologieModélisation de non-paramètres pour aider à créer des modèles flexibles et pratiques. Au cours de la dernière décennie, il existe également de nombreux modèles réussi et articles et articles abstraits et cas de recherche de technologies technologiques publiés.
Le cycle de données rapide facilite la mise en œuvre de prévisions précises dans les industries de la vente au détail modernes, car une augmentation à petite échelle est souvent plus facile que de grandes décisions. Par exemple, comme la valeur perçue d'un nouveau produit subversion n'est pas connue dans le cœur des consommateurs, il est difficile de calculer ses meilleurs prix. Cependant, il est relativement facile d'ajuster les prix promotionnels en temps réel en fonction des exigences et des niveaux d'inventaire. Certaines solutions commerciales réussies ont éliminé les modèles économiques presque supprimés dans l'optimisation des prix et n'ont décidé que d'augmenter et de diminuer en fonction de la rétroaction des boucles fermées [JL11].Les deux points ci-dessus signifiaient qu'il existait un potentiel élevé d'automatisation dynamique de vente au détail et de prise de décision d'optimisation, carNous nous concentrons donc sur l'étude de cette zone. Cet article est utilisé pour examiner les résultats des détaillants et des chercheurs, produits dans la construction de modèles économiques abstraits et de méthodes d'exploration de données pour développer des décisions réelles et un système optimisé. En particulier, cet article est principalement inspiré de trois études typiques, d'Albert Heijn [Kok07], le plus grand supermarché des Pays-Bas, Zara [CA12], un juge du détaillant de vêtements nationaux et de Ruela [JH14], une innovation en ligne en ligne détaillant à la maison. Nous combinons également d'Amazon, Netflix, LinkedIn et de nombreux chercheurs et projets d'entreprise indépendants. Dans le même temps, nous évitons l'utilisation de résultats d'apprentissage de soutien réels.
Nos recherches portent principalement sur des questions d'optimisation liées à la gestion du revenu, y compris le marketing et les prix. Plus d'applications d'exploration de données spéciales, telles que l'optimisation de la chaîne d'approvisionnement et la détection de la fraude, des processus détaillésL'exploitation minière (telle que la vérification de la qualité du modèle) n'est pas dans cette plage.
Le reste de cet article est le suivant:
Nous introduisons d'abord un cadre simple pour associer le comportement, les profits et les données des détaillants. Ce cadre décrira le problème de l'analyse de manière plus uniforme.
La section thématique de cet article explore une variété de problèmes d'optimisation liés au secteur de la vente au détail. Nous allons présenter chacune de ces questions sur différents chapitres. Chaque chapitre décrivait brièvement les problèmes et fournira un ensemble de cas d'entreprise et d'application et comment briser le problème dans les tâches de modèle économique et d'exploitation des données, de sorte que les questions commerciales peuvent être résolues avec des méthodes d'optimisation numérique.Après cela, nous aurons un chapitre pour discuter de ces méthodes dans des applications pratiques dans des applications réelles.
Enfin, le résumé traite des dépendances entre ces questions afin de clarifier les principes généraux et les points clés. [douzième3] Le cadre est optimisé:Cet article décrit 6 problèmes d'optimisation liés au marketing et à la valorisation, qui peuvent appliquer des techniques d'exploration de données à résoudre. Bien que ces problèmes soient très différents, nous nous efforçons d'établir un cadre commun pour aider à concevoir les tâches et optimisations de données souhaitées.
L'idée de base du cadre est d'utiliser un indicateur économique, tel que le bénéfice brut comme objectif d'optimisation et utiliser cet objectif en fonction de la vente de comportements de vente au détail (tels que des activités de marketing ou de classification).
La comptabilisation économique en même temps est également une fonction de données, ce qui signifie que la mesure du modèle économique doit être paramétré en fonction des paramètres des caractéristiques du détaillant, créant ainsi une valeur dans sa production, telle que la marge bénéficiaire brute .
Exemple: un détaillant planifie une activité de marketing par mail. L'espace d'action réalisable peut être défini comme un ensemble de marge bénéficiairesP pour chaque client et la marge de profit brut de l'opération est déterminée dans des actions marketing (certaines personnes accepteront des incitations et d'autres non) et fourniront aux clients attendus. Coûts de revenus et de messagerie. Cette méthode peut être affichée plus formellement par la formule suivante:
Dans cette formule, les données peuvent être utilisées pour analyse, le comportement et l'espace de décision des détaillants sont une fonction de modèle économique de mesure. Les paramètres sont d et a, et A0 est la politique optimale. Ce cadre est fabriqué par la littérature [JK98].
La conception du modèle G est très dépendante de l'incident lui-même. Dans la plupart des cas, la modélisation et l'optimisation de la marge bénéficiaire brute sont raisonnables. Cependant, dans certains cas, d'autres objectifs sont également possibles, car le prochain chapitre explore la modélisation de la modélisation. Dans le même temps, il convient de noter que les problèmes d'optimisation (1) ont une relation avec le temps, car l'environnement aura un impact sur des facteurs tels que de nouveaux produits,L'action des concurrents et le comportement des détaillants auront également un impact.
Exploiter le rôle des rôles dans ce problème d'optimisation est très important car le modèle de dosage G est souvent plus compliqué et doit être déterminé par des techniques d'exploration de données pour des données en fonction de la régression des données.
Dans certains cas, car la complexité est trop élevée (comme le comportement de l'utilisateur est difficile à prévisible avec précision) ou parce qu'il ne peut pas effectuer les données existantes, le modèle ne peut pas être suffisamment déterminé. À ce stade, des données supplémentaires peuvent être obtenues pour améliorer l'exactitude du modèle avec des questions et des examens A / B.
Question 1: Modèle de rétroaction
1, décrivez le problème
Dans l'annonce ou une offre spéciale, il est nécessaire de décider de mettre des ressources à certains clients. Ces ressources sont très chères, telles que le coût en capital de l'annuaire de produits suivant ou des effets négatifs (tels que permettre aux utilisateurs d'envoyer du courrier).En même temps, le talentCe brut affectera les décisions des utilisateurs, telles que les motiver à consommer plus ou à acheter des produits de valeur supérieure. Son objectif est de trouver un groupe de clients candidats les plus fiables, rendant les performances maximiser les performances après avoir investi dans des ressources.
Les ressources d'entrée peuvent être uniformes (telles que tous les clients participants recevant des incitations similaires) peuvent également être personnalisées. Dans le cas suivant, les détaillants fourniront différents clients avec des coupons différents produits pour optimiser les objectifs généraux.
2, l'application
Le modèle de rétroaction est largement utilisé dans la gestion des relations de marketing et de la clientèle:
Détermination des rabais, des coupons et des spécificités spéciales, nécessaire d'identifier les clients de ces réactions préférentielles.Paire de ce spectacle promotionnel, événements et cadeaux Cet email (comme des lunettes de soleil gratuites fournies par 4s Store) doit souvent identifier les clients sombresAvantages pour réduire les coûts de marketing.
Le plan de détention client doit déterminer si les clients peuvent partir mais peuvent changer leurs idées. Par exemple, le commerce électronique peut envoyer des offres spéciales pour que les clients abandonnent votre panier ou laissent une session de recherche.Dossier en ligne et les résultats de la recherche peuvent être ajustés en fonction des préférences de certains éléments.
Aide à la rétroaction Modèle Pour optimiser les promotions par courrier électronique pour éviter les spams inutiles, ces spams peuvent permettre aux clients d'annuler des abonnements par courrier électronique.3, réglé
Sur la base des discussions ci-dessus, nous pouvons désormais comprendre que cette question est le problème de l'optimisation des problèmes d'allocation de ressources et de problèmes d'optimisation être motivés par une fonction cible. L'une des méthodes les plus élémentaires consiste à modéliser le modèle de profit général des promotions basé sur la probabilité de réponse de chaque client et la valeur nette souhaitée.
C'est PR (R│U; i) est unCertains clients sous la probabilité réactive I, G (U | R) sont la valeur nette de la stimulation de cette réponse du client. Et c est un coût d'incitation. Le premier élément de la formule est de répondre au revenu net obtenu à partir de l'utilisateur de retour d'information et le second terme est la perte souhaitée correspondant au client qui ne répond pas. L'objectif est de maximiser le G en trouvant un groupe de clients plus susceptibles de répondre aux activités et aux contributions à but lucratif élevé. Parce que la formule (1.1) peut être aussi simplifiée comme suit:
ici e {g | u; I} indique les mathématiques de la marge bénéficiaire brute pour un certain client au cas où il acceptera. On s'attend à ce que les critères de sélection du client doivent satisfaire aux conditions suivantes:
Dans le même temps, la collection de clients optimale u peut être définie comme un sous-ensemble de l'amplitude maximale de l'enfant causée:
Nous pouvons également optimiser les valeurs nettes en fonction de l'allocation aléatoire. Enfin, nous le donnonsNG Nombre de clients participant aux activités de marketing sont fixés dans | U |. Premièrement, nous élargirons la formule (1.2), y compris le ratio de profit brut attendu des activités de marketing randomisées | U | Client.
E {G | I} Il s'agit de la valeur nette moyenne sur tous les clients. Cette valeur nette moyenne est constante, donc au cas où | U | Il est défini, il peut être ignoré dans la fonction cible. Par conséquent, la formule (1.2) peut également être prise dans le cas (1.3):
Cependant, le modèle est proposé pour présenter une certaine défense car le modèle est un goût naturel. Acceptez facilement les clients préférentiels, mais ne considérez pas les clients qui ont radicalement contribué avec le profit. Pour résoudre les disparus, nous devons calculer la marge bénéficiaire brute de la collection de clients selon les quatre cas suivants:
G1 - Sélectionnez U et envoyez une excitation à tous les clients
G2 - Option aléatoire U envoyez une stimulation à tous ClientsG3 - Sélectionnez U selon la formule (1.2), n'envoyez aucun stimulus
G4 - sélectionnez de manière aléatoire U mais n'envoyez aucun stimulusÉquation (1.2) est la différence de maximiser, par rapport à la niveau de randomisation.
Une autre façon est d'optimiser, non seulement mesurée par une promotion aléatoire, mais également considérer le niveau de levage d'éliminer les stimuli sur la même collection client. Dans ce cas, la formule (1.2) devient les suivantes:
Le dernier élément ici est la valeur nette souhaitée des clients inutilisés. Cette méthode s'appelle une analyse de rétroaction différente ou un mode promotionnel proposé par la littérature [BE09].
Il convient de noter que l'équation (1.2) et (1.4) ne sont pas optimisées en optimisant les coûts de marketing. Considérant les situations suivantes, chaque utilisateur de rétroaction peut contribuer au bénéfice net de 100 dollars, tandis que le coût de stimulation est de 1 $. Si un groupe de clients comporte 1 million de clients, 0,5% de réactions potentiellesLa plus grande opération de marketing et de marketing sera effectuée avec chaque client, finira par perdre 500 000 $ (500 000 $ pour le nombre total de répondants. Valeur nette, à l'exception d'une activité de 1 million USD).
Les formules (1.4) sont particulièrement importantes pour les rabais de prix (coupons, réductions temporaires, spéciaux). Considérez les questions suivantes: «En tant que revendeur avec Apple Coupons pour acheter Apple?» Selon la formule (1.2), la réponse est confirmée. Parce que cette personne est capable d'utiliser des coupons.Cependant, il est susceptible d'acheter la même quantité de pomme à un prix inférieur, ce qui réduira le retour des bénéfices des détaillants. Formule (1.4) Examiner le comportement client par défaut pour éliminer ce problème. Nous continuerons à discuter du prix dans la section suivante, car il s'agit d'un problème complexe, bien au-delà de la formule (1.4).
L'exploitation mathématique sur le revenu net dans la formule (1.2) et (1.4) peut être déterminée sur la base du modèle de classification ou de la régression de la motivation si les donnéesL'histoire est acceptée ou non. Ce problème peut être très difficile, en particulier lorsque les incitations doivent être évaluées pour avoir un niveau différent.Dans ce cas, vérifiez le groupe de vérification du client avant que une opération complète ne soit en ligne. De plus, ce n'est pas le seul indicateur principal des détaillants. Les données de profit brutes utilisées dans la formule (1.2) et (1.4) concernaient que le rapport immédiatement après le premier paiement, qui constitue une perspective très simple du point de vue de la gestion de la relation client.
Les détaillants s'intéressent également à différents hommes et la diversité des données est une économie énorme pour étudier ce problème - un modèle de tendance [SG09, LE13] - Cette discipline a développé différents modèles pour prédire le comportement futur des utilisateurs. Les modèles de tendance les plus importants incluent:
Prévision de la valeur de la vie. Le modèle de valeur de vie estimée qu'un client peut contribuer au revenu ou à des bénéfices dansC'est la vie. Cet indice est très important pour les objectifs des activités de marketing de nouveaux visiteurs.Prédire des stocks de portefeuille. Le modèle de partage de portefeuille est utilisé pour estimer le ratio utilisateur pour une sorte de marchandises, telles que des magasins d'épicerie ou de vêtements, de dépenser de l'argent dans un détaillant et de leurs concurrents. Cette mesure peut divulguer des clients ayant des contributions potentielles élevées pour contribuer à tirer des revenus élevés, car ce modèle peut être utilisé dans des activités de marketing dans des programmes et des améliorations intimes des clients.
Type d'expansion tend. Le modèle estime qu'après le premier achat d'un type de produit, la probabilité de conversion des produits conventionnels vers des produits de luxe. Ce modèle peut aider à concevoir le but d'obtenir des activités étendues.Tendances dynamiques. Ce modèle estime la capacité du client d'un certain détaillant et converti en concurrents. Si le client a tendance à atteindre des trous élevés, il peut être ciblé. Par exemple, une maison BLes cessions identifient les clients qui ont abandonné des sessions de chariot en ligne ou de la recherche de sortie, mais fournissent une certaine remise ou un certain cadeau.
Les habitudes de magasinage changent de tendances. Les habitudes de magasinage de chaque client ont terminé leur valeur pour un détaillant, ce qui signifie que la fréquence des achats de clients, que des produits ont été achetés, le produit a été acheté, V.V. Ces habitudes sont souvent stables et une fois que les détaillants changent une hiérarchie multicouche, cet enregistreur se poursuivra.
Par conséquent, les détaillants sont souvent intéressés à trouver des personnes ouvertes aux habitudes de changement. Si les gens migrent de cette ville vers une autre ville, diplômés d'écoles, ceux qui viennent de se marier, V.V. Un exemple typique consiste à prédire si les clients sont enceintes tôt [DG12] car l'avènement de la vie changera considérablement le comportement des achats de la clientèle.
Le modèle ci-dessus peut être intégré dans une formule similaire à la formule (1,4) au lieu de la marge bénéficiaire brute et de l'oncleJe discuterai de la situation à prix réduit en cas de déconnexion dans la sous-catégorie suivante. Modèle de tendance. Plus de détails sur le modèle de tendance peuvent être appelés [FX06] et [SG09].
Ce cadre peut être étendu pour choisir la solution optimale dans de nombreuses incitations possibles. Par exemple, un détaillant peut estimer l'expression souhaitée de deux solutions féroces A et B (par exemple, de la crème glacée au chocolat et de la vanille), puis sélectionnez les options optimales selon les normes suivantes [WE07] pour un certain utilisateur:
Enfin, il convient de noter que le modèle de rétroaction est associé à la division client:
La navigation de motif réfléchissant peut être utilisée pour vérifier la faisabilité de la population des clients via un accident vasculaire cérébral de cluster. Un groupe devrait avoir une réponse continue pour un plan de marketing spécifique.
Le modèle de tendance est un modèle de régression et une classification basée sur la formation des données client. Le groupe de clients peut faire référence à l'analyse de l'appelant. VisageLe mal, un modèle de tendance raisonnable peut également être trouvé dans les résultats en regroupement.Problème 2: Recommandation
1. DESCRIPTION DU PROBLÈME
Chaque ensemble d'incitations peut encourager la correspondance à une entrée de produit ou de répertoire d'autres. Afficher ces offres ne sont pas directement liées aux coûts de coûts, mais seul un montant limité de limité peut être affiché pour les utilisateurs.
De ce point de vue, chaque écran d'incitation occupera un certain espace d'écran ou une attention particulière. Veuillez fournir une incitation négative négative fournie par le client pour perdre des coûts d'opportunité.
Dans cet objectif, il est nécessaire de maximiser les performances d'achat du groupe pour chaque client selon un tel objectif.
2, l'applicationL'application la plus typique de ce problème a proposé des systèmes, des résultats de recherche personnalisés et des annonces ciblées. Il existe également d'autres applications importantes:
Réduction parrainée de Veter a THPour être classés comme tels problèmes, car les détaillants ne se soucient pas des coûts d'incitation (par les fournisseurs, y compris la présente partie du coût), ils ne sont intéressés que par une orientation efficace. Les activités de parrainage de Veter sont largement utilisées dans de nombreux segments de vente au détail, tels qu'une épicerie ou un grand magasin, car la part de marché de ces fabricants a une forte dépendance.
Le marketing en vente croisée peut bénéficier du modèle recommandé car certaines techniques proposées peuvent révéler des dimensions souterraines dans le portrait du client, tels que le style de vie. Ces capacités sont particulièrement utiles pour les recommandations entre le type croisé et peuvent suggérer des maisons ou des ustensiles de cuisine pour les clients basés sur le comportement des consommateurs dans les costumes des clients.
Le système proposé peut résumer l'achat et parcourir l'historique des utilisateurs dans le portrait de l'élève du cœur, la saveur de costumes ou le type de mouvement si fastidieux peut quantifier la mesure. CompétenceDe même, on peut être échangé selon des portraits des concurrents, tels que les portraits des clients selon l'achat des clients.
Certains algorithmes proposés peuvent distinguer la taille psychologique du produit, tel que Lifestyle, V.V. Basé sur la description du texte. Par conséquent, les commerçants peuvent les utiliser pour évaluer les descriptions de produits ou obtenir des conseils sur le mot de positionnement du produit approprié.
En particulier, il est important de noter que, bien que les recommandations soient souvent considérées comme des services en ligne, des principes de base et des technologies sont également importants pour de nombreux aspects de l'industrie. Vente au détail. Étant donné que ces technologies se sont engagées à révéler la relation implicite entre les avantages du produit, il s'agit de la tâche la plus élémentaire des détaillants.
Le système de recommandation était très intéressé par l'étude au cours des 20 dernières années. [JZ10, RR10] Deux livres fournissent des dizaines de papiers, des discours sur l'angle du système d'algorithmes et de technologies proposés dansu papier blanc.
Dans une certaine mesure, la diversité de la hauteur des techniques proposées est que certains défis rencontrés désormais, tels que les points de clients des clients clairsemés, la capacité d'ouvrir largement et manque de nouveaux articles et clients.
Évidemment, nous ne pouvons pas examiner certaines méthodes et algorithmes dans cette section et n'ont pas beaucoup de sens ici, car ces évaluations sont toutes. En revanche, nous nous concentrerons sur les systèmes de conception de la conduite et nous allons ignorer essentiellement les algorithmes et les aspects techniques de cette question.Du point de vue économique majestueux, le système de recommandation est étroitement lié à l'expansion rapide des catégories de vente dans de nombreux secteurs de la vente au détail dans de nombreuses zones de vente au détail. Le grand niveau a ajouté beaucoup de produits non sombre et les ventes et les contributions de chaque produit sont très petits, mais cette "longue queue" est très importante.
Recommandations traditionnelles telles que la vente de produits semi-chiensY Nhat ne peut pas utiliser l'efficacité des marchandises de ne pas vendre, nécessitant de nombreuses recommandations plus intelligentes à des millions de personnes ou qu'elle n'a jamais découvertes. Il est instructé dans le produit.
Parce que nous accordons principalement une attention particulière aux descriptions prioritaires des produits sur les produits, nous introduirons l'utilisation de la technologie de recommandation large à partir de la simple responsabilité en fonction du complexe de degrés de fonctions utilitaires, nous serons basés sur l'image ci-dessous. Classification recommandée du niveau technique. Cette classification de niveau combine la classification générale du système proposé, mais elle n'est pas identique:
4, un objectif unique
Commençons par la définition de base d'une fois l'affaire est proposée un seul objectif est largement utilisé. dans la documentation du système recommandé. Les détaillants vendent des articles j = {j_1.. j_n} aux groupes d'utilisateurs u = {u_1.. u_m}. Fonction Point R: J × U indique que l'utilisateur est négatif ("n'aime pas") sur le devant("J'aime") sur le devant ("J'aime"), utilise souvent des nombres.
Certaines paires d'utilisateurs et d'éléments peuvent être estimées sur la base du score de l'utilisateur ou de l'estimation de l'historique des achats, des enregistrements d'accès au site Web, des tâches proposées peuvent être définies comme une paire d'éléments d'utilisateur donnés (u, j) prédictions de R_ Points (U, J) sont évalués.
Il existe deux façons de résoudre le classement des problèmes de prédiction:Estimez le score de chaque utilisateur en recherchant des articles similaires à un utilisateur spécifique qui aime les projets passés;
Peut également être payé à partir du score des utilisateurs similaires à l'utilisateur estimé estimé. Les deux méthodes respectives sont appelées filtrage du contenu et filtrage collaboratif.5, Teneur de filtre
L'idée principale du processus de filtration de contenu est basée sur les préférences, le comportement et les utilisateurs passés des produits. Bien que incapable de mettre en œuvre différentes explications de filtrage du contenu, nous choisissons de mettre l'accent sur l'application de l'exploitation minière de données comme problème.Classification [PZ07].:
Chaque utilisateur peut être considéré comme un modèle de régression pour prédire le point de prédiction de l'élément. Un exemple particulier consiste à diviser les éléments en deux catégories avec deux types - "comme" et "n'aime pas".Un portrait de l'utilisateur est un exemple de modèle de régression décrit ci-dessus. Ce modèle utilise un score d'utilisateur connu (montrant des scores, de l'historique des achats, V.V.).
La liste des éléments proposés à l'utilisateur spécifié est obtenue à l'aide d'un point de prédiction de modèle de régression correspondant à tous les éléments de dossier, puis sélectionnant le nombre estimé des estimations d'éléments les plus élevés.Bien que le processus ci-dessus semble comparable, c'est vraiment difficile. Étant donné que les utilisateurs et les éléments sont des entités de base différentes et pour trouver des utilisateurs peuvent convertir directement des éléments en modèles de régression, cette chose subtile peut être utilisée.
La question la plus importante concerne les attributs d'inventaire tels que les marques, les articles d'articles ouLe prix ne suffit pas pour mesurer l'utilité des articles pour les utilisateurs. Bien que certains clients puissent rencontrer des prix fidèles à une marque ou recevoir des prix, il est nécessaire d'avoir plus de sophistication et d'informations, telles que le mode de vie ou la saveur pour décrire les modèles et les points globaux observés..
Ces tailles implicites sont importantes pour les films, les livres, la musique et même des objets tangibles comme le vêtement. Les détaillants peuvent utiliser les méthodes suivantes en fonction des techniques de classification standard à l'onglet [GH02]:
Exemple: Les vêtements peuvent être déterminés par des cartes telles que la mode, le conservateur, le déplacement.
Attributs de produits standard (tels que descriptions de texte) pour fournir aux clients des informations de marketing spécifiques, de sorte qu'elles impliquent des propriétés invisibles. Par conséquent, le jeu de produits de points artificiels peut être utilisé pour créer le modèle de classification qui sera mappé de l'attribut de produit à la taille souterraine. Par exemple, une méthode de classification de baies peut être utilisée pour estimer la probabilité de condition PR (Décrivez le mot élément | La valeur de la propriété implique) décrit lorsque la valeur d'attribut cachée se produit.Cet élément peut être classé parmi les marchandises qui ne spécifient pas le produit en calculant PR après la PR Proverbes (valeur d'attribut par défaut | Section Description).
Les compliments généraux, le contenu de la modélisation et les éléments de modélisation sont en réalité accessibles aux informations, de nombreuses techniques d'enrichissement et de recherche (par exemple, [MA08]) peuvent être utilisées) pour créer un système proposé. Nous avons un peu de détail, car ce n'est pas la partie la plus importante par rapport aux points de vue de l'économie de mesure.
Coopération du filtre: Le problème de taille implicite mentionné ci-dessus a une grande signification, ce problème peut nous guider pour comprendre la série de secondes technologies proposées. Ce problème vient de simplement incapable d'ajuster strictement le goût et la tendance de tout le monde.La coopération filtrant est une solution naturelle, la seule solution n'a peut-être pas besoin d'effectuer de nombreux emplois artificiels dans le système - Proposition VLa décision décisionnelle des éléments est remplie par les commentaires des autres utilisateurs.
Le modèle de coopération la plus élémentaire [RE04, BR98] est déterminé directement par des données similaires entre les utilisateurs:
ici R_U, J est le point de la personne utilisée sur le J, U L'article est une collection de tous certains utilisateurs ou utilisateurs d'un utilisateur de certains utilisateurs, un coefficient standardisé, SIM (U, V). Deux utilisateurs de la similitude de la même manière et de R_U sont le score moyen des utilisateurs de Gotty:
Supposons que j_u est un ensemble de notes utilisateur, des notations d'utilisateurs moyennes à l'aide de Formula Concepts (2.1) pour des utilisateurs de modèles plus élevés ou inférieurs à ceux des autres utilisateurs, car ils ont les exigences élevées. Bien que ce ne soit pas absolument nécessaire, cet ajustement est très important en fait et de la même manière. Il est largement utilisé lors du filtrage.
Utilisez habituellement une distance de cosinus ou des relations Pearson à un peuLes similitudes entre le résumé, J_U et J_V. En outre, la littérature [ER98, SU09] décrit beaucoup de ces bases. Des données similaires sont modifiées pour améliorer les performances de l'utilisation.
[2.1) Il existe des défauts importants: la première complexité informatique de ce modèle (proportionnelle au nombre d'éléments et d'utilisateurs) haut, le score de l'utilisateur secondaire est très clairsemétrique. Le niveau horizontal du score signifie que chaque utilisateur n'écrira qu'une petite partie de l'élément, il n'y a donc pas d'éléments combinés lors du calcul des similitudes du vecteur J_U et du vecteur J_V. Cela réduit la qualité proposée.Exemple: , les scores de scores dans la matrice Point Amazon [SA01] et Netflix [YK08] ont atteint 99%. Pour surmonter cette limite, le modèle de l'utilisateur (2.1) est remplacé par des éléments généralement basés sur les éléments [SA01, YK08], généralement en termes de concept conceptuel,:
dans des données similaires entre les articles basés sur articles dans deux éléments. R_ (u, j) point de référence du score de l'utilisateurcalculer. Le point de référence estime que l'écart de l'utilisateur (la valeur d'évaluation moyenne de l'utilisateur est comparée au score global) et à l'écart de matière (le score moyen de l'élément est comparé à la déviation du point général).
Il convient de noter qu'il existe une méthode simple pour effectuer des formules (2.2), ce procédé est basé sur la fréquence de la fréquence (articles achetés avec la même normale) et sur la base des ensembles régulièrement de la même manière. droit. Cette méthode est considérée comme "moteur proposée" [RE03].
Modèle (2.1) appartiennent au dit dit le modèle voisin le plus proche, ces modèles estiment leur score en analysant les voisins des utilisateurs ou des articles similaires. Cette série d'algorithmes comprend également de nombreuses techniques de variation [SU09] pour remplacer une méthode de test de voisinage à l'aide d'un modèle de probabilité compact ou d'une autre méthode d'approximation.
Bien que le modèle voisin le plus proche soit une technique proposée vérifiée par les détaillants de premier plan comme amAzon, mais toutes ces technologies sont simplement dans le processus de filtration de processus. Arrivée. La capacité entre les utilisateurs et les similitudes entre les utilisateurs et les articles entre éléments est limitée dans des relations complexes entre les utilisateurs et les relations non mesurables.Ce problème avec des classes de recherche pour rechercher des synonymes et des couvertures de recherche dans la récupération d'informations similaires, pour révéler l'intention réelle de la recherche et de l'intention de traduire les similitudes entre le texte et la requête. Les choses sont très difficiles.
Pour résoudre ce problème, une technique appelée analyse sémantique souterraine est proposée [DR90]. Cette méthode est proposée pendant 10 ans pour concevoir le système proposé [SA00] et créer un nouveau modèle d'implications.
L'idée principale du modèle d'élément implicite peut être décrite comme suit: La fonction Point R peut être obtenue avec la matrice M × n (m est le nombre d'utilisateurs, n est le nombre de produits), où les facteurs sont des points de points. Cela peut être utilisé comme problème d'espacelinéaire.
La tâche proposée peut être redéfinie comme une combinaison d'autres vecteurs pour calculer le vecteur de point d'utilisateur. En fait, l'équation (2.1) est naturellement une combinaison linéaire de notations déterminées par la même fonction.
Toutefois, le problème est que la matrice est manquante des points manquants et des points clairsemés, en raison de préjugés et de facteurs aléatoires qui ont souvent du bruit et la possibilité de révéler des utilisateurs impliquent souvent un ensemble d'éléments complets basés sur la taille de l'article. Sans rapport avec un seul élément.En d'autres termes, l'intelligence du signal est dispersée dans une matrice de faible densité géante et mélange qu'un certain niveau de bruit peut être affichée en recherchant le mode implicite. L'idée de modèles d'éléments cachés est un espace linéaire approximativement élevé avec une base de faible taille, ce qui aide à atteindre les objectifs suivants:
moins de taille peut aider la concentration en énergie du signal, chacune de la ligne de base contribue à estimer.g. Il réduit le bruit en éliminant les fluctuations qui ne correspondent pas à des bases plus petites.
Le processus de calcul de base peut être conçu pour créer un vecteur de base dépendant au minimum, révélant ainsi l'efficacité principale du goût de l'utilisateur, a tendance à correspondre à chaque appartement juste. Par exemple: Netflix utilise cette méthode pour prédire le point de cinéma [YK08, YK09], la taille du système correspond clairement aux axes combinés tels que la comédie, les hommes et les femmes.
Chaque point de la collection le long de R_1 et de la taille R_2 a une valeur de coordonnée importante et affiche la structure complexe et inégale des données. Toutefois, dans un autre système de revêtement B révèle que les données peuvent être décrites efficacement par taille B_1 et B_2 la taille n'a pas d'importance, cela montre qu'il s'agit d'un modèle impliqué à sens unique.
Dans une certaine mesure, le modèle d'élément souterrain peut être comparé à des modifications de cosinus discrètes (DCT), la conversion de cosinus discrète est utilisée à des formes approximativement façonnées.Photo avec une petite quantité d'harmonieux comme JPEG dans l'algorithme de compression d'image.
Le lien de réflexion ci-dessus nous conduit au modèle officiel du coefficient caché suivant, choisissez d'abord la taille B, M, M et l'un des utilisateurs et des articles est l'une des tailles d'espace. Nous identifions l'identité de vecteur de u à p_u∈r ^ b, le vecteur d'identification de l'élément j est q_j ^ b, basé sur le rapport du rapport de l'ordinateur R et du composant B est inclus dans TOO Calculatrice. Tous les messages d'une des tailles souterraines sont décrites ci-dessus.
Par conséquent, les utilisateurs et les éléments peuvent être codés selon le même thème et le même score peuvent être enregistrés en calculant le volume de deux vecteurs, la taille du vecteur est de deux ou deux paires de deux paires de deux paires de deux paires de total:
Il existe de nombreuses façons de calculer les implications et l'élément de l'utilisateur, la méthode la plus directe consiste à décomposer la matrice R avec les selles annulent une petite valeur (SVD). Cependant, basé sur un calcul stable et des degrésComplexe, il est souvent utilisé dans la réalité [YK09].
La figure ci-dessous montre la différence entre la vue (2.1) et (2.3). Le côté gauche du vecteur de scoring rare avec un certain élément est estimé au score; À droite, le point est obtenu en calculant le déclassement de deux temps de traction et une très bonne densité d'énergie.
6, multi-usage
Le procédé proposé est proposé la thèse ci-dessus est essentiellement Motivé par un seul objectif, cet objectif est de fournir les meilleures incitations appropriées ou prédictives. Scores. Toutefois, la seule considération n'est pas la seule considération pour le système et les détaillants recommandés pourraient être intéressés à fournir des recommandations pour les utilisateurs ainsi que de nombreux objectifs de conflit.
Par exemple, les aliments d'épicerie peuvent être intéressés à améliorer la vente d'aliments périssables avec des magasins plus courts et à la mode qui souhaitent favoriser des marques de parrainage ou de précieuses, de nombreux détaillants peuvent proposer des taux de profil de changement de vitesse.o plus du produit ou envisager des niveaux d'inventaire des produits à éviter de rupture de stock pour obtenir de meilleurs avantages.
Documentation [JW10] a proposé un système de recommandations multi-cibles et effectue une vérification à grande échelle dans LinkedIn [RP12]. Dans l'exemple de LinkedIn, son objectif principal est la norme de fournir une opportunité d'emploi sémantique d'introduire sémantiquement, suivi du comportement de recherche d'emploi. [RP12] Description Méthode pour déterminer la tâche proposée est le problème d'optimisation suivant:
Ici:
Créé par des systèmes de recommandation de base basés sur une corrélation de vecteur sémantique et corrélée combinée, le facteur JRE dans ¯r représente la point de corrélation (ou arrangé) de JTH Products.¯f est le vecteur d'eigenvalue secondaire et le premier élément de ¯ correspondant au premier point de produit à l'objectif secondaire. Par exemple, ce vecteur peut être un bénéfice brut.
R (·) est une mâchoire qui coupe la combinaison des combines er et ¯f pour former un nouvel arrangement pour équilibrer les deux buts.g(•) Indique la fonction d'utilité globale de la performance des données.
E {⋅} la moyenne de tous les effets proposés.(·) _ (1 ... k) est indiqué par le premier K avec le score le plus élevé, dans lequel K est le nombre d'éléments proposés aux utilisateurs. Par exemple: Si r inclut tous les produits N de tous les produits de volume N, ¯r_ (1..k) correspondant au produit le plus recommandé.
dist (·) est une fonction fonctionnelle entre la différence entre les deux vecteurs suggérés et C est le seuil de limite de cette différence. Selon [RP12], un matériau de distance raisonnable et le fait que l'erreur carrée de diagrammes de vecteur deux points.La principale chose à laquelle l'optimisation ci-dessus est d'accroître la proposition d'intégration du point de corrélation de l'objectif secondaire, mais les résultats pertinents de la corrélation du son d'origine et de la sonde diffèrent les résultats de la recommandation globale. sont punis pour assurer la corrélation complète de sacrifice pour le premier objectif.
Conception de la fonction r (·)Demandez aux paramètres réglables de régler le poids des deux buts et de déterminer la cible d'optimisation principale, cette méthode peut être étendue directement à plus de deux objectifs.
] Nous pouvons utiliser un grand nombre d'exemples pour montrer que l'optimisation ci-dessus. Le modèle peut être ajusté en fonction du problème réel. Premièrement, envisagez les détaillants d'intégrer des objectifs de revenu pour les points proposés.La fonction d'utilité globale peut définir la marge bénéficiaire synthétique, placer m (p) ∈ [0, 1] est la fréquence de cheveux standardisée de l'article P et de probabilité d'achat d'article P et probabilité (c'est-à-dire que les éléments sont Trié ci-dessous dans la liste proposée, la probabilité de transition inférieure).
Il s'agit d'une constante standard normalisée. Les fonctions d'arrangement intégrées peuvent être définies comme suit:
Il s'agit d'un paramètre de la corrélation de contrôle et de la corrélation du taux de commerce. Numéro détermine l'objectif principal deProblèmes d'optimisation (2.4).
Un autre exemple de réarrangement selon les objectifs secondaires est un produit présenté présent, tel que des produits de réduction ou des produits périssables. Les fonctions utilitaires peuvent être spécifiées comme nombre moyen d'éléments de la liste proposée avec les éléments recommandés.
Ici f (·) est un signe de fantaisie. Lorsque l'article est hiérarchisé, il est 1, pas 0. La fonction de tri intégrée allie des points de corrélation et des signes spéciaux, qui est la principale cible d'optimisation selon les paramètres.
La fonction de tri ci-dessus peut être étendue directement pour intégrer plusieurs degrés des fonctions séparées, chaque caractéristique du score de classification finale, les paramètres d'échange (tous les paramètres doivent être combinés):
Les détails de l'algorithme d'optimisation numérique pour le problème (2.4) peuvent être trouvés dans [RP12].
Les détaillants fournissent aux clients un ensemble de produits, en fonction deAux besoins d'un certain produit, y compris le produit lui-même tel que le prix ou la marque, les concurrents, les concurrents et même la météo.
L'objectif de cette question est d'intégrer ces facteurs pour créer un modèle de demande et permettre d'analyser de prédire la réponse aux changements de prix, à l'expansion et à la réduction des catégories, et à calculer la meilleure unité d'inventaire et de distribution .
2, l'application
Dans cette section, nous discuterons de la nécessité de prévision de la demande. Ce problème peut être considéré comme un module de construction, nécessitant un modèle limité pour les actes ou l'inventaire des besoins d'impact:
Optimiser les prix, les activités de publicité et la direction des réductions.Plan de gestion et de portefeuille. Optimiser les niveaux d'inventaire.
Le modèle de prévision requis est souvent appliqué dans des activités de marketing, car ces modèles peuvent expliquer l'impact de la régression de la demande. Par exemple, un modèle de prédiction requis peut révéler la sensibilité des prix d'un produit(Combien de changements de changements de prix) sont étroitement liés à la taille de la taille de l'emballage et de la zone de vente, montrant que vous pouvez utiliser différents magasins. Prix et mettre en place un bénéfice brut différent de l'unité pour différents produits d'emballage.Nous utiliserons le modèle de prévision pour l'optimisation des prix et les problèmes de planification des produits dans les sections suivantes.
3, solution
Les exigences de prédiction peuvent être considérées comme un problème d'exploitation minière de données relativement simple, viennent de configurer le modèle de régression et l'évaluation avec des données historiques. Cependant, le modèle de régression de conception n'est pas simple, car la demande est affectée par de nombreux facteurs avec des dépendances complexes.
Dans cette section, nous étudierons [KOK07] pour construire et vérifier les habitudes de régression pour Albert Heijn (un supermarché de chaîne néerlandaise). Ce modèle applique un modèle similaire dans ces pratiques basées sur des recherches marketing précoces telles que [BG92] et les vendeurs.Mode à la mode comme de la ruelle [JH14] et Zara [CA12].
Cependant, il est important de comprendre que différents problèmes d'optimisation nécessitent différents modèles de prévision des besoins et presque impossibles à construire un besoin commun d'accumuler des facteurs d'impact de la demande différentes.
Nous avons débuté des exigences suivantes:
Ici:
V est une boutique d'accès client dans une fenêtre numéro de fenêtre, par exemple par jour.
PR (Acheter | Accès) est la probabilité d'acheter des articles dans le magasin d'achats.
PR (J | Acheter) est la probabilité de choisir des produits lorsque les clients sont achetés.E {Q | j; Acheter} est des attentes mathématiques sur la quantité d'achat (nombre de chiffres) lorsque les clients choisissent des produits et des achats.
Tous les éléments de la formule (3.1) peuvent être estimés en utilisant les données de transaction historiques du magasin. La demande est souvent liée à la journée (semaine, vacances, V.V.) et stockage (taille, quartier, v.v.), donc nous giIntroduction T et H Inscrivez-vous à tour de rôle pour indiquer la date et le magasin, et les besoins estimés sont ces paramètres.De plus, des propriétés de stockage, telles que la taille moyenne, la position et le revenu des consommateurs peuvent être incorporées dans le modèle comme retourné. Selon [KOK07], le nombre de magasins peut être modélisé comme suit:
Voici la température météorologique, WT est un indice météorologique confortable (humidité, négatif, etc.), BTI et ETI pendant la journée Les virages muettes sont-ils 0/1 de la semaine et des vacances, et H sont le nombre de vacances et α est le coefficient de régression.
L'événement d'achat est une variable binaire (Acheter / N'achetez pas), nous pouvons donc utiliser la méthode de modèle standard - Utilisez la fonction Sigmoid à exprimer et à partir de paramètres d'index Estimation des données:
Le modèle X de x est:
Cette AJHT est une variable factice, le produit J est une valeur au moment de la promotion, sinon 0, la banque est le nombre des produits, tandis que β4 correspond au pourcentage de produits publicitaires occupant des produitsm Ventes globales.
Les estimations des relations publiques (J | l'achat) sont plus difficiles. Le modèle de sélection des clients est essentiellement une mesure de problèmes économiques, une succursale spéciale de la recherche économique - choisissez la théorie de la modélisation. Choisir la théorie de la modélisation prouvant que de nombreux modèles logit (MNL) sont un moyen efficace de modéliser la probabilité sélectionnée dans de nombreuses options.
Je vais répéter via tous les produits, YJ est une variable de paramètre. Semblable à la probabilité d'achat d'événements, nous avons défini un modèle de régression pour le paramètre YJ:
Ce coefficient N + 1 et Nombre γn + 2 sont partagés par tous les produits de produits, RJHT et R sont les prix d'un Le produit et le prix moyen du produit, tandis que AJHT et A sont des tarifs muettes muet et moyens, comme décrit ci-dessus, comme décrit ci-dessus, comme décrit ci-dessus.
Enfin, le nombre moyen de ventes de produits unitaires peut être modélisé comme suit:
En remplaçant le modèle sur les expressions d'origine (3.1),Peut obtenir une prédiction de la demande pleinement spéciale.Paradigme.Ce modèle peut être ajusté en fonction de l'utilisation des affaires du détaillant, qui peut être effectuée en ajoutant d'autres variables de traduction telles que des événements marketing.