Parler d'algorithmes d'égouttement

1. Pourquoi avons-nous besoin d'un meilleur algorithme d'expédition

lorsque nous allons à l'expéditeur, comment croîtez-nous à l'expérience du camion aujourd'hui? Voyons la première chose, pourquoi est-ce indispensable?

Rappelez-vous qu'il y a quelques années, lorsque nous n'avons pas goutte à goutte, vous ne pouvez qu'attendre des vents froids ou de la chaleur en chaleur, et peut ne pas avoir besoin de soulever des taxis, vous n'avez jamais que cela est possible qu'un taxi est appelé et les passagers peuvent attendre l'apparition de la voiture dans la pièce. Sous l'apparence en ligne, l'identification de l'utilisateur est la première mise à niveau, mais cela ne suffit pas, la commande prenant la commande est prédéfinie. La réaction de plafond ne sera pas trop élevée. En 15 ans, GRAP est dans les opérations d'affaires de train rapides, nous nous sommes développés à partir de la liste pour envoyer un seul mode, le taux de commentaires de passagers a 20 points et plus, et plusieurs fois disponibles pour 90 + (pics et amplis; taux de rétroaction stricte et l'offre et la demandeLa communauté locale sera relativement stricte) et les passagers ont encore une fois amélioré beaucoup, on peut le voir que le format a créé une énorme valeur utilisateur pour goutter.

Obtenez une autre entreprise O2O ces dernières années, des pays nationaux et étrangers, y compris nos amis Uber, Lyft, sur la base de la forme de format de format de produit, de pilotes et de passagers combinant des transactions entre Uber répertoriées. et DPC sont également dans l'état des principales capacités techniques; Regardez ensuite notre plate-forme à emporter dans notre pays, les avantages et les inconvénients du système d'envoi de base déterminent également l'efficacité de la transaction de l'ensemble de la plate-forme. (Coût de livraison annuel) et expérience utilisateur (temps de distribution); Enfin, l'ensemble du secteur de la logistique a continué de mener la linéarité ces dernières années, comment combattre les biens et les conducteurs et de meilleures compétences en orthographe sont également toutes les transactions de contact. ÉtatPrérequis pour les personnes importantes et les modèles commerciaux. D'arrogance, DVD est de plus en plus en activité et dans la vie réelle.

Lundi, signatures préliminaires

Ces mots se réalisent, nous sommes arrivés ici pour voir le réseau goutte à gouttes sur la manière d'envoyer. Tout d'abord, voir quel genre de problèmes auxquels nous sommes confrontés?

L'exercice de commande est le processus d'attribution de commandes émises au pilote en ligne dans le système de candidature

C'est un aspect similaire, mais en fait des problèmes très compliqués. En parlant de cela, il peut y avoir beaucoup de gens poser, pouvez-vous spécifier des commandes pour votre pilote le plus proche?

En effet, la réalité, le principal principe de la faction de l'expéditeur de goutte à gouttes est «d'allocation étroite» (70% ~ 80% des commandes sont livrées au conducteur le plus proche) selon moi, d'autres sociétés concurrentes autour de Le monde (y compris Uber) est basé sur ce principe.

Aller à cette questionSi nous utilisons la poursuite gourmande pour la première fois à venir, desservir de manière goulaine d'abord, il est préférable de respecter toutes les exigences et pilotes de passagers? La réponse est la raison si nous ne prenons que des décisions basées sur l'heure actuelle et l'ordre local actuel, nous ignorons l'avenir des nouvelles commandes et des amplis; Changement de pilotes et ignorer d'autres zones et même la ville adjacente à vous. Demande (Remarque: dans le temps, les nouveaux pilotes et les amplis; les commandes entraîneront des stratégies gourmandes pour obtenir des objectifs d'approbation.). C'est pourquoi ce problème est toujours très compliqué.

C'est un peu abstrait, mais cela n'a pas d'importance. Faisons une autre étape pour éliminer l'allocation des commandes, que les gens comprennent plus:

Il suffit de regarder, sur notre plate-forme, à chaque fois que les commandes créées par les passagers et MS peuvent être allouées, plate-forme forteNotre puissant peut être envoyé à l'algorithme Dispatta qui fournit un géographe en temps réel du conducteur, ainsi que toutes les commandes et nous dit que chaque pilote reçoit la distance de navigation des commandes en temps réel.

Cela semble très simple, nous attribuons directement cet ordre à ce pilote.

"Alors pourquoi y a-t-il une voiture de tambour à proximité?"

Le système routier réel sera plus compliqué, la raison pourront être le pilote échoue, ou lors de la communication avec le service à la clientèle, etc le conducteur ne peut pas écouter, et la raison Est-ce que toutes les voitures peuvent répondre aux exigences de vos commandes, les stratégies les plus élémentaires sont en réalité une règle d'installation manuelle. Avancé quelques exemples les plus élémentaires:

Règle A: Pilote Express ne peut pas recevoir de commandes de véhicules spéciaux

Règle B: Assurez-vous que le conducteur ne réussira pas une zone limitéeLimiter après le pilote

C: Pour filtrer le pilote de destination en temps réel
Règle D: Pour écouter uniquement le calendrier de rendez-vous pour les pilotes unique à une seule fois
Règle E: Les commandes similaires ne seront envoyées à un pilote ponctuel que
...
Il doit être clarifié comme les règles qui ne causent pas un impact injuste dans la distribution, mais opère correctement, ici Certaines stratégies sont importantes pour assurer l'exactitude de l'entreprise.

S'il s'agit d'une commande et de 2 pilotes

Supposons que les deux pilotes puissent être attribués à cette commande, voir le système doit être attribuer comment.

Premièrement, en même temps, comment le système est-il attribué à la même distance?

Il suffit de dire que le plus grand principe de notre ordre d'allocation de la plate-forme est l'allocation, lorsque la distance est exactement la même, nous sommes maintenant systématiques ignorésNG examinera les avantages et les inconvénients du service du conducteur et du service élevé, ce service est géré (Remarque: l'impact des points de service sur la destination, une compréhension simple peut être transférée au nombre de distances peut être convertie en combien de mètres, Cette section n'est pas le point principal d'aujourd'hui, non introduite), puis explique que le système utilisé est la distance de navigation de la carte, et non la distance des lignes droites que les gens voient, parfois une intersection entraînera une distance en raison des besoins de retour. La différence est énorme; Et si le positionnement du conducteur se produit, il y aura des dépôts excessifs.

Alors, voir le second cas, si le conducteur s'approche, le conducteur est loin, comment le système est-il?

C'est très simple, en fonction du principe d'allocation approximatif, nous attribuerons un pilote dans cet ordre. ~ ~ ~, Supposons-y, je mets à nouveau, quand la commande est libéré, maintenuLe contrôleur B a été en ligne, mais le pilote n'apparaissait pas (pas de passagers en ligne ou également envoyé), mais 1s, loin d'un conducteur soudainement divisé, supposons qu'ils utilisons la première cupidité pour servir en premier, puis le conducteur b sera distribué dans cet ordre, enfreignant notre espoir d'aller presque longtemps :(. Donc, il semble simple, mais en fait, l'algorithme doit encore être changé. Ce problème nous l'appelons dans le calendrier et nous trouverons un moyen de résoudre le problème .

S'il existe des passagers NN, MS
Considérons les cas polyvalents les plus complexes, ce qui est également le défi du système en ligne à faire face, nous mettons habituellement cela Situation. L'échantillon de table est également un problème approprié d'un diagramme. Il est également appelé la matière appropriée dans le domaine de l'opération, comme indiqué sur l'image:

Nous nous excusons pour ce problème, pense que nous avons 20Passagers En ce moment, 20 pilotes, ces passagers peuvent être un pilote du conducteur, notre système doit spécifier 20 de ces passagers et créer la longueur totale des pantalons. Est-ce un peu compliqué? Nous utilisons des connaissances mathématiques combinées, cela peut être 20 étapes. Il y a de nombreuses étapes. Quel est le concept de 20 étapes? 20 1918 ... 1 = 2432902008176640000, ce nombre est extrêmement impossible, il est absolument impossible de rechercher une violence totale. Plus intelligent est requis ici.

S'il y a un passager, le conducteur, y aura-t-il des passagers et des pilotes pendant un moment?
C'est le plus gros défi d'envoyer une seule question. Nous n'avons pas besoin de ce point, nous devons envisager le total optimal, les nouveaux pilotes et les passagers seront accessibles dans tout le réseau. En temps réel, insérez de nouveaux boutons, comment mieux allouer, avoir un nouveau changement, alors commentPour des considérations, nous sommes importants pour nous, cette question est également connue sous le nom de problème de VRP dynamique dans l'industrie, qui est également modifié au fil du temps. Signification, c'est pourquoi, la signature déroulante de la signature est loin des produits distants et de la route du secteur de la logistique. Supposons que nous connaissions les changements réels complets de l'offre et de la demande à l'avenir, savons-nous que notre système peut utiliser la même capacité à compléter 1,2 à 1,5 fois le pont, également la direction que les camarades de classe d'algorithme d'expéditeur continu.

Je me souviens de la conférence de Spit pour la dernière fois. Tout le monde a mentionné que Wen Wei a dit que notre commande officielle était plus difficile que Alpha Go. En fait, ces deux problèmes sont vraiment similaires, tous ont constaté que la meilleure solution approximative dans l'espace de recherche surdimensionné et Alpha Go résoudra dans une règle plus claire et un environnement de jeu, et sa difficulté est leur jeu et leur problème.Je suis très difficile dans la fourniture et les besoins futurs sont incertains. Sexe & & L'incertitude du comportement des utilisateurs. Dans les cercles d'apprentissage ces dernières années, de nombreux efforts ont tenté d'explorer VRP & AMP; TSP et autres directions à utiliser Alpha Go et améliorer l'activité d'apprentissage combinée et la théorie est l'une des principales menant à l'avenir. (Les camarades de classe non techniques peuvent sauter ici ":))

Résumer l'algorithme d'envoi

Ce que nous avons décrit ci-dessus est la question de la répartition des ordres et des défis auxquels Ensuite, nous venons ici
Parlez à la manière d'ajouter une seule politique à quelques questions soumises.

Avant d'introduire une stratégie spécifique, nous enverrons d'abord le Principe d'envoyer une loi étroite unique. Le principe de la politique de commande est la suivante: Tenez-vous dans Quan Global Points, essayez de répondre autant que possible d'aller à l'extérieur du pont, assurez-vous de vous assurer queOn dit que chaque véhicule exige que les passagers soient satisfaits plus rapidement et font de notre mieux pour améliorer l'efficacité de la commande de chaque conducteur, de sorte que le total du voyage le plus court.

Comment comprendre ce principe? Nous avons dit que cette stratégie serait dans la perspective mondiale pour atteindre l'optimisation mondiale, donc pour chaque besoin indépendant, les factions ne peuvent pas "mieux localement", mais vous pouvez vous dire que même si c'est dans cette stratégie, il y a toujours 70% à 80% des besoins conformes aux résultats gourmands les plus récents.

Ensuite, cela sera introduit par deux stratégies officielles officielles. (Le contenu ici efface ici principalement la motivation stratégique, les détails ne sont plus élargis)

1. Correspondances par lots (optimisation globale)

Le plus Une partie de base de la stratégie de formule est de résoudre les problèmes de temps mentionnés dans la section précédente. Cet algorithme presque tous les modèles les plus élémentaires deTous les documents similaires pour résoudre ce problème et c'est appelé une combinaison de série à Uber et nous sommes également appelés "optimales globales" ou "concentration de transmission".

Cette idée est vraiment intuitive. Étant donné que les commandes de l'utilisateur et l'apparence du pilote ne sont généralement pas en même temps, la taille de l'heure de la cupidité dans la dimension temporelle (c'est-à-dire que chaque commande apparaît lorsque vous choisissez une déclaration de soumission à proximité), vous ne pouvez pas obtenir les meilleurs résultats. Une idée naturelle est de passagers et de conducteurs qui attendent un moment après un peu et après la collecte des commandes et des informations de conduite pendant une période de temps, elles ont été collectées. De cette manière, il existe des ordres relativement importants et denses, après la conduite, la stratégie officielle peut trouver un format plus proche.

La recherche optimale optimale globale est une combinaison de diagrammes bipartites, tandis que les passagers sont des pilotes, il peut être sUtiliser pour faire fonctionner différents problèmes appropriés. Les méthodes sont résolues.

et tout le monde a clarifié que le modèle que nous faisions correspondre au modèle et tout le monde, espérons-le, "je me suis donné le conducteur pour m'envoyer" "," "ce n'est pas une contradiction, nous recherchons également le Solution optimale "la plus courte" des passagers, la plupart des cas mentionnent également vos pilotes les plus proches, mais répondez à tous les passagers "pour m'envoyer le plus récent pilote." Besoins personnels, parfois, cela conduira à certains passagers pour répondre aux besoins, tels que la situation suivante :

Lorsque les passagers numéro 1 et 2 appellent la voiture en même temps, si vous surveillez complètement "apprendre à envoyer un modèle unique", bien que le premier passager soit envoyé Pour la première fois, le passager numéro 2 va à quelle distance de la distance, entraînant un délai d'attente, même parce que le conducteur récent dépasse la fondation d'envoyer une seule distance, ce qui entraîne 2 passagers ne peut pas appeler la voiture.Les clients du n ° 1 et de la n ° 2 attendent toujours 15 minutes et la durée moyenne de veille est de 7,5 minutes.

La pratique que nous avons effectuée comme une distance du passager n ° 2 de la distance effectuée.

Numéro de passager 2, de sorte que les passagers et les passagers n ° 1, la durée moyenne de veille est raccourcie en 5 minutes et l'ordre d'approximation est raccourci. 2,5 minutes, le temps de veille total est raccourci à 10 minutes, soit 5 minutes en 5 minutes.

En favorisant l'efficacité globale, il peut être converti pour répondre aux besoins des plus de passagers.
2. Sur la base de la fierté et de la demande
"Si un prophète nous a dit de créer du temps et des amples; lieu de localisation, à chaque fois en ligne du pilote Emplacement; Emplacement, la faction deviendra une chose très confortable " Méthodes Série appropriée, sont garanties selon la théorie, les correspondances correspondent sont optimales. Mais est-ce assez? Malheureusement, la stratégie du retard de concentration retardé est décrite ci-dessus ne peut que résoudre certains problèmes, et toujours pas une solution complète. Son principal problème est responsable de la rétroaction des utilisateurs limitée au format système et, dans certains cas, quelques secondes permettront aux utilisateurs de perdre confiance dans la plate-forme, alors annulez la ligne d'application. Par conséquent, dans la ligne réelle, nous n'accumulons que quelques secondes de secondes et des informations de conduite pour transférer l'accent, ce qui peut encore approcher de la taille de temps dans la situation générale. Si vous souhaitez aller au résultat optimal de la commande, la seule méthode consiste à utiliser des prévisions prédictives à l'avenir, ce qui signifie la distribution basée sur les prévisions de l'offre et de la demande. Cette idée devient mystérieuse et le contenu de base est également très simple: commande / pilotes dans la même zone. 3. Ordre continu Sur la base de la prévision des dépôts d'approvisionnement et de demande, il est très significatif, nHung dû à la prévision de l'incertitude, il est vraiment efficace qu'il soit difficile de s'assurer. À cette fin, nous utilisons une méthode de prévision plus certaine utilisée pour exécuter le formulaire, ce qui signifie ordre de série. "Commande continue, attribuant la commande pour le conducteur de mettre fin au service, si l'extrémité du conducteur est très similaire à la position de la commande" , ] Contrairement à la distribution des commandes prédictives, le lien suivant est la position du pilote de ralenti. Étant donné que le conducteur de ralenti maximum est plus converti à la commande pour compléter la commande, la position du conducteur est devenue un problème relativement identifié, ce qui signifie suivi la distance et l'heure des pilotes à la destination. Lorsque le conducteur du service est très proche et que le point final est très proche du nouvel ordre du passager, il atteindra une logique de circulation unique. Une fois que le pilote met fin au service final, le pilote entrera immédiatement dans la commande.De nouvelles commandes, comprimez l'effet de temps de réponse de la distance de la commande et de la distance des pilotes. 4. Comment faire mieux Le noyau transmet l'avenir pour fournir une incertitude et des besoins futurs, de la modélisation structurelle de temps et d'espace dynamique, ainsi que l'incertitude de l'utilisateur comportement et maintenant nous utilisons actuellement des méthodes d'apprentissage profond pour modéliser les données de données et d'espace et notre temps; Comportement des utilisateurs. En outre, nos problèmes ont de nombreuses décisions combinées concernant les recommandations traditionnelles et nous devons distribuer les dernières ordres, nous sommes confrontés à chaque mission. Points ou popularité, maintenant, est toujours la future allocation et les problèmes donnés, ce problème peut modéliser pour améliorer les problèmes d'apprentissage et introduire actuellement une méthode d'apprentissage renforcée dans notre système pour optimiserRevenu plus long. Outre les problèmes de commande officiels mentionnés avant l'optimisation, l'ensemble du système de candidature est également confronté à un grand nombre d'autres défis, y compris comment utiliser la vitesse de nombreux types tels que la messagerie. Optimiser l'allocation optimale des classes, l'optimisation de l'utilisateur et l'ampli; Pilotes et amplis; Plate-forme à court terme, comment optimiser les rendez-vous et les amplis; Commande en temps réel, Comment évaluer l'algorithme sous scène avec des effets de réseau, si une personne est configurée des systèmes de simulation plus précis, etc sont à la fois des défis et un grand nombre de nouveaux problèmes redéfinis et des algorithmes créatifs chez quiconque à transporter. Quotidien, notre système d'application est confronté à des besoins de voiture pour plus de 30 millions d'utilisateurs, les pics P par minute reçoivent plus de 600 000 droits nécessaires, avec une moyenne de plusieurs centaines à des milliers de passagers et de soumission de la réglementationMontrer après deux secondes.Notre stratégie officielle actuelle est liée à la version stratégique officielle originale, la plupart des voyages ont besoin de plus d'un million de passagers. Pour beaucoup de gens peuvent jouer plus vite, déterminé à frapper dans la voiture, notre équipe de stratégie de négociation optimisera et écrasera constamment nos algorithmes de faction dans un meilleur sens, pour les passagers et l'ampli;Le pilote crée plus de valeurs

Sujets

Parler

Catégories

Apprentissage automatique