Ouvrez une nouvelle série: algorithmes de classement, parlez d'abord des évaluations des utilisateurs.
Du film "Réseau social" ci-dessous, la recette sur le verre est l'algorithme de classement Elo et le résultat du point de comparaison peut être quantifié selon le ratio, les points des filles, C'est l'algorithme qui est actuellement utilisé principalement dans les jeux de guerre. Cet algorithme, nous n'introduisons pas, les amis intéressés peuvent aller à des informations relatives à la recherche de réseau.
D'abord, je mets une définition simple des algorithmes d'évaluation: l'algorithme d'évaluation consiste à évaluer un certain type de corps en calculant les données existantes, ainsi faire une évaluation, une évaluation et une gestion d'une classe de cours. Dans l'exemple mentionné ci-dessus, l'objet est enregistré comme apparence de l'université et les données sont le score de l'utilisateur.
Dans l'Internet actuel, le produit est connecté aux utilisateurs, aux biens, au contenu, aux services et aux serveurs, chaque type de corps a beaucoup de donnéesEt le score est pratique pour d'autres rôles d'unifier ces entités. Parallèlement, le rôle des distributeurs, des conducteurs, des enseignants, des services à la clientèle et des ventes ont obtenu une allocation automatique, utilisez des scores pour quantifier et visualiser ces rôles et profiter également à ces rôles. les rôles.
Prenez un taxi dans la matinée, si vous donnez un juge, cet examen sera inclus dans le service du conducteur, affectant la déclaration et les revenus du conducteur. Je prévois d'apporter un plat à midi, vous avez ouvert le groupe américain, voyez le point d'affaires et avez finalement choisi votre emporter. Je prévois de regarder un film le soir, allumez le score de film Duban, j'ai choisi un film qui a marqué un bon film. En tant que consommateurs, le score n'affecte pas vraiment notre choix de consommation et nos scores sont également devenus une source de données pour le système de points internes de la société de négociation.
Le système de consommation de points est relativement simple et seuls les utilisateurs frappentCe prix unique de la source de données et le système Point interne doivent envisager davantage de facteurs. À cet égard, le score du consommateur sera enregistré au cours de cette période.
Sur la base de la stratégie visant à organiser des examens d'utilisateurs, il sera confronté à un problème où le nombre de points de contenu différent est trop important. Par exemple, les livres A ont 100 personnes, le score moyen des livres de 4,5 et B a 5 personnes, le score moyen est de 4,6 points, tandis que le score moyen de la gare est de 3,0 points, puis nous devrions introduire des personnes comment utiliser? La première idée est d'effectuer un certain niveau de réduction des données, telle que l'utilisation de la fonction de libération de confiance simple suivante:
Classement = N / (N + X) · Points
N est le score, le score est la valeur d'évaluation initiale, X est le paramètre réglable. Lorsque X est défini sur 5, la fonction est
Classement = N / (N + 5) · Après le DOWPOST, le score du livre est de 4,29. Le score de B livre est de 2,3 et le score d'un livre est relativement raisonnable, commeG book B est beaucoup plus bas que la note d'origine 4.6. Il est inférieur à la moyenne de la station entière, ce qui peut être vu que cette méthode a une inhibition majeure du contenu de la quantité de données. Ce problème peut éviter d'utiliser la méthode moyenne de Bayésien, qui est la deuxième idée.
La formule bayésienne est un outil de base de la statistique, qui peut être utilisé comme base pour de nombreuses conceptions stratégiques. Ou utilisez cet exemple pour introduire le principe, c'est-à-dire lorsque le contenu n'a pas ou seulement quelques scores, vous pouvez d'abord penser que ce point de contenu et le point moyen de la plupart du même contenu sont les mêmes, seulement Lorsque les scores sont beaucoup et plus vous pouvez obtenir des points de ce contenu. La formule moyenne des baies est la suivante, dans laquelle la moyenne représente la moyenne de la station entière.
Classement = x / (n + x) · Moyen + N / (N + X) · Points
Vraiment x est 5, toute la station est divisée en 3.0, puis Le point d'un livre est 4,42,Et le score de B livre est 3.8. Les points de livres B sont plus élevés que la méthode de relief et supérieure à la moyenne de la station entière, relativement raisonnable.
Dans certaines scènes, si vous souhaitez évaluer moins de contenu qui apparaît plus tard, la méthode de réduction de la confiance est appliquée beaucoup par rapport à la méthode moyenne des baies; Lorsque vous contactez, la méthode moyenne des baies est appliquée davantage pour comparer le niveau de fiabilité.
Bien sûr, la méthode de réglage ci-dessus ne semble pas avoir de mathématiques strictes, alors il n'y a pas d'algorithme plus strict? La réponse est sûre. Personnellement, je me sens plus fiable que d'utiliser Wilson autour.
La section Wilson peut fournir un intervalle de confiance de la probabilité de points en cas de fiabilité fixe. En général, l'intervalle Wilson convient aux variables. Par exemple: Si l'utilisateur clique sur la vidéo, les images, les annonces, p est la probabilité du clic de l'utilisateur, n est le nombre de statistiques, Z est fourni pour un tNuméros de confiance fixes, une valeur couramment utilisée, 90% de confiance en Z = 1,64, 95% de fiabilité Z = 1,96, 99% de la confiance Z = 2,58, d'autres peuvent être compatibles. Sous le paysage, ce que vous devez faire est un moyen de normalisation moyen des moyens P, tels que 3.5, 5 points complets, puis 3.5 / 5 = 0,7. Dans le même temps, n obtenir le nombre de personnes, Z a été des paramètres confiants.
Les avantages de la période de Wilson sont très divers. La première est des statistiques raisonnables, quelle que soit la taille des données, des expressions mathématiques cohérentes. Deuxièmement, avoir son sens d'affaires en hausse et en bas pendant la période]
En cas de petites données, des moyens de données non autorisés. Pour les entreprises, certaines scènes dont ils ont besoin sont la limite supérieure des données, certaines scènes dont ils ont besoin. C'est la limite inférieure des données.
Exemple: Dans la politique d'arrangement, lorsque nous souhaitons fournir un contenu de trafic plus long, vous pouvez utiliser la limite de circulation.Lorsque nous voulons mettre en évidence le contenu chaud, vous pouvez utiliser la liaison ci-dessous.
Par exemple, dans la stratégie publicitaire, lorsque nous voulons désactiver l'annonce de la CPA trop élevée, nous devons utiliser des limites inférieures lorsque nous souhaitons désactiver les annonces de frappe inférieure, vous devez utiliser la limite supérieure du taux de clic. Parce que nous devons fournir de nouvelles annonces plus d'espace expérimental.
Bien entendu, la nature de l'algorithme d'intervalles de Wilson fournit une méthode de contrôle de la teneur en matière de données importante et de contenu de petites données, une portée d'application illimitée et des "petites données non enregistrées" est un problème courant de un grand nombre de systèmes stratégiques.
Le contenu de ce problème se termine et la prochaine étape de notre algorithme de talents est une autre scène, point de service.