Une structure
- Données fournit des informations. La limite supérieure de l'algorithme de décision de données
- L'algorithme fournit une logique. D'autre part, des données pour excaver les informations disponibles, de l'autre côté, la logique est fournie et la recommandation de la stratégie d'exécution de l'architecture
- est mise en œuvre conformément aux caractéristiques des nouvelles données. L'architecture garantit l'automatisation du processus recommandé, y compris l'acceptation des demandes utilisateur, la collecte, le traitement, les données d'utilisateur de stockage, l'exécution d'un algorithme de recommandation, de retour à des recommandations. L'architecture assure une exécution en temps réel et automatisée du système. Deuxièmement, le cadre global
- Vente chaude Récupération: Rappelez-vous le contenu chaud dans une période de temps.
- Rappel de collaboration: sur la base de la similitude des utilisateurs et des comportements, on constate que les passe-temps potentiels des utilisateurs. Rappel de la balise: Selon le comportement de l'utilisateur, créez l'étiquette et rappelez le contenu en fonction de l'étiquette.
- Rappel de temps: Rappelant le dernier contenu dans une période de temps, commun dans le domaine des nouvelles, de la vidéo, etc.
- Modèle de fragmentation
- Différentes catégories du modèle Principe de base du modèle de moulage Établir un échantillon L'échantillon exposé et cliqué comme un échantillon positif, des échantillons exposés mais non spécifiés comme échantillons négatifs. Ingénierie caractéristique Le sens de la construction de caractéristiques est principalement divisé en: données de base, données de tendance, données de temps, données croisées. Différentes passages peuvent obtenir différents paramètres. Sixième, la norme de mesure de l'algorithme
comprend principalement les modules suivants: - Protocole de planification: Demande de transmission et résultats des résultats. - Algorithme recommandé: générer le résultat de la recommandation finale comme une certaine logique. - File d'attente de messages: rapport et traitement des données. - Unité de stockage: Différents types de données sont stockés dans différentes unités de stockage, tels que le type K-V stocké dans MySQL et les données en temps réel sont stockées dans REDIS et des données sont nécessaires pour être stockées statistiquement dans TDW.
Troisièmement, portrait de l'utilisateur
3.1 Étiquette utilisateur
La balise est une fonctionnalité plus représentative.3.2 Classification de l'image du port utilisateur
1. Données d'origine Les données d'origine comprennent quatre aspects - Données utilisateur: Données liées aux données de contenu utilisateur: Utilisateur Publié, Vue Contenu, mot-clé de liaison, étiquette, etc. - Connexion du comportement de l'utilisateur: opération interactive de l'utilisateur effectuée sur le contenu - Données externes: données introduites dans d'autres systèmes2. Étiquette de fait
peut être divisé en statique Portraits et portraits dynamiques. - Portrait statique: L'utilisateur est indépendant de l'attribut en dehors de la scène de produits, l'information est stable et a une signification statistique. - Portrait dynamique: comportement explicite ou comportement implicite généré par l'utilisateur dans la scène spécifique. - Comportement explicite: Préférences expresses, telles que le point, le partage, l'inquiétude, les scores directs et les commentaires. - Comportement implicite: il n'y a aucune préférence à exprimer, mais en cliquant sur, rester du temps et d'autres formes.
3. Tag Modèle L'étiquette de modèle est obtenue par l'étiquette de fait en pondérant le calcul ou l'analyse de grappes, et la balise d'usinage présente une information plus élevée et une meilleure recommandation. - Analyse du cluster: Par exemple, l'utilisateur est divisé en groupes de niveaux actifs différents. - Calcul pondéré: Par exemple, le comportement de l'utilisateur est pondéré avec l'étiquette pour obtenir le score de chaque balise.Quatre Portrait d'environnement: quand recommandé pour le progrèsIl est également important dans le contexte, l'emplacement et la navigation. Le contenu et les scènes recommandés peuvent être divisés en:
5.1 Processus d'algorithme recommandé
L'essence de l'algorithme recommandé est une sorte d'information de l'utilisateur et du contenu, donnez des recommandations conformément à certaines logiques. Le classement thermique est la méthode la plus simple, sa logique est qu'un contenu est comme la plupart des utilisateurs, puis la probabilité que d'autres utilisateurs l'apprécieront. Mais les recommandations personnalisées sont plus complexes, une logique fine. Les algorithmes recommandés sont principalement divisés en étapes suivantes; - Filtrage: pour les zones où le contenu ne peut être réduit, tel que des nouvelles relativement fortes en temps réel, avant l'exposition de l'utilisateur et cliquée, elle ne sera pas repoussée à l'utilisateur. - Confluence: Trier par rappel et filtrage, poussez le contenu à 100 niveaux et poussé dans l'ordre. - Mélange: Pour éviter le contenu, le plus étroit est poussé, les résultats obtenus seront modifiés, par exemple, de contrôler un certain type de fréquence. - règles fortes: modifications basées sur des règles commerciales, telles que placer des articles lorsqu'ils sont actifs
Objectif: lorsque la quantité d'utilisateur et de contenu est grande, afin de réduire la quantité de calcul, il est nécessaire d'effectuer une projection préliminaire du contenu, telle que Dépiliation d'une section proche. La teneur en temps chaud est alors recommandée.
Importance: le contenu du rappel est le fondement du gaufrage. Si les résultats du rappel ne sont pas idéaux, l'arrangement difficile n'a pas de sens.- Méthode: Stratégie de rappel est le complément mutuel de différentes méthodes.
Indicateurs durs: tels que le taux de clic des recommandations, mais l'indicateur le seul dur produira une faible teneur en contenu, le titre du titre.
Index logiciel: En plus de la valeur autre que le clic, telle que la diversité, la robustesse, etc.