Devrait organiser l'importance d'un système recommandé. Cet article combine principalement son travail réel et discute de certains problèmes intéressants pour créer un système de classification des recommandations de fil.
Du point de vue des ingénieurs d'algorithmes, construisant un système de classification de la recommandation de flux, faisant attention aux problèmes suivants:
Où est le mot Données? 2. Comment traiter les données?
3. Quel modèle est utilisé?4. Comment s'entraîner?
5. Comment prédire?Le problème ci-dessus est plus professionnel, et c'est comme suit:
Comment jouer des étiquettes?
2. Quelles caractéristiques utilisent?3. Quel algorithme est utilisé?
4. Comment déployer l'algorithme, comment former le modèle?5. Comment utiliser un modèle bien formé pour prédire?
La réponse brève est la suivante:
1. Demande de journalLes journaux comportementaux de l'utilisateur et de greffe d'échantillons reçoivent des échantillons
2. Caractéristiques de l'utilisateur, caractéristiques des postes, caractéristiques de contexte, autres fonctionnalités
3. Stratégie, modèles de modélisation, modèles d'apprentissage profond
4. Langage de programmation familier Plus Combinaison de plate-forme de goût
5. Développez la personnalisation ou utilisez des diagrammes open source en fonction du principe d'algorithme
Un peu spécifique:
1. Disposition de données de données attendue simultanément, démarrez le comportement du comportement du client rétro-éclairé, puis suivez l'unique. ID 2. Utilisateurs, articles, caractéristiques contextuelles Caractéristiques de base, caractéristiques artificielles ou utilisation d'algorithmes d'apprentissage3. LR, GDBT, FM, DNN, FM, DNN, Briser leur évolution
4. Selon le principe d'algorithme de déchirement ou à l'aide d'un cadre open source, basé sur une formation de grappes indépendante ou dispersée
5. Suivez l'algorithme déchiré déchiré, puis lisez de bons paramètres entraînés ou utilisez un cadre open source pour lire directement le modèle de formation
dans un exemple de l'application :
[Fonctions estimées Écrivez simultanément KAFKA:
A. Plus tard, le tampon, l'utilisateur cliquant sur les données rapportées de la racine dans la seule demande de Connectez
b. Données Offline Formation: Fonctions de données E-HDFS KAFKA EDFS, rapport de comportement de l'utilisateur HDFS Diary, au besoin ou user_id, doc_id à connecter OFFLINE2. Fonctionnalités Utilisateurs, Doc, Contexte, Caractéristiques manuelles partielles (intersection , etc.), discret:
a. Caractéristiques de la valeur continue: Viety, hachée dans la valeur INT64
b. Caractéristiques de la valeur unique discrète: hachage est la valeur INT64c. Discrete discrète multi-chaude: créez chaque valeur de hachage dans la valeur INT64, effectuez un fonctionnement brut lorsque la valeur est extraite de la fonctionnalité Server
3. A. FTRL, b. FM, C. intégré + MLP, d. Ftrl W Value + MLP:
a. Modèles linéaires, supportant des caractéristiques à grande échelle, des éléments de réglage, des mises à jour en ligne
B. Auto -us et apprendre le deuxième caractère croisé, la complexité informatique, le support pour récupérer et organiserc. Le projet est relativement complexe et l'impact des grands paramètres, la structure du modèle est flexible et efficace n'est pas bonne
d. Basé sur des modèles évolutifs, introduisant des modèles non linéaires, support
4. Distribution du processeur basé sur TENSORFLOW:
. ] sur TENSORFLOW, GPU ou plus de grappes GPU 5. C ++ et go Estimations personnalisées Croissance Une recommandation Il existe de nombreux systèmes liés au système, les services de données de base, les services de services, les services de paramètres, les modèles et les niveaux de politique sont des services de récupération, des services de commande Un service de filtre, peut être décrit comme une boucle, fourmisLa structure recommandée est bonne et mauvaise, affectant directement la recommandation générale.