Le 9 janvier, la Journée de la formation des architectes a eu lieu par Qi Niunyun - Eye E-commerce: Développé à partir d'architecture au système de salon spécial Wang Special Wang, l'architecte n ° 1 du magasin, a répondu à chaque question. Voici son profil de discours.
Avant d'ouvrir, je veux citer une phrase de Van Gogh: "Je tiens à souligner que la même personne avec plusieurs portraits de auto-capture. Poursuivre des similitudes similaires mieux mieux découvrir les mêmes choses. La photo Vous trouverez ci-dessous le portrait de Van Gogh fier, portant une cagoule, portant un costume, mais l'oreille a été coupée. Je pense être une architecture bonne professeure, doit avoir l'esprit d'artiste. Le temps à l'architecture aujourd'hui a beaucoup changé, le La nouvelle langue apparaît continuellement, je ne pense pas qu'il n'y a pas besoin de penser à un certain aspect
Définition du portraitUtilisateurs
Supposons que le portrait de l'utilisateur actuel soit nommé, attribut géographique, comment allez-vous l'utiliser? L'analyse la plus simple de différents groupes de genre et effectuer un marketing spécifique. Analyser les caractéristiques du groupe de Guangzhou, de Beijing, des clients et d'analyser les caractéristiques du groupe de 90 et 80. AshEn fait, il y a un point commun ici, c'est-à-dire classé et regroupement. Jingdong est également bon, Taobao est bon, le magasin n ° 1 est bon, je ne peux vraiment pas construire un plan proposé, nous divisons tous les gens en 10 000 classes ou mille classes, nous vous avons divisé dans un catalogue, donnons une proposition dans cette catégorie. De plus, les caractéristiques de groupe reflètent souvent vos préférences personnelles, c'est-à-dire qu'il existe un point commun entre les personnes et les personnes.
Classification - Cluster: Prendre une première étape personnalisée, le portrait d'application de l'utilisateur commence
Numéro 1 Stockez votre propre système de portrait d'utilisateur de 0, y compris le portrait de l'étiquette de l'utilisateur, portrait prioritaire de l'utilisateur. Après avoir expérimenté une série de portraits, des versions de tempête de portrait en temps réel, des portraits d'étiquettes d'utilisateurs de commerce électronique, etc. Evolution et le processus idéal. Pendant deux ans, le goulot d'étranglement est une performance, évaluant la qualité des données, l'expansion des étiquettes utilisateur, des portraits de scripts d'application de marketing précis, étape par étape, jouant un rôle énorme dans l'offre système.
Portrait de l'étiquette de l'utilisateur
Nous avons rencontré deux défis au cours de la période suivante:
1,00 million de portraits et applications de pratique
] 2. enregistrer et stocker des portraits de milliards, de soutien et de stockage Développez la taille et les intérêts, mettre à jour la millisecing, les recommandations de qualité de la qualité, la publicité, le marketing raffiné, etc.
]
.
.
1. Modèle de portrait de l'utilisateur Priorité continue 2. Introduction aux tempêtes et autres technologies en temps réel 3. Étiquettes de sujets recommandés, entité de nom d'utilisateur, etc... Portrait Étiquettes supplémentaires Nouveau 4.hbase séparé hors ligne et en ligne, lire une sérieKV et lire la série HBASE SOLR, points d'accès de la zone de surveillance 5. Stream de données en continu 6. Améliorer le stockage des données La première version du statut de portrait Les options comprennent deux parties: 2 pièces pour une priorité des options de priorité et une fée de la fée de la priorité des appels d'interface système prioritaire atteignent des dizaines de millions par jour, portant principalement des champs proposés et EMD, mais le système prioritaire a changé de faible performance. Problèmes de priorité déraisonnable Points de priorité: 1. Exécutez toute la mise à jour des données trop lentement 2. Distribution des données de priorité utilisateur est déraisonnable et le score multiplie la distribution et 6,0, 8,0 points de près de 0 3. Seuil des utilisateurs d'intérêts solides et de faibles préférences sans réglementation importante 4. Les utilisateurs ne créent pas de nouveaux comportements et les points d'intérêt intéressés ne changeront pas (diminution à l'époque) [ Nouveau processus système d'image C'est très simple, c'est-à-dire que tout le monde peut penser hors ligne et en ligne, hors ligne, qui sera basé sur l'utilisateur, le comportement de pin Les nouvelles du produit sont le point, afin d'obtenir des préférences personnelles,le front fournit une interface, fondamentalement ceci. Optimisez le modèle d'image 1 L'introduction au modèle d'algorithme comporte certaines optimisations, la première optimisation est des points, en exploitant sa priorité et plus d'historique que des actes. devrait être refusé. En supposant que vos points soient toujours empilés, c'est aussi un problème, car vous avez toutes les actions avant ou avant une année, si vous affectez toujours votre score, il ne sera pas précis, il y aura donc des scores de déclin historique. La distribution prioritaire doit être compatible avec la répartition du poids de l'utilisateur de l'objectif, la clé consiste à traiter les données et à ajuster votre modèle. Le point du portrait de fantaisie réagiraNG Trois Conditions: Plusieurs activités de la catégorie ou du guide d'achat, Score L'utilisateur Le niveau de priorité des catalogues ou des tutoriels de shopping peut être reflété dans le comportement historique de la partition Pour la priorité de la liste, les utilisateurs doivent avoir des tendances distinctes de la catégorie, le comportement le plus facile peut être divisé en deux fichiers "comme | général". Réglage du paramètre: L'installation du coefficient de déclin est satisfaite de la moitié du déclin (associée au cycle d'achat des utilisateurs dans différentes catégories, voir la prochaine Page) Rapport entre différents poids du comportement équivalent au rapport de différents actes d'utilisateurs Distribution de priorité doit correspondre à la répartition du poids de l'utilisateur de l'objectif . . ] . Optimiser les images 2 Ensuite, il y a un problème avec le cycle d'achat, c'est-à-dire qu'il y aura un cycle d'achat, tel que le dentifrice? Acheter, ces choses sont relativement fortes. Il y aura une recommandation en temps réel après le comportement de l'utilisateur et une recommandation en temps réel effectuée en fonction des préférences de chaque classe. Les étiquettes de sujets, telles que manger des marchandises, telles que les femmes qui comme des collations, sont considérées comme une série d'aliments. Il existe également des passagers pauvres numériques à travers ce sujet. Je ne parle pas beaucoup sur des méthodes spécifiques, il est classé par ce que vous avez acheté. La figure suivante est le cycle d'achat de différents types d'utilisateurs cibles. Card de la recommandation du sujet La relation de cartographie du sujet et de l'étiquette est la suivante: Prenez une liste de mots-clés dans la table d'étiquettes, associé au produit, les données de titre fournissent des cartes de produit. La formule de la carte de marchandises est la suivante: La formule de carte utilisateur est la suivante: HBase hors ligne et séparation en ligne Parler de HBASE, nous avons pris beaucoup de source ouverte. Je veux demander si vous avez un couvercle, vous ne pouvez obtenir que deux fonctionnalités. Ici, nous utilisons hors ligne et en ligne, lieu disponible. Comme indiqué ci-dessous. Sélection de séries SOLR SOLVE Nous avons également un mécanisme de sélection, une autre scène des portraits d'utilisateurs, car vous avez des personnes utilisant des informations utilisateur, puis d'autres entreprises, telles que la publicité Les affaires, telles que les entreprises promotionnelles, la fourniture de besoins, constituent une option, un centre de sélection à base de solr. Comme indiqué ci-dessous. Réglage des tables correspondantes, améliorant les performances de lecture et d'enregistrement selon CPoints chauds diaboliques, déplacez ou séparez chaque machine. Optimisation du flux de données Dans la lettre de GUID et ID utilisateur, filtrant des ordinateurs publics et des comptes de bovins d'or (200 000 personnes du pays pour brosser la chaîne de l'industrie uniquement). Pour continuer à améliorer le taux de calcul de la section hors ligne, le calcul de la virtualisation du poids comportemental de l'utilisateur peut également être augmenté: Placer l'historique des utilisateurs de comportement, WC est la dernière journée pour les utilisateurs total poids comportemental, poids comportemental total WT = λWh + WC, 0 & lt; λ & lt; 1 Si la méthode ci-dessus est utilisée, il n'est pas nécessaire de parcourir toutes les données comportementales de l'utilisateur. Chaque fois que vous mettez à jour, vous n'avez besoin que d'une journée de données. Stockage des données Optimisé Comportement de l'utilisateur et statistiques comportementales de HBase remplacées par la ruche, la table de portrait finaleConserver dans HBASE. Considérant que l'utilisation de la polarité est plus fréquente, la priorité des attributs du guide d'achat est beaucoup plus grande que la priorité de la classe et la séparation sera stockée séparément. Structure de données hors connexion - HIVE Données filtrées Montant total Données de filtre Tout ce qui est la quantité totale de données est filtré hors ligne et la partie en ligne est importée, principalement optimisée comme optimisation de modèle. Principes de filtrage: Le nombre d'options par utilisateur est inférieur à une valeur fixe Le point de priorité de l'utilisateur est supérieur à la limite inférieure, ce qui peut être supposé que l'utilisateur n'a qu'un seul oignon en taxi dans certains Types, puis apportez dans le modèle anti-poussoir de après avoir pris suffisamment de données hors ligne filtrées, la partie en ligne est introduite. Principe de filtrage: options d'attribut supérieures à une limite sous un nombre fixe de moins de valeurs d'attribut que la tombeT Priorité de priorité de la priorité La valeur d'attribut ci-dessus est supérieure à une limite fixe fixe principalement optimisée et améliorée principalement optimisée et améliorée comme indiqué ci-dessous. Avantages à long terme et distincts de la cyrocité à court terme et des attributs de séparation prioritaire que nous voulions faire des portraits en temps réel, mais nous ne l'avons pas fait, nous avons présenté le temps vraiment, pourquoi ne pas faire ça? Étant donné que ces algorithmes ne sont pas bons, tels qu'un nombre de cycle de déclin, vous devez calculer les modifications de votre catégorie actuelle à 30 jours, vous devez prendre 30 jours de données, tels que l'algorithme très lourd. À l'avenir, il est d'utiliser un cluster double miroir HBASE, Apachelnite + HBase. Nous avons également fait des choses intéressantes, ce sont un certain nombre de classements, effectuant un certain nombre de classements universitaires, réellement basés sur des groupes universitaires spécifiques. Recommandé, c'est vraiment intéressant. Une certaine révélation 1. Raffinage des philosophies et des tuyauxVous connaissez la méthodologie de l'affaire (ou du projet). 2. La précision de la comptabilité, l'échelle de données, la vitesse de mise à jour, l'amélioration et d'autres indicateurs doivent être sacrifiées. 3. Un système a rencontré un temps de performance antique pour sauter le système lui-même, comprendre les entreprises, séparément en fonction de l'entreprise pour répondre à des scènes différentes. 4. Les flux de données peuvent être incorrects, automatiser les données intermédiaires de chaque nœud, considérant la dégradation et le retardement de l'environnement. 5. L'élaboration du système est un processus de systèmes à long terme et conjointement et de division de systèmes liés à la prévention des ressources de déchets architecturaux excessifs. 6. Lorsque différentes versions sont développées, changez certains développeurs, intégrez de nouvelles idées et évitez de penser. 7. La spécification de gestion du système d'étiquettes est plus importante que la technologie elle-même, sinon, la plupart des étiquettes dormiront et sont essentiellement inutilisées. 8. Les lecteurs de données, en observant et en étudiant les données, ont une certaine sensibilité àDonnées, créez de nouveaux portraits d'utilisateur.