1. Introduction d'entreprise
Chasse en 2011. Il s'agit de la seule fondation de développement de carrière qui réalise l'interaction entre les entreprises, la trajugosité et les maisons de la gestion professionnelle. La chasse à la chasse se concentre toujours sur la création d'une plate-forme de développement de carrière avec l'expérience de l'utilisateur du gestionnaire est le noyau et compense pleinement le recrutement de réseaux traditionnels basés sur des plateformes de publication basées sur la publicité sur l'entreprise. Depuis avril 2016, la chasse compte plus de 28 millions de membres enregistrés, a purgé plus de 500 000 sociétés de qualité. Actuellement, plus de 250 000 têtes de tête recherchent des candidats aux ordinateurs principaux des plates-formes de chasse.
Depuis 2014, Hunting a créé un centre de développement de carrière mondial (GCDC) et sert également des entreprises et des demandeurs d'emploi. C'est un pont important qui interagit. Rôle. Contrairement aux autres entreprises de recrutement sur Internet, les points de chasse se concentrent surBesoins de recrutement moyen et avancé, tels que les gestionnaires d'entreprise moyenne et supérieurs, personnel professionnel et technique, V.V. Ces entreprises ont une demande relativement faible, mais le recrutement est élevé et le processus de recrutement est élevé. La chasse à la chasse clarifie sa marque positionnement de cette manière, gagnant la reconnaissance et la confiance des clients des entreprises. Après quelques années de développement, la chasse est une position de premier plan sur le marché dans le domaine du recrutement avancé et élargit activement d'autres segments.
Pour toute société de recrutement sur Internet, la bibliothèque de continuation du chercheur est un atout de base. Parce que c'est leur fondement. Seuls suffisamment d'enregistrements, permettant aux entreprises d'obtenir les talents nécessaires sur le site Web de continuer à des clients professionnels. Pour chasser, il diffère d'autres sociétés de recrutement sur Internet. Cela est dû aux besoins de recrutement avancés du positionnement de la chasse, aux exigences de la chasse pour fournir un CV fourni par les clients professionnelsP Avec un collier blanc de qualité, des travailleurs antiques blancs de haute classe et même un curriculum vitae. La vente de ressources en ressources est également la principale source de chasse. En termes de prix, les entreprises doivent payer des frais plus élevés pour acheter de telles vitables physiques; Et pour le reste de leurs dossiers, les entreprises n'ont besoin que de payer très peu coûteux. Par conséquent, le curriculum vitae est divisé en résolution en fonction des informations du curriculum. Répondre à une certaine norme (comme un certain revenu, une certaine mesure, V.V.), vous pouvez mener un programme d'études à la vente, appelé CV avancé; Et le reste du curriculum vitae est appelé curriculum utique blanc vitae. Hunt, comment obtenir un CV de haut niveau et devenir efficacement une partie importante de l'acquisition des utilisateurs.
Le moyen le plus important d'obtenir votre curriculum vitae est l'inscription en ligne. Demandeurs d'emploi sur la recherche de moteur de recherche, la navigation du site Web ou directement dans l'URL, V.V peut êtreInscription en ligne pour devenir un utilisateur de recrutement. Après les moteurs de recherche, la navigation Web et d'autres utilisateurs peuvent remplir des informations de base, telles que les entreprises, les emplacements actuels, V.V. - À ce stade, il est devenu un "projet de CV" - et même dans une expérience de travail complète et l'expérience finale de l'éducation formera un CV complet. Le principe des résultats du curriculum vitae ci-dessus doit avoir un résumé complet car, dans le processus de classement, en utilisant des informations dans le curriculum vitae, si le curriculum vitae est incomplet, le curriculum vitae ne sera pas évalué avec précision. Pendant le processus d'enregistrement, remplissez votre CV, certains utilisateurs ne sont pas forts s'ils recherchent un emploi, il peut ne pas améliorer les informations à la dernière étape, c'est-à-dire que son CV peut rester dans le projet de poursuite. Mais n'exclut pas une journée donnée à l'avenir, il peut venir améliorer le raisonnementVotre ch. Les curriculum vitae sont enregistrés quotidiennement et peuvent être remplis directement, pas un curriculum vitae instantané; Il n'est pas créé le même jour, mais le CV est créé dans l'histoire, s'il est renseigné dans la journée, il s'appelle un CV, cela s'appelle un CV. Le nombre de nouveaux enregistrements par jour comprend ces deux parties. Ces deux enregistrements correspondent vraiment à deux types de personnes: un demandeur d'emploi positif - Je suis très désireux de trouver un emploi, j'ai donc besoin d'avoir un CV à appliquer ou de quitter votre entreprise et de la recherche de top. Et ceux qui cherchent des emplois passifs, maintenant ne vous inquiétez pas du travail, je souhaite utiliser d'autres fonctions fournies par la chasse, telle que la fonction de chacun, vous n'avez pas à remplir le curriculum vitae plein ou que vous pouvez accumuler des personnes sur la plate-forme de chasse. et préparer pour l'avenir. Pour ces deux types de personnes, les KPI de base sont entourés de curriculum vitae et de diagrammes différents. Pour le premier type d'utilisateur, ePour le faire remplir un résumé plus, vous avez besoin de plus d'efforts dans la conception du produit et l'expérience utilisateur, ce qui permet aux utilisateurs de ne pas ressentir une devise vitae est une chose très encombrant, ce qui augmente donc le taux de conversion de reprise instantanée. Pour le deuxième type d'utilisateur, car il n'a pas besoin de se demander, l'impact de l'amélioration du produit n'est pas clair, mais utilise également une variété de façons de guider les utilisateurs, laissez-le remplir le calendrier du profil.
Cependant, par le biais du trafic gagné dans la chaîne en ligne, il devrait y avoir des coûts élevés, de manière à rechercher, vous devez maximiser l'utilisateur de vous inscrire en ligne pour remplir le calendrier complet du profil et continuer à récupérer Il est devenu un contenu important contenu. Il existe également de nombreuses façons de se retirer, notamment: des lettres système, EDM, des rappels SMS, V.V. Ces méthodes sont moins chères, mais parce qu'elles ne sont pas directement, l'effet n'est pas garanti. La meilleure façon d'effectuer est de diriger les utilisateurs à remplirCalendrier via un téléphone de formation professionnelle GCDC. Bien sûr, c'est le pire. Nous venons à compter des comptes: le coût de chaque téléphone via des consultants professionnels peut être approché comme fixe C. Après chaque téléphone qui passe, le CV de la recherche est remplacé à la place du projet de CV en tant que CV complet, cette probabilité doit être conforme aux nombreux effets. des facteurs peut être approximatif avec les constantes; La valeur de chaque CV complet est V (L), où L est le niveau de CV et V est une fonction ajoutée au niveau de résolution, et non difficile à calculer le revenu de la chasse. Étant donné que C et P sont fixes, Y et V (L) ont une corrélation positive, une corrélation positive avec L. Niveau de résolution simultanément, en raison de chaque nombre de nouveaux brouillons du ciel. Les consultants professionnels ne peuvent même pas courir ce temps à une autre fois. Cela nous oblige également à diviser le projet de curriculum, trouvez un CV CVLe projet de CV dans le prélèvement continu - une capacité supérieure est élevée. Continuer le niveau - Récupérer la priorité.
Obtenez continuellement de nouveaux utilisateurs enregistrés, de haute qualité et de curriculum vitae, un modèle commercial important pour chasser l'affaire importante. L'utilisateur principal est la chasse à l'application client et à l'application client mobile. Lorsque chaque nouvel utilisateur enregistre dans le réseau de connexion de connexion, vous devez d'abord entrer les informations de carte de visite personnelles (Figure 1-A). Après avoir rempli, vous pouvez compléter les informations de reprise (Figure 1-B). Toutefois, grâce à l'analyse des données, nous constatons que de nombreux utilisateurs n'ont pas encore entré la page continuer à compléter la page complète pour continuer après la remplissage des informations de la carte. Rappelez-vous que cette partie utilisateur est une partie importante de l'acquisition de l'utilisateur. Cependant, les utilisateurs qui ont enregistré quotidiennement quotidiennement sont des dizaines de milliers de personnes avec des types limités de types et de coûts limités, des travaux de récupération téléphoniquePeut être couvert pour tous les utilisateurs et le ratio d'entrée de la récupération de téléphone aveugle est faible. Si vous pouvez obtenir des rappels priorisés pour les utilisateurs avancés, vous pouvez améliorer considérablement votre carrière et votre accès à l'efficacité du travail.
Deuxièmement, description des données
1. Collecte de données
Données de formation au modèle principalement à partir de trois tableaux - ISER_C, User_register et Res_user. Le tableau User_C stocke principalement des informations sur la carte de visite des utilisateurs; User_register stocke les informations d'enregistrement des utilisateurs; Res_user stocke des informations continue les utilisateurs. De ces trois tables, nous extrayons les cartes de visite et les informations de classement des utilisateurs. (Lettre et lettre correspondante des tables - 1)
Délai de création de données: mai 2014 ~ mai 2015. Au cours de cette période, les utilisateurs et les modèles d'enregistrement sont inchangés.
2, Nettoyage des données
Le jeu de données de formation technique de construction est une conditionPrérequis pour transmettre de bonnes performances de modèles prévisibles. À cette fin, nous avons déployé les étapes de nettoyage des données suivantes:
Supprimer l'enregistrementCertaines informations répétitives existeront dans la base de données en raison de certaines raisons techniques. À cette fin, les premières informations de répétition sont nécessaires pour s'assurer que chaque ID utilisateur apparaît une fois dans le jeu de données;
Supprimer des échantillons contenant des informations non validesL'authenticité des informations de la carte de visite est basée sur des algorithmes de modélisation (cartes) L'algorithme de base du système -ter est K-nn, voyant plus tard, il est très important. Toutefois, pour un certain nombre de raisons, certains gestionnaires peuvent remplir des informations de cartes de visite non valides et que cette affaire sera considérée comme supprimée des données de bruit. À l'heure actuelle, notre stratégie de jugement sur les informations sur les cartes de visite repose principalement sur les connaissances, la loi et les règlements de la région et localiser les produits de la société. Les principaux critères de jugement sont les suivants:
1) Âge d'informationP diminue en dessous de 16 ans, pour des informations de carte de visite non valides. Comme stipulé à l'article 15 du droit du travail de la République populaire de Chine, l'interdiction des mineurs interdit de 106 ans;2) L'âge des hommes de plus de 60 ans, des femmes de plus de 55 ans, par exemple, il est défini comme un échantillon non valide. Sur la base des mesures temporaires des Vikings pour une demande d'invalidité du Conseil d'État et des mesures temporaires sur la retraite et la retraite de la retraite de la retraite (GUOFA [1978] n ° 104);
3) L'âge du travail n'est pas de deux ans, mais remplissez des fonctions avancées (telles que PDG, présidents, V.V.) dans la section Fonction et il est également défini comme des informations non valides. La base de cette méthode est basée sur l'habituel. En situation réelle, ces informations peuvent être vraies. Si vous enregistrez les utilisateurs ou héritez aux dirigeants principaux des entreprises familiales. Cependant, d'une part, ces conditions ne sont pas génériques; D'autre part, l'objet de service principal de Hunt est un directeur principal, THAY pour deux types de personnes.La plus tard, à la proportion d'utilisateurs de bas niveau et de bas niveau dans le nouvel utilisateur continue de continuer, de mai à mai 2014, 1000 utilisateurs sont sélectionnés au hasard chaque mois. Enfin gagné un total de 12 000 enregistrements d'utilisateurs à partir de 12 mois.
3, Caractéristiques techniques
Sélection de la fonctionnalité
La sélection des caractéristiques basées sur la base principale des entreprises.
1) "Industrie" n'est pas une caractéristique opérationnelle: premièrement, selon l'analyse statistique pré-données, l'industrie elle-même n'affecte pas le niveau de l'utilisateur; Deuxièmement, dans le système de chasse dans les 13 industries principales. Si la fonctionnalité est caractérisée, il est difficile d'effectuer une manipulation quantitative. "Industrie" est un hôtel incertain et des pratiques traditionnelles sont mappées jusqu'à 13 vecteurs de caractéristiques binaires, puis la taille augmente de 7 à 20. Cela apportera des problèmes clairsemésDonnées. (Surtout pour les algorithmes K-nn, il aura un impact négatif sur la précision prévisible);
2) Options d'âge et d'âge de travailler: Les deux personnes présentent souvent une corrélation positive significative, toutefois, la corrélation n'est pas grande (RHO ≈0.7). Notre compréhension est l'âge de fonctionnement utilisé comme caractéristiques dérivés, qui seront affectés par l'âge et l'éducation. Bien que l'âge soit important et que l'âge est étroitement lié, il est étroitement lié à la taille de l'échantillon. Le niveau d'éducation a une corrélation négative. Le traitement de l'éducation quantitative sera lié à de nouveaux problèmes, ce qui compliquera les caractéristiques; Simplifié, nous verrons deux caractéristiques;
3) Fonctions et emplacements de traitement: car deux fonctionnalités sont décrites dans le même aspect de l'utilisateur, nous l'utiliserons comme un traitement similaire. Dans l'expérience, nous avons constaté que lorsque l'utilisateur enregistré ne trouve pas le nom avec votre nom de fonction actuel dans les fonctions, je mailSélectionnez l'option "Autre" dans la section Fonction, puis remplissez le nom de la position dans la position actuelle. À cet égard, nous utilisons un certain nombre de technologies de traitement des langues naturelles (telles que la similitude du nom de position et le nom de la fonction calculé) pour identifier les fonctions utilisateur.
Traitement de traitement
K-nn est un algorithme d'apprentissage de la machine impliqué dans le calcul de la distance et de la distance est calculé directement pour déterminer la performance de la performance du paradigme. Les propriétés internes de la fonctionnalité sont différentes, déterminent que leurs différences de mesure peuvent être mesurées et ordonnées, des caractéristiques différentes sont nécessaires.
1) Traitement Binirisation L'attribut non mesurable: L'attribut sexiste entrave et il est difficile d'atteindre séquentiellement. Par conséquent, nous ferons mapper deux fonctionnalités - "Est-ce masculin" et "Que ce soit une femme". Chaque fonctionnalité est définie sur des propriétés binaires (→ 1; non → 0);
2) Manipulation des caractéristiques individuelles peutMesure: Si nous suivons la ville en fonction de la première ligne, le lundi, les trois-bizarre de trois lignes sont divisés en trois niveaux de nombres; La société est située est étranger, inscrite dans le pays, incapable d'utiliser trois niveaux, la même approche est également utilisée dans les caractéristiques académiques et les caractéristiques de localisation;
,
]
.
,
. . . , , 3) Traitement séparé des caractéristiques continues: Nous choisirons quelques points le nombre à l'âge de l'âge et de l'âge de travail discret, plus l'âge (l'âge de fonctionnement) est élevé, plus la valeur de l'installation est élevée. (À droite, les deux sont des caractéristiques distinctes; Cependant, en raison de leur proximité de nature, une discrimination supplémentaire et un traitement ordonné, donc cFan me appelle des fonctionnalités continues) À ce stade, nous devons déterminer les 8 caractéristiques suivantes: Genre (homme, femme), année de naissance, année de début de travail, les plus hautes études, fonctions, actuelles entreprises travaillant actuellement dans la ville. Après normalisation des caractéristiques pertinentes de chaque carte de visite, il est utilisé pour analyser le modèle suivant. Troisièmement, la modélisation des données 1, Paramètres du modèle Examen complet des caractéristiques de l'entreprise auront choisi une méthode de tri basée sur la stratégie mixte: k- Nid Algorithm + Règles de filtrage. [ K-à proximité (K-nn) est une méthode de surveillance couramment utilisée. Son idée de base est la suivante: objets similaires avec le même type ou types similaires. Si un objet a une lacune dans l'espace des fonctionnalités, la plupart des modèles d'entraînement similaires appartiennent à une catégorie, l'objet peut alors être déterminé qu'il appartient à ce catalogue. Dans ce projet, nous avons choisi K-NN principalement basé sur la considération suivante: 1) Le mécanisme de travail K-NN est très simple, les coûts de formation sont faibles: K-nn comme un représentant célèbre de paresseux paresseux paresseux , il n'y a pas de processus d'apprentissage clair et la phase de formation n'est enregistrée que. Ceci est plus efficace que les algorithmes d'apprentissage automatique (tels que l'apprentissage profond) nécessitant une formation à grande échelle; 2) K-nn a une bonne performance: K-NN Bien que simple, il existe une étude théorique que son taux d'erreur générale ne dépasse pas les taux d'erreur doubles de la classification optimale des baies; 3) Taille de données faible et dense: Nous avons les fonctionnalités disponibles des données seulement 8, ce qui évite beaucoup de données clairsemées sur des données régulières face souvent dans le domaine de l'apprentissage de la machine. Par conséquent, l'utilisation d'algorithmes K-nn basées sur l'apprentissage de l'échantillon peut répondre aux besoins de l'entreprise; 4) Explication et bonne flexibilité: Peut être facilement utilisé avec K-nn par échantillon est une valeur de probabilité qui appartient à une personneJ'utilise avancé et arrangez-le en fonction de la taille. Le département GCDC n'a besoin que de composer en ordre élevé bas. Lorsqu'il est modélisé, nous 600 dans la version utilisateur avancée / habituelle comme exemple de formation. Pour chaque nouvelle version, calculez la distance européenne par rapport à chaque cas d'entraînement, sélectionnez le boîtier K le plus proche (sélectionnez la valeur K la plus proche), utilisez la stratégie «La plupart des votes», calculez le nouveau modèle appartient aux capacités de l'utilisateur (points de 1 ~ 100 points) et organiser des utilisateurs selon des scores, devraient être fournis aux utilisateurs pour obtenir une référence importante pour la politique de révocation. du processus de calcul ci-dessus. Nous savons que pour chaque nouvel exemple, K-NN doit calculer la distance de chaque modèle de formation. Si le nombre d'échantillons de formation importants, l'étape de calcul est consommée et la mémoire est consommée. Pour améliorer l'efficacité de la partition, nous avons introduit un mécanisme de «filtre à bas niveau basé sur des règles». Du point de vue des affaires, le produit principal à la chasse est un talent de qualité supérieure. Par conséquent, les cadres supérieurs sont un objet de service d'introduction d'une chasse. À cette fin, nous avons construit un "dictionnaire populaire de bas niveau" (tel que "triché", "pilotes", "serveur", v.v.). Si un nouveau modèle du nom de localisation existe dans le dictionnaire d'emplacement, il est reconnu directement à 0 point sans avoir à entrer le lien de calcul associé de l'algorithme K-nn, de manière efficace que considérablement. Dans le même temps, la précision peut également être améliorée. 2, les résultats de l'évaluation du modèle car la quantité de données n'est pas grande, le réglage du modèle est effectué sur l'ordinateur de bureau. Le calcul de chaque échantillon est de 0,07. Nous dessinons ROC pour évaluer l'efficacité de la carte. Les utilisateurs qui reçoivent le groupe auront différents seuils pour rappeler différents seuils de scores ainsi que leurs propres entreprises. 4, PDéclaration d'entreprise Système interne ERP a attribué un consultant professionnel au GCDC tous les jours, le conseil professionnel rappelle le plan d'appel. La génération logique à appeler le plan est la règle spécifiée par le manuel, telle que le tri par industrie, région, V.V. Après le projet de modèle de classification sur la route, le projet de profil des candidats à haute priorité est calculé quotidiennement à partir du groupe de données hors ligne et est arrangé de haut à basse en fonction de la capacité. Le groupe ERP a tiré des données relatives à la plate-forme de données quotidienne et crée un paquet d'accès à distance, en appuyant directement les résultats du calcul du modèle pour le consultant professionnel de GCDC, le processus de conseil professionnel intégré. Au cours du processus de mise en œuvre, une classification est effectuée et seul un certain débit de données dans le package de numérotation d'origine est un modèle du groupe de données. Pour la section créée par le groupe de données, surveillez le suivi, effet d'observation. Et augmenter progressivement ce taux, et finalement remplacé les règles de la planification à traversY vieux numéro. Le modèle commence en ligne depuis décembre 2015. En janvier 2016, le ratio de CV commercial a été mobilisé de 51% à 78% et en mars 2016, le taux de commerce d'amour a été porté à 95%, pour les entreprises qui ont apporté une amélioration de la valeur effective. V. Discussion sommaire À partir de l'effet d'application actuel, le système de classification automatique de la carte de visite a obtenu des résultats satisfaisants. Pour améliorer encore l'effet, complétez la fonction de classification d'une carte de visite plus forte, nous envisageons de suivre les travaux des trois aspects suivants: 1, essayez le nouvel algorithme de prédire des particules fines dans les affaires de chasse, utilisateurs avoir 5 niveaux. Le système de notation de la carte de visite actuelle les transformera en numéros de deux couches. Ce qui est nécessaire pour atteindre cinq prévisions de niveau, toujours face à un grand défi. Nous pouvons envisager d'utiliser une régression ordonnée (ordre de régression) pour prédire le niveau utilisateur. De plus, des algorithmes intégrés (tels que des forêts aléatoiresUne amélioration de gradient) est largement préoccupée par ses excellentes performances. Nous prévoyons également d'essayer d'utiliser ce type de méthode pour explorer des tests d'exploration afin d'améliorer encore la précision prédictive du modèle; 2, concevoir de nombreuses autres fonctionnalités Nouveau comportement d'enregistrement des utilisateurs contenant des informations importantes liées à son niveau utilisateur, sans délai d'inscription, continuez l'intégrité. Dans le prochain travail, nous allons essayer d'explorer ces données comportementales. 3, résoudre le manque de problèmes Une hypothèse de base que notre modèle est utilisé comme utilisateur remplissant toutes les informations de la carte de visite. Cependant, la situation réelle consiste à avoir une proportion importante de nouveaux utilisateurs à enregistrer sans remplir des informations fonctionnelles et des informations sur la ville. Cela conduit à beaucoup d'utilisateurs avancés, car il n'y a pas assez d'informations et de scores dans le système de points très bas. À cet égard, nous avons aussi cDes efforts supplémentaires sont nécessaires dans la conception de produits, l'opération, V.V.