La différence de troisième point: le modèle d'algorithme est différent
d'algorithmes communs utilisés par le gestionnaire de produits de données:
Il existe de nombreux algorithmes utilisés dans l'analyse des données, principalement pour résoudre la vérification et Déterminisme. L'algorithme du problème, par exemple: régression, trois algorithmes multi-classes, etc. Les algorithmes peuvent appartenir à des algorithmes d'analyse de données employés par des gestionnaires de produits de données.
1, modèle d'algorithme RFM
Le modèle RFM est un outil important et des moyens de mesure de la valeur client et de la rentabilité des clients.
2, Panier: Classification et arbre de régression
Chariot, Arbres de classification et de régression.
Il y a deux idées clés dans l'arbre de classification: le premier concerne l'idée de diviser récursivement l'espace auto-variable; la deuxième idée est d'utiliser des données de vérification pour marquer.
3, algorithme K-signifie
K-signifie algorithme d'algorithme est un algorithme de clustering qui divise n objets en k en fonction de leurs attributs divisés (K & LT; N).
Il est très similaire à l'algorithme d'attente maximum (article 5 de ces dix premiers algorithmes) qui gère la distribution normale mixte, car ils essaient tous de trouver le centre de la clustering naturel dans les données.
Il suppose que l'attribut d'objet provient de vecteurs spatiaux et la cible est de minimiser la somme des carrés moyens à l'intérieur de chaque groupe.
4, la règle d'association APIORI ALGORITHM
APIORI ALGORITHM est un algorithme d'excavation de règles relationnelles booléennes de règlements fréquents. Son noyau est un algorithme récursif basé sur une intersection de fréquence en deux étapes. La règle de cette association appartient à des règles d'association booléennes monocensionnelles, de couche unique. Ici, tous les supports plus importants que le support minimal sont appelés ensemble d'articles fréquents, appelés intersection.
5, machine de vecteur de support SVM
Supporte la machine de vecteur de support, l'anglais est la machine de vecteur de support, appelée machine SV (généralement appelée SVM dans le papier).
C'est un moyen de superviser l'apprentissage, qui est largement utilisé dans la classification statistique et l'analyse de la régression. Prise en charge de la carte vectorielle Le vecteur est mappé dans un espace dimensionnel supérieur et il y a un autre plan d'intervalle maximum dans cet espace. Deux super plans de super-parallèle sont construits dans le super plan des données séparées, séparéesL'avion optimise la distance entre les deux plans super-plans parallèles. Supposons que la distance ou l'écart entre le super plan parallèle est inférieur à l'erreur totale du classificateur. Un excellent guide est le "Guide de la machine de vecteur d'identification de mode" C.J.c BURGES. Van der Walt et Barnard comparent le vecteur de support et d'autres classificateurs.
6, l'algorithme de désiration maximale (EM)
7, algorithme Pagerank
PageRank est une partie importante de l'algorithme Google. Septembre 2001 a reçu des brevets américains, le brevet est une page Larry, l'un des fondateurs de Google. Par conséquent, la page de Pagerank ne fait pas référence au Web, mais à peler, c'est-à-dire que cette méthode de niveau est nommée page. PageRank mesure la valeur du site Web basée sur le nombre de sites Web et de la qualité du site Web et du nombre de liens internes.
Le concept de Pagerank est que chaque lien vers la page est un vote sur la page. Plus les liens sont liés, plus les personnes qui ont été votées par d'autres sites Web. C'est la soi-disant "Link Popularité" - Combien de personnes sont disposées à accrocher leurs sites Web et votre site Web. PageRank Ce concept est introduit dans les documents académiques - plus le nombre de fois cité par d'autres, plus l'autorité de ce document.
8, algorithme itératif adaboost
L'algorithme lui-même est mis en œuvre en modifiant la distribution de données, qui détermine chaque échantillon en fonction de la qualité de la classification de chaque échantillon, et la précision de la dernière classification globale consiste à déterminer chaque échantillon. Poids.
9, Autre modèle d'algorithme d'analyse de données
Les algorithmes communs utilisés par AI Les gestionnaires de produits sont les suivants:
(1) Modèle d'algorithme de réseau neuronal
Le réseau neuronal est un algorithme très important dans l'apprentissage de la machine. C'est l'algorithme de base de l'ensemble de l'étude de profondeur et l'apprentissage profond est un cas spécial d'application basé sur l'algorithme de réseau neuronal. Dans une certaine mesure, l'introduction de produits AI est de comprendre et d'utiliser l'algorithme de réseau de neurones.
(2) Apprentissage de modèle d'algorithme d'apprentissage de la machine
L'objet de l'apprentissage de la machine est: certaines données de la loi statistique.
L'apprentissage automatique peut être divisé en:
pour superviser la tâche d'apprentissage: modèle de formation des données de formation marquées. Principalement divisé en: tâches classées, tâches de régression et tâches d'étiquetage de séquence.
Tâches d'apprentissage non supervisées: données de formation des données de formation non marquées. Il est principalement divisé en: tâches de regroupement, tâches à l'époussetage. Tâches d'apprentissage de semi-particules: modèles de formation avec un grand nombre de données de formation non attribuées et une petite quantité de données marquées. Renforcement des tâches d'apprentissage: modèles de formation d'un grand nombre de connaissances interactives du système et de l'environnement.
Statistiques traditionnelles Apprentissage: Méthode d'apprentissage de la machine basée sur le modèle mathématique. Comprend SVM, régression logique, arbre de décision, etc.
Ce type d'algorithme est basé sur un raisonnement mathématique strict, présente une caractéristique d'une interprétabilité fiable et d'une exécution rapide et peut être appliquée à des ensembles de données à petite échelle.[12) (3) Apprentissage profond Dépendance
Apprentissage en profondeur: une méthode d'apprentissage mécanique basée sur un réseau neuronal. Comprend un réseau de neurones avantageux, un réseau de neurones convolutionnaires, un réseau de neurones récursifs, etc.Ce type d'algorithme est basé sur le réseau de neurones, sans précédent, fortement dépendant de l'échelle de jeu de données. Mais de tels algorithmes ont beaucoup de succès dans la langue, la langue visuelle, la langue naturelle et d'autres domaines.
Pas de théorème de déjeuner gratuit: NFL): Pour un algorithme d'apprentissage A, s'il est meilleur que l'algorithme B, il y a encore des problèmes, dans ces problèmes, mieux que A.
Réseau de neurones convolutionnaires, CNN) est un réseau de neurones en ligne, les neurones artificiels peuvent répondre aux environs de la couverture.Yuan, a d'excellentes performances pour un grand traitement d'image.
(5) RNN
Réseau de neurones récurrents: RNN) est un réseau neuronal. RNN simple est difficile de capturer des associations de temps à long terme car elle est incapable de gérer, il est difficile de capturer des associations de temps à long terme; tout en combinant différents LSTMS pouvant résoudre ce problème.
Le réseau neuronal de circulation de l'heure décrit le comportement de temps dynamique, car le réseau neuronal en ligne accepte des entrées différentes, et RNN sera distribué dans leur propre réseau. Il peut donc être accepté. Entrée de structure de la série chronologique. La reconnaissance de l'écriture manuscrite est la plus ancienne utilisation réussie des résultats de la recherche de RNN.
(6) GNN
Figure I Réseau de neurones, le réseau neural est divisé en cinq catégories, respectivement oui: des réseaux de convolution graphiques, GCN, une attention graphique Réseaux, auto-effileurs de graphes, réseaux génératifs de graphes et réseaux de temps et d'espace (graphique spatial-temport »).
La quatrième différence: différents gestionnaires de produits ont des difficultés différentes
des gestionnaires de produits pour contrôler les produits, reportez-vous à la photo suivante:
[
Contact final: Dernier gestionnaire de produits et gestionnaire de produits de données ont les deux différences
Contact: Data Product Manager Les données d'élément couramment utilisées sont couramment utilisées par les données d'élément de Gestionnaire de produits AI + algorithme + l'un des trois éléments.
Faites un bon travail dans le gestionnaire de produits de données est destiné à la bol de riz d'aujourd'hui et le responsable des produits AI est destiné à l'espoir de demain. Les deux sont importants. En bref, le chef de produit AI et le gestionnaire de produits de données sont la relation entre les lèvres et les dents!