1. Extraire des marchandises dans la vidéo
Appliquer des scènes: Par exemple: la vidéo ci-dessous, découverte qu'il y a une télévision, un chapeau, une image photo, alors vous pouvez pousser la télévision, un chapeau, un cadre photo liée à la publicité.
Mise en œuvre: Tout d'abord d'annotations d'artisanat, puis étudiez profondément.
Consultez d'abord le cas:
peut voir des résultats d'apprentissage approfondis de Google Actuellement open source: recherchez l'intelligence vidéo de Google, vous devrez peut-être renvoyer le mur. Google identifie essentiellement des objets dans des vidéos et très intelligents.
Type de vidéo appliqué: Il y a des caractères et des articles et des marques;
Scènes applicables: classes de commerce électronique, publicité des produits de base;
Avantages: Intelligence. Lorsque nous regardons les films de télévision maintenant, nous verrons que le drame a été utilisé pour le faire, tels que les cheveux longs de la nuit de trois générations et lancer immédiatement un shampooing. Avec des taches chaudes, la publicité sur les correctifs est prise eto ma marque de téléphone mobile. Cependant, lorsque des dizaines de milliers de vidéos, en particulier des marchés vidéo courts, continuent de croître rapidement, la machine doit être complétée.
Inconvénients: il est relativement facile d'identifier nominalement et des verbes plus difficiles; Par exemple, "basketball" peut être déterminé, mais ne peut pas identifier "Playball Play". (L'apprentissage profond peut être fait, mais la source open source de Google n'est pas)
peut être déterminée, mais elle ne peut être évaluée, telle que la qualité de la qualité des substances Image Quantité, etc.
2. Extrait sémantique de contenu vidéo;
) Framehot de la vidéo:
· Certains sont coupés chaque image;
Quelques conversions de lentilles, comment déterminer si la vidéo est convertie? Calculez la distance entre les deux images, la différence indique que la lentille est modifiée et nécessite une capture d'écran.
(2) (2) Identification sémantique des captures d'écran;
(3) Convertir la voix de la vidéo en texte;
(4) L'identité sémantique du texte
(5) Résumé de la sémantique pour la sémantique et le texte obtenu ci-dessus est la sémantique de cette vidéo;
Les mots originaux sont "Contenu vidéo FFMPEG dans l'audio, les sous-titres de la reconnaissance vocale, les sous-titres de traitement de la NLP reçoivent des mots vectoriels et des documents similaires. Ci-dessus est la ma propre compréhension.
Avantages: pour Exemple, éducation, texte sur la vidéo beaucoup.
Inconvénients: D'autres types de texte vidéo ne sont pas trop, pas assez pour désarmer la langue de la langue.3. Extraire des mots-clés sur le titre;
Il s'agit d'une extraction de texte pure. Le processus important de lui-même, la position du mot, le titre est très important, l'avant est très important, l'apparence générale du mot fréquence, mot ", synthèse.
Avantages: calcul simple, processus de traitement de l'industrie est très mature et que différents forfaits open source sont très pratiques. Vraiment disponibleExtraire le contenu, tel qu'une courte vidéo des 50 premiers cours en avant 50, peut voir le contenu principal de la vidéo;
Inconvénients: Titre Party
Il y a toujours des titres qui ne peuvent pas être distingués entre un contenu spécifique; Par exemple, il y a une vidéo sur le titre: oreilles enceintes. Vidéo: Un chanteur. La machine peut identifier quelqu'un à chanter, de la tête à chanter. Mais la machine ne comprend pas pourquoi le titre est des oreilles pour la grossesse.
4. Étiquetez le contenu;
une partie artificielle de la première méthode de traitement. L'article est écrit très clairement, je n'ai pas de documents. Liste artificielle. Cela peut voir comment le Douban et les sites vidéo le font, il peut être démonté que l'étiquette affichée sur leur interface. Certaines marques de manière fausse, la machine ne peut pas apprendre d'eux-mêmes ou apprendre à toucher, telles que des scènes ou basée sur le manuel.
5. Résumé
Quand j'ai commencé à étudier, je voulais juste voir comment continuerLa n la plus avancée dans l'industrie.Mais je trouve que chaque type ne peut inclure que de nombreux besoins vidéo, tels que le premier, plus approprié pour les séries télévisées ou diverses, si vous rencontrez un anime, il est très peu efficace.
Terminer:
Cet article a été autorisé avec l'auteur, tel que la réimpression, veuillez contacter l'auteur.