Skip to main content

Premièrement, des statistiques de l'application et des mathématiques

comme de nombreux concepts ont été discutés devant, comment les gens ont des statistiques et des statistiques mathématiques différentes et normales (mathématiques), il existe de nombreuses grandes différences. Certaines personnes pensent que les statistiques sont une branche de mathématiques (Merriam-Webster, 2017b), tandis que d'autres (comme John Tuekey (Brillinger, 2002)) estiment que les statistiques sont une science indépendante. La plupart des gens pensent que la même physique utilise également des mathématiques, mais aucune mathématique, les mathématiques utilisent des statistiques, mais ce n'est pas des mathématiques (Milley, 2012).
Collecte, organisation, analyse, explication et affichage des données relatives aux données. Si cette définition large est utilisée, cela semble être le concept d'analyse. Cependant, la plate-forme d'analyse quantitative statistique de l'analyse et des données sur la science des données, mais leur focalisation est beaucoup plus large que les statistiques traditionnelles et dispose de dizaines de points de vue sur les statistiques et les secteurs.autre. Je me ai énuméré. La relation entre ces concepts est illustrée à la figure 1 -3.

Figure 1-3 La relation entre statistiques et autres industries quantitatives

Les mathématiques ont un atout absolu et certain et déterminé la méthode d'enseignement des mathématiques (au moins aux États-Unis. L'école des États) est transmise d'une certaine manière de regarder le nombre de mondes d'une certaine manière. C'est-à-dire que nous sommes enseignés, et tous les événements et événements peuvent être clairement expliqués.


Cependant, les statistiques voir les données de quantification sont probables ou aléatoires. Cela signifie que, selon l'événement pouvant obtenir une conclusion universelle (à l'exception de la randomisation simple), il convient de comprendre qu'il existe une distribution de probabilité aléatoire ou exactement des motifs imprévisibles.

Élargir l'apprentissage pour apprendre davantage d'antécédents statistiques et son évolution de la science, veuillez lire David Salsburg The Dame Déguster Tea.


Comme le montre la figure 1-4, la pensée mathématique est KL'hélice (c.-à-d. Il déduira un exemple spécifique en appliquant une loi ou un principe commun) et le raisonnement statistique est causé (c'est-à-dire qu'il ait extrait la loi générale à partir d'exemples spécifiques).

La figure 1-4 résume le raisonnement théorique et l'explication


Cette différence est dans l'environnement analytique, il est très important car nous allons résumer et expliquer le raisonnement analyser différents problèmes. Par conséquent, il convient et nécessaire d'appliquer des mathématiques et des statistiques pour analyse. Si l'analyse est une stratégie globale, des statistiques et des mathématiques sont des analystes célèbres. Pour nous aider à faire deux outils pour cette stratégie dans la boîte.
La programmation linéaire peut être utilisée pour soutenir notre analyse pour résoudre un type de problème d'optimisation spécifique. Par exemple, Disney utilise des entiers linéaires, non linéaires, mixtes et une planification dynamique dans sa science de données, afin de résoudre le temps d'attente en tant que dispositif de siège de la maison de HaOptimisé, réduisant le temps d'attente entre les parcs, organiser des employés (comme acteurs) des problèmes d'horaire des lignes.

Notez que pour discuter, je ne dis pas strictement ici, optimiser les mathématiques, la science décisive ou la science actuarielle (sciences actuarielles) la différence est la différence différente, car à mon avis, tous sont tous Une partie de nos outils analytiques dans la boîte à outils, qui peut être flexible en fonction de la nécessité de penser et de résoudre le problème.
Plan de planification linéaire Le plan linéaire est une méthode mathématique pour résoudre ses problèmes et ses sorties en tant que fonction de modèle linéaire. Par exemple, nous voudrons peut-être optimiser l'effet d'urgence en ajustant un certain nombre de facteurs principaux, tels que la complexité chirurgicale, nécessitant le nombre de personnel médical, complications possibles, etc. Optimiser l'efficacité du service d'urgence.


II, prédit et séquences chronologiques

lors de la discussionEn termes d'analyse de soutien, des prévisions et des séquences de temps sont généralement mentionnées ensemble, non pas parce qu'elles sont la même approche, ce qui est parce qu'ils sont ciblés pour la même classe, c'est-à-dire basé sur des informations historiques, les données de flux de temps sont caractérisées et prédites. Analyse des prévisions et du temps de séquence faisant référence à une méthode d'analyse des données de la série chronologique et de modifier une fonctionnalité significative à partir de données. Plusieurs fois, les prédictions sont décrites comme évaluées par des données historiques et une méthode de visualisation d'images et certaines ont fourni des prédictions à l'avenir.

L'analyse des séries chronologiques diffère des prédictions, bien que vous ayez besoin de données de séries chronologiques pour prédire, mais ne pas analyser la série de temps utilisés pour prédire. Par exemple, l'analyse de la synchronisation peut être utilisée pour explorer le même mode ou les mêmes fonctionnalités de plusieurs séries chronologiques ou exécuter le contrôle de processus statistique. De même, analyse saisonnièreg peut être utilisé pour identifier des échantillons.


L'analyse d'auto-temporisation utilise plusieurs méthodes, à la fois quantitatives et qualitatives. Le but de l'analyse de la série de temps est de trouver un mode dans les données historiques (ou des données de la série chronologique), puis de spéculer sur les tendances futures. Habituellement, il existe quatre méthodes d'analyse de chronologie majeures, comme illustré à la figure 1-5.

Figure 1-5 Méthodes d'analyse de la prédiction et d'analyser séquentiellement

En général, la quantification est la méthode de prédiction la plus courante. Toutefois, lorsque les données d'historique quantitatif ne peuvent pas être obtenues, l'utilisation d'une analyse qualitative et des méthodes d'analyse de la décision sont également courantes lorsqu'il y a l'existence d'incertitude.


Traitement des langues naturelles Mardi

Processus de langue naturelle, PNL) fait référence à une méthode de compréhension et de création d'une langue naturelle de personnes viking par ordinateur. Actuellement, la PNL est un domaine de recherche axé sur des cordesGlobal entre la langue humaine et l'ordinateur, dans le domaine commun de l'informatique, de l'intelligence artificielle et de la linguistique de calcul. Les techniques d'exploitation de texte et l'analyse de texte sont souvent interchangeables, à l'avance de NLP ou de PNL.
L'objectif de NLP est de comprendre la langue naturelle dans le texte de l'ordinateur, la NLP est utilisée pour classer, extraire et résumé texte, ainsi que leur compréhension et leur processus de progrès technique que j'ai rapidement poussé rapidement PNL pour l'analyse et de nombreux autres. Application frontière du champ. Par exemple, dans le processus d'analyse, nous recevons des informations de description antérieures (telles que des documents, des documents, des essais, des mots) et de la compréhension de leurs sentiments.

Une analyse émotionnelle spéciale est utile pour comprendre comment les gens examinent des produits ou des services. Dans le domaine des soins de santé, une analyse émotionnelle est utilisée pour mesurer les émotions des patients et identifier les patients souffrant d'insuffisance cardiaque. Résumé de ce texte seraC Utilisez comme entrée pour prédire la modélisation, l'analyse de la décision, la recherche ou la réponse du robot.

La figure 1-6 décrit le processus universel d'un tel processus de langue naturelle.


Figure 1-6 Diagramme de traitement des langues naturelles

Une application très pratique de PNL est dans le domaine du marketing, du texte utilisé pour comprendre une "émotion" d'un client sur une marchandise (généralement une marque ou un produit). Émotion Voici comment comprendre les sentiments des clients et ajuster et classer leurs émotions. Outre une analyse émotionnelle, la PNL peut également avoir de nombreuses applications, telles que:

Syntaxe Entity Traduction

Chercher

Normalisation

Word
Développer l'apprentissage Comment en savoir plus Techniques utilisées dans la transformation des langues naturelles, veuillez lire l'article de Matthew Mayo: https://www.kdnuggets.com/2017/2017/natural-l-Traitement linguistique-Terminal-Termes-Ermplaind.html
Génération de langue naturelle (Gene NG NG NGNatural, NLG) est un sous-ensemble d'intelligence artificielle et de recherche PNL, faisant référence à des documents significatifs automatiques, lisibles de données structurées. Contrairement à la NLP, NLG Walks est une autre ligne de recherche.

signifie, NLG est utilisé comme entrée sous forme de données ou d'autres formulaires.


NLG a été largement utilisé dans de nombreux types de robots de discussion, du service clientèle (voir Pathania et Guzma, Chatbots dans le service clientèle) pour des symptômes épidémiques. Les robots de discussion ne sont qu'une application de NLG, d'autres applications comprennent également une achèvement automatique:

combinant des rapports d'entreprise intelligents dans un rapport d'analyse complète (Qlik, Tableau, Tibco, Microco, Sisense, Sisense, le processus de construction d'informations fournit de telles méthodes) ] Créer automatiquement des états financiers et une analyse complète (logiciel Nanyze)

La production de nouvelles sportives quotidiennes (STATSMONKEY fournit de telles fonctions)
Développer automatiquementL'évaluation de la performance du service client est évaluée (la Société Science Narrative Software fournit ces fonctions)

Dans le système de gestion de la relation client, les scripts CRM sont générés automatiquement dans le système. Système de gestion de la relation client. Recommandations pour les opportunités de vente (Savve of Yeeop pour fournir de telles fonctions)

Fournir tous les analystes financiers intelligents pour toutes les petites entreprises des petites entreprises. Solution (le logiciel de mémoire d'Arria fournit une telle fonction)

dans l'historique, l'école de traitement de la langue naturelle implique des règles de cryptage direct Language, déterminer la structure des mots, comprendre le contenu et le contexte, et comment ils utilisent langues quotidiennes. Les calculs de statistiques, les progrès de la linguistique de calcul moderne et des machines d'apprentissage changent le monde de la PNL à une vitesse sans précédent.

Quatre, analyse des documents et analyse de texte


En général, les aspects de KHCette analyse de texte comprise peut être entre la PNL et l'exploitation du texte. Différence. Comme dans les données minières, nous essayons d'extraire des informations utiles à partir de données. En cas d'analyse de texte, les données correctes sont le texte et les informations extraites de celui-ci comprennent des échantillons et des tendances trouvées dans les données texte.


Données de texte de texte de traitement automatique, nous essayons de répondre à des fréquences, des longueurs de phrase, d'existent ou n'existent pas de certaines chaînes de texte, par exemple comme le vocabulaire. Nous pouvons résoudre des problèmes d'esquisse (par exemple: la technologie de classement dans la NLP). Fondamentalement, l'exploitation du texte est généralement le prélude de la PNL.

Le texte de réalisation comprend une large gamme, y compris une analyse statistique des applications, des machines d'apprentissage et d'autres techniques d'analyse avancées, mais est souvent considérée comme équivalente à la creuse de texte. Je pense que c'est une zone grise.

Notez que les gens utilisent souvent du texte à PExécution de ce terme dans l'intelligence Business pour montrer plus d'actions plus simples peut être basée sur des rapports conventionnels (tels que le nuage de mots, l'analyse de la fréquence de mot, etc.) acheminée et intuitive) accomplie.


Les documents d'exploitation sont généralement les méthodes proposées des scientifiques de données souhaitent utiliser, bien qu'il existe des méthodes plus avancées, mais des méthodes, des statistiques, des statistiques, une partie de leur travail complexe. Je pense que cela est cohérent avec mon point De View, Signification L'analyse est un développement naturel de l'intelligence commerciale (balles).
Il est important de noter que différentes communautés, différents scénarios utiliseront des termes différents, ce qui peut entraîner une connaissance de la confusion dans le travail réel. Par exemple:

www.linguamatique.com/blog/are-terms-text-Mining-Text-analytics-Largely-inter peut changer


V. Machine apprendre

La plus grande entreprise de logiciels privésEt l'énorme analyse SAS déterminera quel apprentissage de la machine est:


...... une méthode d'analyse des données au modèle d'analyse automatique. Apprendre à utiliser des algorithmes de répétition de données, permettant aux ordinateurs de cacher des idées cachées sans programmation claire.

Le noyau de la machine d'apprentissage consiste à utiliser des algorithmes pour définir des modèles d'analyse quantitative pour aider les modèles informatiques à partir de données "apprentissage". Il diffère du processus de traitement du centre de ressources humaines, appris des ordinateurs et découvrant caché dans des données, non par les personnes à configurer directement des modèles.

En général, le concept de base de modèle et de gestion de modèle dans la machine d'apprentissage a mentionné un développement continu et répété du prochain processus décisionnel, au lieu d'une participation artificielle élevée, est généralement basée sur une analyse statistique.


Avec la capacité du calcul de la capacité au cours des dernières années, les machines d'apprentissage peuvent être utilisées automatiquement pour effectuer automatiquement des exercices.N Complexe mathématique pour les grandes données et cela est incapable de le faire avant.
Les gens peuvent souvent créer un à deux bons modèles une fois par semaine, tandis que des milliers de modèles peuvent être créés chaque semaine.
- Thomas H.Davenpot, leaders d'analyseur (Davenport, 2013)

Esquisse méthodes courantes dans les machines d'apprentissage.



Développer des connaissances plus connectées et d'autres termes dans les machines d'apprentissage, veuillez visiter le vocabulaire Apprendre à Google Development Machine, URL: développeur.google. com -elarning / terme /

Les personnes classent souvent des algorithmes de machine en fonction de l'ordinateur "Mode d'apprentissage" (rappelez-vous, la machine d'apprentissage consiste à affiner la loi en analysant des échantillons de données), c'est-à-dire Pour les mêmes données, il peut y avoir des algorithmes de machines différentes au modèle pour modéliser le monde réel (problème).

En général, il existe quatre modes de machines d'apprentissage ou d'algorithmes de modèleL'apprentissage et leurs différences sont les rôles des variables d'entrée différentes et comment préparer des données pour les modèles de formation.
Le tableau 1-1 résume la différence de différents algorithmes d'apprentissage de la machine.
1-1 Mode d'apprentissage de la machine

6. Mining de données

Les données d'exploitation minière de données sont (généralement une grande échelle) détectant et interprétant des modes à grande échelle pour résoudre les problèmes d'entreprise.
À la fin des années 90 et au début du XXIe siècle, l'exploitation minière des données a été largement utilisée comme méthode pour analyser de grandes bases de données pour créer des informations nouvelles ou différentes. Le rêve de l'industrie minière des données est "Trouver une aiguille dans le foin de foin". L'exploitation minière des données et les statistiques sont différentes. Avant l'exploration des données, pas nécessairement une hypothèse de conduite théorique prophétique.
Les «préférences» sont définies comme «à partir de la première étape» ou simplement comprises comme «d'abord». La priorité prioritaire est supposée que l'expérience estEffectuer ou collecter des données.
Exploiter des données par le biais de méthodes statistiques traditionnelles et de techniques d'intelligence artificielle et d'ingénierie pour identifier les régimes inconnus précédents dans les données que nous avons.

Comme d'autres techniques utilisées dans une telle analyse, l'exploitation minière de données selon un tel cycle de vie: commence généralement à partir de la description du problème, puis comprend les données, puis construisez le modèle et prenez l'action correspondante en fonction des résultats.

Dans des circonstances normales, l'excavatrice de données identifie les variables d'intérêt de sortie, puis utilisez différentes techniques pour préparer des données (telles que la clustering, l'analyse dans les pièces principales et les règles de liaison), puis ces variables de sortie sont utilisées. En tant qu'entrées d'algorithmes d'extraction de données, telles que des algorithmes de régression, des réseaux nerveux, des décisions ou des vecteurs de soutien, aidez-les. Une partie importante du processus d'exploration de données consiste à évaluer le modèle et à garantir que nous ne sommes pas excessivement appropriés pour le modèle. [



Auteur: fondateur et chef de la direction de Thotwave, est un analyste international pour International Analytics Institute est également professeur d'entreprise à l'école Fuqua (Fuqua Business School)
.
Cet article est copié partagé, s'ils sont liés aux travaux, aux droits d'auteur et à d'autres problèmes, veuillez nous contacter pour supprimer la première fois (Signal MicroSurgi: LOVEDATA0520)















. . ] .

Sujets

Catégories