L'objectif de "la science des données" est de donner un raisonnement statistique efficace des données. L'étiquette "Données" n'est pas importante pour faire quoi que ce soit, mais c'est faux: il est difficile et incapable d'effectuer la science sans prendre de données, vous pouvez comprendre la faiblesse du système et produire une sensibilité exportable et intelligente aux données idéales.
Toute données intéressante définie avec au moins une partie des caractéristiques suivantes: valeur manquante, valeur inhabituelle et bruit. Manquant: Comme le nom montre que la valeur est manquante. Valeur inhabituelle: incident uniforme, en raison d'une raison quelconqueDue ou d'autres événements sont loin d'être des limites raisonnables. Le bruit consiste à distribuer des résultats d'effets aléatoires (ou de manière aléatoire) affectés par la valeur mesurée. Une bonne distribution de mesure, une valeur inhabituelle et un bruit sont souvent plus faciles à comprendre dans différents bruits et valeurs inhabituelles se produisent souvent rarement et nous ne pouvons pas comprendre par la distribution.
Outils utiles pour gérer des choses comme R, Python et RPY.
Lundi, pourquoi r Très approprié pour la science de données
R Une paire de langues expérimentées des mini analystes Statistiques sont très légères. Il a été créé par des scientifiques, en effectuant très facilement de nombreuses tâches de gestion de données. Il convient particulièrement aux tâches de gestion des données suivantes:
2. FlaconsC
La paire de support de langue de marquage de langue est très sympathique. R Concept "Cadre de données" Langue "pour diviser les données combinées, les données de la carte, puis affecter des algorithmes avec des données de matrice de valeur pure et des langages de développement de données traditionnelles, comme Python, le processus de données est nécessaire pour être un développeur. Vous devez consommer beaucoup de temps et d'erreurs facilement.
MANIPULATION OU TRAITEMENT, GROUPE DE LUNGE (Traducteur Note: Extriche, comme maximum, Minimal) est une tâche très fondamentale mais importante dans les données. Dans certains cas, ce sont des données pratiques,mais en raison des erreurs de mesure. Il est retourné dans une donnée défavorable, des objections. (Traducteur Notes: Par exemple: plus près de 1 pour l'exprimer.) Comment gérez-vous un impact important sur les résultats analytiques.
l langage r fournit la richesse d'algorithmes pour gérer les problèmes liés à différentes données est apparu dans la pratique KÉcole de fleurs. Bien que ces algorithmes ont toujours besoin d'eux pour essayer d'identifier leurs options pour choisir le traitement de données le plus approprié. Algorithme.
mardi, RPY2: pont entre le langage R et Python
Pandas, la bibliothèque d'analyse de données de Python, il existe de nombreuses fonctionnalités identiques, mais RPY2 crée une très bonne route de la langue R à Python, vous permettant d'utiliser la langue R comme pièce jointe lors de l'apprentissage de Python faisant partie de l'apprentissage, des analystes avec une vaste expérience de développement de l'expérience utiliseront la langue r. Peut utiliser RPY2 quand ils les distribuent aux utilisateurs.
Cette capacité de mouvement n'est pas très précieuse, mais d'une autre perspective, il s'agit également d'une limite qui peut utiliser la programmation générale de la langue de la langue, telles que: Python, modèle de modèle conceptuel et utilise un utilisateur de NA convivial.Il a de nombreuses fonctionnalités supplémentaires complexes (imprimées, réseaux, support USB, V.V.) est très importante.
Exemple: j'ai utilisé cette méthode pour créer une application Python pour lire les données du capteur, la poignée via RPY2, montrée aux clients de différentes manières, je ne sais pas comment le lire avec RetReve Récupérer des données du capteur de capteur de récupération. Donc, il y a plusieurs façons. Python a été fait module dont j'avais besoin, même s'il n'était pas facile de se développer.
Si vous ne connaissez toujours pas le langage R, je recommande d'apprendre Python et d'utiliser RPY2 pour accéder à la fonction de langue R. Vous avez appris une langue pour obtenir deux possibilités. Une fois que vous avez appris RPY, ce n'est pas un gros problème de passer à la langue pure, mais vous voulez être mon tour pas trop facile.