Pourquoi voulez-vous utiliser Python? Une raison importante d'utiliser Python pour gérer les problèmes d'apprentissage est Python pour tirer parti de la communauté R et optimiser les emballages. La capacité de programmation linguistique dépend de sa bibliothèque logicielle, se concentrera sur certains packs R et les packages de remplacement fréquemment utilisés dans Python dans des algorithmes de machines.
Glm, Knn, Randomforest, E1071 - & GT; Scikit-StoutUn inconvénient du langage R est que chaque algorithme de machine dispose du logiciel correspondant, qui améliore les coûts d'apprentissage de l'utilisateur. Le package SCIKIT-HALL à Python résout ce problème parfaitement et SCIKIT-HORW fournit une interface API similaire pour de nombreux alphabétiques couramment utilisés. Avec ce paquet, nous n'avons besoin que d'une ligne de code pour transformer le modèle LogistireGion sur le modèle GradientBoosttingMachines.
Actualiser / Reshape2, Plyr / Dpryr - & GT; PandasPandas dessine des prestationsLa fonction de nettoyage des données dans la langue r et les introduit à Python. La bibliothèque effectue les fonctions de la zone de données et d'autres méthodes de fonctionnement générales contenant essentiellement la nature de Reshap / Reshape2 et Plyr / DPPLYR.
GGPLOT2 - & GT; GGPLOT + Seaborn + Bokeh
Dans les dessins, la langue r était meilleure que Python. Cependant, la fonction de dessin de Python a des tendances matures, si vous aimez le code de type GGPLOT, vous pouvez essayer Yhat qui a développé GGPLot; Si vous voulez dessiner un graphique, vous pouvez utiliser SeaNorn; Si vous souhaitez expérimenter des points fonctionnels supplémentaires, vous pouvez essayer Bokeh.
strict - & gt; Rien
r langage rip avec une fonction de chaîne très difficile, je ferai la prochaine fois que je dois gérer la chaîne deux choses:
au grand Dieu Hadley Wickham a exprimé un remerciement
Entrez dans la chaîne
Strike est définitivement un grand sauveur, un paquet très sympathique, nous pouvons facilementFacile à installer et à utiliser rapidement les données de chaîne. Mais pour Python, il peut gérer des données de chaîne très rapidement, nous n'avons donc pas besoin d'un paquet tiers similaire à Stringr! Python a une bibliothèque d'expression normale et une série de paquets à chaîne intégrée.
RStudio - & GT; RODEOPour de nombreux utilisateurs, Rsudio est un éditeur très sympathique dans le R. Pour Python, il peut ne pas y avoir plus qu'un meilleur éditeur, mais la situation est maintenant différente. Nous avons publié la première version de Rodeo par an et nous avons publié la version 2.0 pour Windows, OSX et Linux il y a un mois.
Knitr - & GT; Jupyter
Dans R, nous pouvons utiliser Knitr pour créer des rapports d'analyse visuelle répétés et RSDIO contient cette fonctionnalité très bientôt .. Dans Python, la bibliothèque logicielle similaire est Jupyter. Jupyter Notebook fournit un environnement interactif qui crée un rapport d'analyse visuelle répété.Retour pour plusieurs langages de programmation.
SQLDF - & GT; PandasQL
SQLDF est un bon moyen d'exploiter des données dans les utilisateurs SQL dans R. Lorsque j'ai commencé à utiliser le langage R, j'utilise souvent SQLDF pour traiter les données. Autant que je sache, Yhat a développé une bibliothèque logicielle Python similaire, Pandasql. Ces deux bibliothèques de logiciels ont les mêmes fonctionnalités: utilisez l'instruction SQL pour manipuler la zone de données et revenir à la zone de données correspondante.
Lien d'origine: http://blog.yhat.com /post/moving-from-r-to-python.html
Imprimé de: http://www.afenxi.com/post/47114
Python, SQL
Y a-t-il une passe?
Basé sur 0
Vous souhaitez également saisir l'analyse des données de travail?
Analyse des données dans des tâches basées sur des tâches, analyse de données diagonales professionnelles
"Analyser les données traumatiques" n'est pas de base - classe d'emploi "
Ce soir à 20h30 diffusé!
Numérisation de code bidimensionnel
Cliquez sur Audition → "Analyse des données dans des tâches non aériennes - Les classes utilisent la classe d'audition