Si le lecteur est installé en tant que version anaconda, il est venu avec la bibliothèque suivante: Numpy, Sciped, Matplotlib, Pandas, Scikit-apprentissage.
Cela fournit principalement une brève introduction à ces bibliothèques et les lecteurs peuvent également lire des manuels plus détaillés sur le site officiel.
NUMPLY: Fournit une prise en charge de la matrice et des fonctions d'effet correspondantes
Scipy: fournit des numéros de support et de calcul de la matrice liés à la matrice
matplotlib: Outils intuitive de données puissants, outils d'emploi, outils d'analyse et analyse de données solide, puissants, puissants
Statistiques de modélisation et économie de l'horloge, y compris les statistiques statistiques, les estimations des modèles statistiques et les dîners ]
Scikit -Learn: Soutien de la régression, de la classification, de la clustering et d'autres bibliothèques d'apprentissage puissantes
KERAS: Bibliothèque d'apprentissage en profondeur, utilisée pour établir des réseaux nerveux et des modèles d'apprentissage profonds
GENSIM: La bibliothèque est utilisée pour effectuer des modèles de sujet texte, l'exploitation de texte peut être utilisée
1. NUMPY
Python ne fournit pas de fonctions de réseau. Bien que la liste puisse compléter la fonction de tableau de base, il n'est pas un véritable tableau et une capacité de données importante, la vitesse d'utilisation de la vitesse sera très lente. À cette fin,
Numpy fournit une fonction de réseau réelle et une fonction de traitement de données rapide.
Numpy est toujours une bibliothèque de sortie multi-usages avancée, nous en parlerons. Il convient d'être souligné que les données de traitement fonctionnelles sont intégrées NUMPY constitue le niveau linguistique C. Ainsi, lors de la rédaction de programmes, il convient de l'utiliser pour utiliser les fonctions intégrées pour éviter les brefs fruits de congestion (en particulier les problèmes liés au cycle).
pip install numpy
Dans le système d'exploitation Windows, installez Numpy comme l'installation de bibliothèques tiers régulières, peut être effectuée parCommandes PIP, les commandes sont les suivantes:
python setup.py install
En outre, vous pouvez également télécharger le code source, puis l'installer comme suit:
sudo apt-get install python-numpy
Linu La méthode ci-dessus peut également être dans le système d'exploitation X. De plus, de nombreuses sources logicielles de distribution Linux ont des bibliothèques Python populaires, vous pouvez également installer le gestionnaire de logiciels avec le système Linux. Si vous pouvez utiliser les paramètres de commande suivants dans Ubuntu:
Une fois l'installation terminée, vous pouvez utiliser les données à l'aide de NUMPY, comme indiqué dans le code de liste 2-27.
Liste de codes 2-27 Utilisation de Numpy Manipulant Arch
# -*- coding: utf-8 -*import numpy as np # 一般以np作为NumPy库的别名a = np.array([2, 0, 1, 5]) # 创建数组print(a) # 输出数组print(a[:3]) # 引用前三个数字(切片)print(a.min()) # 输出a的最小值a.sort() # 将a的元素从小到大排序,此操作直接修改a,因此这时候a为[0, 1, 2, 5]b= np.array([1, 2, 3], [4, 5, 6]) # 创建二维数组print(b*b) # 输出数组的平方阵,即[1, 4, 9], [16, 25, 36]
Numpy est une bibliothèque mature et un trauct de python, de sorte qu'il y a de nombreux tutoriels, ça vaut la peine d'être observé Surtout le document d'aide de son site Web officiel, et il existe de nombreuses instructions chinoises et anglaises. Lorsque les lecteurs rencontrent des problèmes correspondants, ils peuvent faire référence aux informations pertinentes.
Lien de référence:
http://www.numpy.org
http://reverland.org/python/2012/08/ 22 / Numpy
Lundi, Sciped ]
Si un goût de python engendré de Matlab, de sorte que Scipy fait python vraiment à moitié matlab.
Numpy fournit des fonctions de réseau multidimensionnelles, mais il ne s'agit que d'une matrice courante, pas d'une matrice, telle que lorsque les deux truies, seuls les éléments correspondants sont multipliés, et non la multiplication multiplication. Scipey fournit une vraie matrice et un grand nombre d'objets et de fonctions matricielles.Scipy comprend l'optimisation, l'algèbre linéaire, l'introduction, l'interpolation, l'ajustement, les fonctions spéciales, les modifications rapides de Fourier, le traitement du signal, le traitement de l'image, la soumission d'une étranger phuong à la planète et à d'autres sciences sont souvent utilisées dans le projet. Il est clair que les fonctions sont nécessaires pour creuser et modeler.
Scipy repose sur NUMPY, alors installez NUMPY NUMPY avant l'installation.
Installer comment installer Scipy pour installer Numpy, la méthode d'installation numpy est similaire, vous pouvez également installer Scipy avec des commandes similaires dans Ubuntu, la commande d'installation est la suivante:Après avoir installé Scipey, utilisez Scipey pour résoudre des équations non linéaires et intégrées, telles que Liste de code 2-28.
Liste 2-28 Liste 2-28 L'équation non linéaire et la mise à l'échelle avec Scipey
sudo apt-get install python-scipy
Lien de référence:
http: // www .cipy.org
http://reverland.org/python/ 2012/08 / 24 / SCIPY
# -*- coding: utf-8 -*# 求解非线性方程组2x1-x2^2=1,x1^2-x2=2from scipy.optimize import fsolve # 导入求解方程组的函数def f(x): # 定义要求解的方程组 x1 = x[0] x2 = x[1] return [2*x1 - x2**2 - 1, x1**2 - x2 -2]result = fsolve(f, [1,1]) # 输入初值[1, 1]并求解print(result) # 输出结果,为array([ 1.91963957, 1.68501606])# 数值积分from scipy import integrate # 导入积分函数def g(x): # 定义被积函数 return (1-x**2)**0.5pi_2, err = integrate.quad(g, -1, 1) # 积分结果和误差print(pi_2 * 2) # 由微积分知识知道积分结果为圆周率pi的一半
MARDI, MATPLOTLIB MINITION DU DONNÉES VRAIES OU Modélisation mathématique, il est nécessaire de visualiser la visualisation des données. Pour Python,
Matplotlib est la bibliothèque de dessin la plus célèbre, principalement pour les dessins bidimensionnels, bien sûr, un simple dessin tridimensionnel.
Il fournit non seulement un ensemble complet de commandes similaires, mais nous permet également d'utiliser des données d'image Python très rapidement et de permettre à la sortie de gagner de nombreux formats d'image répondant à la qualité CPublier.L'installation de Matplotlib n'a aucun spécial, vous pouvez installer ou télécharger le paramètre de code source via la commande "PIP matplotlib". Vous pouvez également installer des commandes similaires dans Ubuntu, la commande suivante: [
Il convient de noter que la bibliothèque supérieure dépendante de Matplotlib est relative, lors de l'installation, vous devez installer définir cette dépendance. Une fois l'installation terminée, vous pouvez le vérifier. Voici un exemple de cartographie simple, comme indiqué dans la liste des codes 2-29, contenant essentiellement les éléments principaux de la mappage matplotlib, comme illustré à la figure 2-5.
Code de la liste 2-29 Exemple Moplotlib Module
Figure 2-5 Analyse matplotlib
sudo apt-get install python-matplotlib
Si le lecteur utilise une carte chinoise, il constatera que les cartes chinoises ne peuvent pas être affichées normalement car la police par défaut de Matplotlib est la police anglaise et la solution est l'indication manuelle par défaut avant la cartographie. Les polices sont une police deLa Chine, telle que le corps noir (SIM-HEI), la commande suivante:
lundi, lorsque l'image graphique est enregistrée, le son peut ne pas être affiché, peut être via le code, les éléments suivants sont résolus:
# -*- coding: utf-8 -*-import numpy as npimport matplotlib.pyplot as plt # 导入Matplotlibx = np.linspace(0, 10, 1000) # 作图的变量自变量y = np.sin(x) + 1 # 因变量yz = np.cos(x**2) + 1 # 因变量zplt.figure(figsize = (8, 4)) # 设置图像大小plt.plot(x,y,label = '$\sin x+1$', color = 'red', linewidth = 2) # 作图,设置标签、线条颜色、线条大小plt.plot(x, z, 'b--', label = '$\cos x^2+1$') # 作图,设置标签、线条类型plt.xlabel('Time(s) ') # x轴名称plt.ylabel('Volt') # y轴名称plt.title('A Simple Example') # 标题plt.ylim(0, 2.2) # 显示的y轴范围plt.legend() # 显示图例plt.show() # 显示作图结果
Il y a une petite recommandation:
Diffusez le temps de «galerie» matplotlib pour profiter de ses belles photos, peut-être que vous tomberez lentement dans la maplotlib actif.URL de la bibliothèque:
http://matplotlib.org/gallery.html
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
Lien de référence: http: / / matplotlib.org
http://reverland.org/python/2012/2012/07/matplotlib-Tutoritoral
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
43, Pandas
Panda est l'analyse de données la plus puissante et l'outil d'exploration de Python.
Il contient des structures de données avancées et des outils subtils permettant aux utilisateurs de gérer des données très rapidement et simplement à Python.
Les pandas construits sur NUMPY, contribuent à être plus faciles à utiliser avec des applications gumpy-corrich.
Nom GStructure des données de tableau de bord et analyse des données Python (analyse des données), a été développée à l'origine en tant qu'outil d'analyse de données financières, développée par AQR Capital Management en avril 2008 et ouverte à la fin de 2009.
Les fonctions Pandas sont très fortes, soutenant une augmentation des données, la suppression, la vérification, la modification et les fonctions de traitement de données riche; Soutenir la fonction d'analyse des séries chronologiques; Soutenir les données de traitement flexibles; etc. Attendez. En fait, utilisez simplement des outils Pandas pour écrire un livre, les lecteurs peuvent lire l'une des "Analyse de données de Python" écrite par Wes Mc-Kinney écrit par l'auteur principal de Pandas pour en savoir plus.
1. Installer
L'installation de panda est relativement facile, tant que le numéro numpy est installé, il peut être installé directement, via PIP Installez des pandas. Après la source des commandes ou du code de téléchargement, vous pouvez l'installer via la commande Python Setup.py Installation.
Parce que nous utilisons régulièrement une lecture et une écriture Excel, les pandas par défaut ne peuvent toujours pas lire et graver des fichiers Excel, vous devez installer la bibliothèque XLRD (Lecture) et la bibliothèque XLWT pour prendre en charge la lecture Excel. Commandes supplémentaires à lire / enregistrer Excel pour Python comme suit:
2. Utilisez
dans le chapitre suivant, nous montrerons progressivement les fonctionnalités puissantes de Pandas et Dans cette section, prenez un exemple rapide dans un exemple simple.
Premièrement, la structure de données de base de Pandas est une trame de série et de données.
Les lignes telles que les noms sont des chaînes similaires à une matrice à sens unique; La trame de données est équivalente à une forme bidimensionnelle, similaire à une matrice bidimensionnelle et chaque colonne est une série.
Pour localiser les éléments de série, Pandas fournit à l'objet d'un objet, chaque sérieleur a l'indicateur correspondant, utilisé pour marquer des éléments différents et internes, la capacité de l'index n'est pas nécessairement un nombre. Il peut aussi être des lettres, la Chine, V.V semblable aux serruresNH dans SQL.
De même, la trame de données est équivalente au nombre de séries avec le même index (entièrement conteneur en série), chaque série dispose d'un titre unique, utilisé pour identifier différentes chaînes. Des exemples d'opérations normales dans Pandas sont affichés dans la liste de codes 2-30.
Activité générale dans la liste des codes de liste 2-30 panda
pip install xlrd # 为Python添加读取Excel的功能pip install xlwt # 为Python添加写入Excel的功能
Parce que Pandas est l'outil principal de ce livre, il sera Utilisez-le régulièrement, ce n'est donc plus détaillé et les suivants expliqueront la méthode d'utilisation plus détaillée de Panda.
Lien de référence:
http://pandas.pydata.org/pandas-docs/stable/5, statistiquesModels Pandas se concentre sur la lecture, la transformation et l'exploration de données, tandis que les statistiquesModels paient plus d'attention à l'analyse des modèles statistiques de données, ce qui provoque le goût de la langue de R. StatsModels prend en charge l'interaction des données avec des pandas, de sorte que il combineStructure pour devenir une combinaison de puissantes mines de données sous Python.
STATSModels L'installation est assez simple, peut être installée avec une commande PIP et peut être installé via le code source. Pour les utilisateurs Windows, il existe un fichier EXE compilé sur le site officiel à télécharger. Si vous avez été installé manuellement, vous devez résoudre votre propre dépendance, STATSModels en fonction du panda (bien sûr également basé sur des pandas) S Longez sur la bibliothèque dépend également de pâteuses (une description de la bibliothèque de statistiques).
Vérifiez que le FAD SRÉDARITÉ est effectué avec des statistiquesModels, comme dans la liste de code 2-31.
Listes de code 2-31 avec des statissiques pour effectuer un test de papeterie ADF
# -*- coding: utf-8 -*-import numpy as npimport pandas as pd # 通常用pd作为pandas的别名。s = pd.Series([1,2,3], index=['a', 'b', 'c']) # 创建一个序列s # 创建一个表d = pd.DataFrame([1, 2, 3], [4, 5, 6], columns=['a', 'b', 'c'])d2 = pd.DataFrame(s) # 也可以用已有的序列来创建数据框d.head() # 预览前5行数据d.describe() # 数据基本统计量# 读取文件,注意文件的存储路径不能带有中文,否则读取可能出错。pd.read_excel('data.xls') # 读取Excel文件,创建DataFrame。pd.read_csv('data.csv', encoding='utf-8') # 读取文本格式的数据,一般用encoding指定编码。
Lien de référence:
http: // statistiquesModels .sourceforge.net / stabilité / index.html
Du nom de la bibliothèque, on peut le voir, il s'agit d'une bibliothèque liée aux machines d'apprentissage. Belle, sciKit-apprendre est le puissant kit d'outils d'apprentissage de Python, fournissant une boîte à outils d'apprentissage parfaite, y compris le traitement des données, la classification, la régression, la clustering, la prévision, l'analyse de modèle, etc.
Learn Scikit dépend de NUMPY, SCIPY et MATPLOTLIB, alors installez simplement ces bibliothèques avant , puis installez Scikit-apprendre fondamentalement aucun problème. La méthode d'installation est comme l'installation d'un peu de bibliothèques d'abord et peut être installée par la commande PIP pour installer le code SCIKIT-WATCH ou SOURCE installé.
Modèle Pour créer un apprentissage de la machine à l'aide de SCIKIT-HORS est simple et des exemples affichés dans le code de la liste 2-32.
Liste 2-32 Création d'un modèle de modélisation avec Scikit-Learning1. Tous les modèles fournissent une interface avec
]
pour une formation appropriée. modèles, modèle.fit () (x, y) pour les modèles de surveillance et pour les modèles sans surveillance est approprié (x). 2. Le modèle de surveillance fournit l'interface suivante
# -*- coding: utf-8 -*-from statsmodels.tsa.stattools import adfuller as ADF # 导入ADF检验import numpy as npADF(np.random.rand(100)) # 返回的结果有ADF值、p值等
Modèle.Prédict (x_new):
Prédire de nouveaux modèles.
Model.Predict_proba (x_new):Probabilité prévisible, uniquement utile pour certains modèles (tels que LR).
Model.Score ():Plus le score est élevé, plus la pertinence.
3. Le modèle sans surveillance fournit l'interface suivante
Model.Transform ():
Découvrez le nouvel "espace de base" du mal "Model.fit_transform (): Des données à la nouvelle installation et convertissent ces données dans ce groupe "Installation".
L'auto-étude Apprenez-en à l'épreuve des données pour apprendre, plus populaire Avec l'ensemble de données de fleurs d'Anderson Iris, jeu de données d'image manuscrite, etc.
Les données de fleurs IRIS IRIS définies avec 150 valeurs Les observations sont dimensionnées, telles que des sépales et des largeurs, des longueurs de pétale et des largeurs; avec des queues latérales; (Iris Setosa), Iris Versicolor et Virginia Iris (Iris Virginica). Entrez des données IRIS et utilisez les tissus Figure Figure SVM Formation de données, telle que la listeCode 2-33. Code de la liste 2-33 Saisie du modèle d'entraînement des données IRIS et SVM
# -*- coding: utf-8 -*-from sklearn.linear_model import LinearRegression # 导入线性回归模型model = LinearRegression() # 建立线性回归模型print(model)
Lien de référence: HTTP: // SCIKIT-L'apprentissage. Org / stabilité /
Sept, Keras
Scikit-Learn est très puissant, mais cela n'inclut pas ce modèle puissant - ce réseau neuroditique artificiel. Les réseaux nerveux artificiels sont des modèles assez forts mais leurs principes et ont un rôle important dans la gestion de la langue, l'identification de l'image. Ces dernières années, l'algorithme "d'apprentissage profond" est apparu progressivement, essentiellement un réseau nerveux, essentiel à la réalisation du réseau nerveux en python.
Ce livre utilise la bibliothèque Keras pour construire un réseau nerveux. En fait, Keras n'est pas une simple bibliothèque de réseau nerveuse
, mais une solide bibliothèque d'apprentissage profonde basée sur les changements, non seulement peut construire des réseaux de nématodes généralement, mais également construire de nombreux modèles d'apprentissage profonds, no hComme le codeur lui-même, le réseau nerveux de circulation, le réseau nerveux récursif, la compression réseau nerveux, V.V. Parce qu'il est basé sur la fixation, la vitesse est assez rapide.Theeno est également une bibliothèque Python, développée par un laboratoire en raison d'un expert en apprentissage en profondeur Yoshua Bengio, utilisé pour identifier, optimiser et résoudre efficacement les dimensions des dimensions correspondant à l'estimation de la simulation des expressions mathématiques. Il présente des caractéristiques à haute efficacité pour atteindre la décomposition symbolique, une vitesse optimale et une stabilité. La chose la plus importante est qu'elle exécute également la possibilité d'accélérer le GPU, de sorte que la vitesse de traitement de données intensive est de plusieurs reprises par rapport à la CPU.
En utilisant TheNeo pour construire un modèle de réseau neuronal efficace, mais le seuil pour les lecteurs est normalement assez élevé. KERAS Pour cela, aide à simplifier de nombreuses étapes Construire différents modèles neurologiques, permettant aux utilisateurs habituels de construire et de résoudre facilement des réseaux.Au fond de centaines d'énormes boutons d'entrée et de liberté gratuite, des lecteurs même prononcés: la construction du réseau nerveux peut être très simple!
1. Installez
Première nécessité d'installer NUMPY, SICIPY et THEENO avant d'installer Keras. Premièrement, vous devez préparer le compilateur C ++ avant d'installer TheNOO, est livré avec le système Linux. Par conséquent, très simple d'installer TheNo et Keras dans le système Linux, téléchargez simplement le code source, puis installez-le avec Python Setup.py installé, vous pouvez vous reporter au document officiel.
Cependant, il n'est pas simple sous le système Windows, car il ne dispose pas d'un environnement de compilement prêt, en général, l'installation de Mingw (GCC et G ++ sous Windows System), puis l'installation de Thsean (précédente , des bibliothèques numpées et autres personnes dépendantes sont installées et ont finalement installé Keras. Si vous souhaitez déployer une accélération GPU, vous devez également installer et configurer Cuda.
Il convient de mentionner que la vitesse de kéras dans Le système Windows sera réduitDIT, souhaite donc étudier la recherche approfondie sur des réseaux nerveux, une recherche approfondie, veuillez créer un environnement de Linux correspondant.
Lien de référence:
http://deepearl.net/software/theano/install.htmware#Install
2. Utilisez
Le processus de construction d'un modèle de réseau nerveux est assez simple, il est assez intuitif, comme un général en bois, en raccourcissant quelques dizaines de lignes de code, vous pouvez construire un très fort nerf. Modèle de réseau, même un modèle d'apprentissage profond. Construisez simplement un appareil cognitif MLP (multicouche), tel que la liste de code 2-34.
Liste 2-34 MLP Building MLP (Percepter multicouche)
# -*- coding: utf-8 -*-from sklearn import datasets # 导入数据集iris = datasets.load_iris() # 加载数据集print(iris.data.shape) # 查看数据集大小from sklearn import svm # 导入SVM模型clf = svm.LinearSVC() # 建立线性SVM分类器clf.fit(iris.data, iris.target) # 用数据训练模型clf.predict([ 5.0, 3.6, 1.3, 0.25]) # 训练好模型之后,输入新的数据进行预测clf.coef_ # 查看训练好模型的参数
À noter, la fonction prédite de KERAS est différente de SCIKIT-HORS, KERAS fournira Probabilité avec modèle.prédict_group () fournissant des résultats de la classification.
Lien de référence:
https://keras.io/
huitGENSIM
Dans le site officiel Gensim, il possède uniquement un profil pour vous-même: le modèle thématique pour l'homme!
GENSIM est utilisé pour gérer les tâches linguistiques, telles que l'informatique similaire au texte, LDA, Word2vec, etc. Ces zones doivent souvent avoir de nombreux fourmis plus d'arrière-plan éveillé.Dans cette section, nous rappelons uniquement au lecteur une telle bibliothèque et cette bibliothèque est très puissante, si le lecteur souhaite comprendre cette bibliothèque, vous pouvez lire le responsable de l'aide officiel ou le lien de référence.
Il convient de mentionner que Gensim compile le célèbre mot de Google2vec à partir de 2013, en raison de sa sous-bibliothèque, de sorte que les lecteurs qui ont besoin d'utiliser Word2vec peuvent également être utilisés directement GENSIM ne compilent pas. Auteur de Gensim optimise le code Word2vec, il est donc plus rapide que le Word2Vec d'origine. (Pour obtenir des vitesses d'accélération, vous devez préparer un environnement de compilateur C ++. Par conséquent, le lecteur Word2vec de Gens doit être utilisé.Je dois exécuter dans l'environnement du système Linux.) Ce qui suit est un exemple simple d'utilisation de Word2Vec, tel que le code fixe 2-35 programmes. Liste de code 2-35 Gensim Exemple simple Lien de référence: http: // radimenhurk.com/gensim /