Skip to main content


1, entrez les données

Download and Python Environment ici ne détaillera pas, il existe de nombreux tutoriels en ligne, ils vont commencer directement dans des biens secs et jouer C'est une porte pour voir la montagne.


1 Entrez la bibliothèque populaire d'analyse de données Python: Numpy, Pandas, Matplotlib entré en premier.



2 Lecture des données à gérer: Read_excel effectue un fichier Excel Reader, en spécifiant le tableau saisi avec la feuille_nom.


3 Données de perspective originales: Utilisez la fonction de tête pour afficher la feuille de données de lecture pour préjudice pour une observation préliminaire, vous pouvez voir le formulaire de données Ban Head, l'école.

2, Traitement des données


Observation préliminaire indique certaines colonnes vides, d'analyser des données sans signification et de le considérer. Et le traitement de données suivant.



1 Supprimer des colonnes indifférentes: Utilisez la fonction DROP pour supprimer des colonnes de données et une fonction d'appel non valides.IRES d'observer des données à nouveau.

2 En regardant l'effet ci-dessus, les données ont été protégées et lorsque vous devez examiner la feuille de données globale: appelle la forme et l'imprimer avec la fonction d'impression, vous pouvez voir que la fiche technique est de 227 lignes et 12 colonnes.

3 Suivant, gérez l'absence de données: appelez la fonction d'information, voir les données de chaque colonne, vous pouvez voir que les données de chaque colonne sont encore incontrôtrées que vous avez besoin de traiter plus.


4 Première prise de la colonne "La quantité à lire le contenu" pour la régression linéaire en tant que norme permettant de supprimer le flux de données sans cette valeur: appelez Drowna et exécutions réelles pour voir les données.

5 Après le traitement ci-dessus, les données étaient protégées, mais la valeur de certaines lignes était toujours manquante. À ce stade, il ne peut pas être déployé ou toute la colonne. Supprimé, vous devez remplir les valeurs du manque de personnalités: trouver ce "nombre mensuel" et "nombre de personnes élevées" sont toujours manquants, prennent un moyen deMéthane moyen, principalement pour utiliser des fonctions de remplissage.


Pour cela, le processus de traitement de pré-données est terminé. Le traitement des données est très important, affectant le flux d'analyse de données suivant.


3, Régression linéaire



Après avoir terminé le processus de traitement, la régression linéaire suivante exécutera une régression linéaire et diabolique qu'elle est destinée à prédire. Prédictions originales.


1 Bibliothèque d'analyses de régression linéaire: Établissez la régression linéaire de l'indicateur X et en raison de la variable, nous utilisons ici "nombre d'argent de lecture du contenu" sous la forme de x " Business Dau (Personne) "est Y.



2 Définissez l'équation de régression linéaire et calculez le coefficient de régression: Call Mail Lineear_Model Institute et le coefficient de régression calculé est de 0,1683.


3 Dessinez le diagramme approprié: appelez la méthode de dispersion de la bibliothèque MATPLOTLIB pour dessiner des cellules dispersées de Y et X et synchronisez la ligne droite de la régression linéaire du pHVacuant le retirez-le.


4 Prévision des données: appelez la méthode de prédiction de la bibliothèque linéaire_model, qui peut prédire la valeur suivante en raison de variables.Il est pratique pour les résultats futurs pour estimer les résultats.


Avec cela, un exemple de régression linéaire est effectué en python.

Sujets

Catégories