Skip to main content

Dans l'été chaud, les pantalons sont difficiles à répondre aux besoins de la majorité des garçons. Pour ajouter un peu confortable dans le déplacement des briques et des stalles, ils ont commencé à trouver une présence magique - un pantalon long. Brothers J a également augmenté l'importance du pantalon de nos jours, si silencieusement ouvert Taobao et chercha un grand pantalon, mais je ne sais pas si je me suis terminé longtemps.


L'imprévisible J frère a jeté le téléphone, allumant l'ordinateur et grimpant les données de pantalons 4403 de Taobao, puis effectué une analyse visuelle et a finalement trouvé qu'un grand pantalon peut être démarré. Cet article essaie principalement de résoudre les problèmes suivants:


Quel est le grand pantalon en Chine?
Quel est le prix du grand pantalon?
Quel magasin coûte cher?
Quelles sont les caractéristiques des pantalons?




Site Web Taobao est un site de téléchargement dynamique Ajax, uniquement en analysant l'interface ou avec l'outil de vérification automatique SELENIUM.Collecte de données IUM.

Cette collection de données utilise le sélénium, en raison de la version Google Navigateur de J Brother rapidement, ce qui conduit à un pilote Google invalide. Je désactive donc le navigateur pour mettre à jour automatiquement et télécharger le pilote de la version correspondante.

Le pilote de navigateur doit correspondre à la version du navigateur, sinon sélénium ne sera pas valide, voici également des liens de téléchargement:

http: // chromedriver.storage. GoogleEabs .com / index.html.


Suivant, J Brother utilise selenium à Taobao à la recherche d'un grand pantalon, journal de numérisation mobile, nom de produit, prix de base, numéro de paiement de grand pantalon, produits de quantité, nombre de paiements, adresses de livraison, etc. enfin enregistré comme big_pants.xlsx. Limite dans l'espace, le code Reptile fournit uniquement la fonction principale.


def main(): 2 browser.get('https://www.taobao.com/') 3 page = search_product(key_word) 4 print(page) 5 get_data() 6 page_num = 1 7 while int(page) != page_num: 8 print("-" * 100) 9 print("正在爬取第{}页大裤衩数据".format(page_num + 1))10 browser.get('https://s.taobao.com/search?q={}&s={}'.format(key_word, page_num*44))11 browser.implicitly_wait(10) 12 get_data()13 page_num += 114 print("大裤衩数据抓取完成")1516if __name__ == '__main__':17 key_word = "大裤衩 男"18 browser = webdriver.Chrome("./chromedriver")19 main() II. Nettoyer les données

Après quelques minutes, je le Le Le Le Le Le LeN 4403 Pantalon de données d'échantillonnage, pour une analyse pratique des données, il est également nécessaire de nettoyer les données approfondies simples.


1. Ajouter un nom de colonne

2. Répéter le traitement de l'enregistrement



3. Manipulation de Miss





5. Manipulation des adresses de l'école
















7. Autre traitement


III. Visualize Data

Après nettoyage des données, une analyse visuelle peut être effectuée, cette visualisation est principalement utilisée pour les outils de la bibliothèque Python Pyechart et de BI.


examine d'abord les données d'intérêt, le pantalon le plus cher et le grand pantalon le moins cher:







































. . ] Comparer, KHIl était difficile de trouver la différence entre deux grands pantalons, un son étrange, un son sifflant. En tant que genre de travailleurs de l'immigration, le vent n'est pas utilisé (surtout ne peut pas se permettre), conscient de bon marché et n'est pas prêt à être à l'esprit à J frère quand il commence à apprendre, alors J frère continue d'analyser. Où sont les endroits chinois meilleurs? J Frère a utilisé des données numériques provinciales et le paiement de la carte des cartes nationales, a révélé que Fujian et Zhejiang avaient un grand pantalon. Selon le principe économique général, l'agrégation industrielle est plus susceptible de fournir une division professionnelle et professionnelle. Alors J frère premier pantalon verrouillé dans ces deux places et une analyse de forage supplémentaire. Dans deux provinces de la riche, Quanzhou, 44,28% du pantalon Fujian et Hangzhou représentait 37,02% du pantalon de Zhejiang. L'objectif est réduit et le cœur de J frère J est extrêmement excité. Combien coûte le prix du grand pantalon? Pour acheter un pantalon approprié, nous devons analyser les facteurs de vente, nous devons analyser les prix. On peut le voir à partir de l'image au-dessus de laquelle 80% du pantalon sont inférieurs à 50 yuans et que le grand pantalon de plus de 100 yuans est inférieur à 2%. On peut voir que le prix psychologique de chacun n'est généralement pas élevé. Quel magasin coûte cher? [ des ventes élevées de Taobao Store, il s'agit essentiellement d'un magasin de premier plan. Il semble que tout le monde paie l'attention sur les effets de la marque haute du magasin. J Frère a également vérifié Mystery8090. Il s'agit d'un magasin de vêtements coréen se concentrant sur les gros garçons. Le positionnement du marché est toujours bon, rien d'étrange quand il obtient également une bonne vente. Quelles sont les caractéristiques du pantalon? J Brother a effectué une analyse de texte sur le champ Nom du produit pour comprendre les caractéristiques du pantalon, avec de grands arbres à dessiner des pantalons. Les principales caractéristiques sont essentiellement négligées, les premiers gros pantalons sont "courts", suivis d'une journée "d'été" "mâle"née.Cloud Word est apparu beaucoup de "repos", JS qui a été vérifié et que le mot "divertissement" a été coupé lorsque le mot nuage a été créé. J. Selon l'analyse ci-dessus, évaluant les enfants concernés, le ratio de compliments et d'indicateurs d'autres, après analyse , enfin trouvé après le pantalon et a commencé.J Frère ne ressent pas des émotions, n'a plus peur de la nourriture!

Sujets

Catégories