Le premier livre que j'ai contacté R Langue est "logiciel de modèle statistique et R", ce livre ressent un sentiment très personnel bien, au moins trois avantages: premiers, Le livre est plus détaillé en termes de connaissances de base et de théorie des statistiques; Deuxièmement, la connaissance de base du logiciel R, telle que la grammaire, la structure de données, la lecture de données, le flux de contrôle, V.V. En utilisant R (multiples cas non emballées) mettant en œuvre le code correspondant, y compris l'inspection statistique, la régression linéaire, l'analyse de variance, V.V. Ce livre que j'ai vu au moins deux fois, mais le débutant B du langage R ne recommande pas que ce livre soit le premier livre académique.
"RAT L LANGUE", il s'agit d'une très bonne information linguistique et du livre a également mis à jour la deuxième version de la version chinoise cette année. La raison pour laquelle ce livre a été poussé pour la première fois comme guide débutantÉtant donné que ce livre est biaisé, pas la théorie, vous pouvez améliorer l'utilisation du logiciel R via ce livre, y compris le logiciel de programmation de base R, le mode de programmation et l'autre contenu interne. Ce livre je l'ai également vu au moins deux fois. Le livre contient de nombreuses r et fonctions. Si vous souhaitez vous rappeler que ces contenus doivent être exploités.
"Opération de données linguistique" est un très petit nombre de pages, mais elle est essentielle. N'avez rien sur les statistiques relatives au contenu, les discussions sur la gestion des ensembles de données, telles que la gestion des valeurs manquantes, la lecture de données, le traitement quotidien des données, les expressions généralement, résument les données, etc. En lisant et en apprenant ce livre, je pense que ce bloc aura une forte amélioration des données de pré-processeur, j'ai été organisée pour chaque chapitre de ce livre et partagée de chiffres publics, pour moi-même. Ce mot est également un processus amélioré.
Bien sûr, il y a beaucoup de nCommencez sur Internet, telles que "153 minutes d'étude" ", le langage R", Guide de la langue d'abeille R "," RCOOKBook ", etc.
Deux, Visualisation
]
Tout en apprenant R, vous toucherez certainement le logiciel de visualisation R pour compléter les données. En effet, R est également un excellent outil visuel, citons de nombreux packs de photo comme des graphiques, des mailles, de la Plottrix, de la pièce de théâtre, de GGGPLot2, etc. à propos de ce contenu de ce contenu, vous pouvez voir comment rechercher sur le package de plate-forme logicielle, etc. Visualisation (bien que toutes les fonctions de dessin contiennent de nombreux paramètres), cela pensera à vos avantages de votre dessin. Si vous voulez introduire des livres visuels, je va suggérer "ggplot2: selles d'intégration de données et d'art graphique" et "r" données visuelles "Le premier livre a été développé par le développement de packs GGPLot2 Avoir un système de composant de dessin, tel que Geom_ * Fonctions, Fonction STAT_, fonctionne Sacle_ * et theme Fonctions. Ce livre est davantage de la théorie des idées et des dessins, introduisant la fonction géante du package GGPLot2 (bien sûr, il existe de nombreux cas de dessin).
Le deuxième livre compense la relaxation du premier et du livre honnête, j'ai lu "les instructions de données" à "GGPLot2: analyse des données et art graphique", car le livre a comparé la différence entre le package de base et Le package GGPLOT2 dans le dessin du package de base, il a également amélioré mon intérêt pour le package GGPLOT2 et le travail actuel impliquait la chose simple. Des graphiques de statistiques (tels que des graphiques à barres, des graphiques, des diagrammes pliants, etc.), je suis le mieux des sacs GGPLot2 à compléter. Bien sûr, j'ai également organisé une fonction de dessin commun dans le paquet GGPLOT2 et partagée dans le public sous la forme d'une série.
"Statistiques de dessin modernes" de Xie Yishi, PPT Kai "" GGPLot2 "Social" et la version anglaise de "R" Visualisation de données multivariées de la langue "est un nom de familleC meilleure visualisation.
Dig Data
Ces livres décrits ci-dessus sont plus que l'analogue des données, si vous souhaitez vous améliorer, étudier certaines connaissances sur l'exploitation des données sur le feu et le langage comparatifs fournit un chemin. Voici quelques livres que j'ai vus, ils sont "miniers de données: langue de combat réelle", "langage d'apprentissage de la langue et langue r", analysant la loi sur les données linguistiques et la loi sur l'excavation "," concepts d'exploitation de données et technologies "et" de la recherche statistique " et "méthode".
Trois livres précédents basés sur R, y compris les outils linguistiques, y compris des méthodes d'exploration de données communes telles que KNN, la régression logistique, les arbres de décision, les baies simples, le réseau neutrophe, les SVM, la forêt aléatoire, Advooster, grappes moyennes, densité de clustering, cluster, règles d'association, etc. Chaque méthode d'exploitation est équipée d'un cas de données détaillé, même d'attributionProfitez de la signification des paramètres importants dans les fonctions d'exploitation. Et comment l'utiliser. Lorsque vous lisez ces livres de combat réels, vous constaterez que l' exploration de données est particulièrement simple à travers le R. à ce moment, je vais intéressés à exploiter la théorie des données théoriques (au moins, vous vous demanderez au cours du processus d'extraction de données réelles, seront vous feriez mieux de laisser ce paramètre mieux?), Parce que vous avez rencontré plus ou moins que le nœud, vous voulez faire un pas, mais ce n'est pas votre cœur. À ce stade, vous avez besoin d'un matériel pour exploration de données théorie pour vous enrichir et ajouter de l'énergie pour vous. C'est, je vais suivre deux autres livres de théorie que vous vous présenter.« concepts Data mining et de la technologie » Ce livre est un livre, mais il est assez facile à lire. Dig dans une partie du livre, d'abord introduit le concept et les connaissances théoriques de la méthode d'exploitation, etEnsuite, à travers certains ensembles de données pour compléter le processus de calcul manuel. Pour les lecteurs, il a le toucher et l'apprentissage sera plus fort. Ce livre sera un peu difficile à "introduire l'exploitation des données", si vous n'êtes pas confiant en vous-même, vous pouvez d'abord consulter le livre "Introduction d'extraction de données".
"Méthodes d'apprentissage statistique" est un livre sur la théorie de sollicitation complète, y compris de nombreux algorithmes, tels que Knn Algorithmes, des algorithmes de Bayesi, des algorithmes d'arbre de décision, des algorithmes de vecteur de support, etc. Ces raisons sont relativement élevées, telles que comme algèbre linéaire, calcul, théorie de probabilité et plus. Si vous pouvez calmer l'esprit, vous serez capable de brosser (même si vous le copiez), je pense que vous serez très utile et la compréhension de l'exploitation des données sera plus profonde.
Quatrièmement, d'autres ressources d'apprentissage
Outre les livres mentionnés ci-dessus (presque chaque livre que j'ai vu au moins deux), il y a beaucoup de talentsPlus sur Internet, tels que des sites Web, des forums, des blogs, des communautés, V.V. Ensuite, je vais vous montrer des ressources gratuites, je vais souvent:
Statistiques: https://cosx.org/, il existe un article très riche de haute qualité, y compris l'exploitation minière de données, intuitive, statistiques, analyse rapports, etc.
Forum statistique: https: //d.cosx.org/, si vous avez des questions, vous pouvez demander au forum, l'utilisateur enthousiaste donnera également leurs réponses; De même, vous pouvez également voir des questions soulevées par d'autres, essayez de répondre ou de voir la réponse d'une autre personne et d'améliorer encore leurs compétences linguistiques;
R Officiel Web: HTTPS: //www.r-project.org/ L'utilisation r est vraiment sur l'épaule du géant;
http: //bbs.pinggu.org/, il existe une langue spéciale sur le site Web de la parole, sa nature est similaire au forum statistique, vous pouvez interagir, apprendre les uns des autres;Bien sûr, il existe d'autres ressources d'apprentissage, telles que SAS, Forum de métrologie, Python, V.V Forums;
. ] . . . Network d'analyse de données: https://www.afenxi.com/ Réseau de statistiques chinois: http: // /, le site contient beaucoup de documents une bonne version, y compris le fonctionnement des données, Analyse des données, mines à données, stockage à sec, etc. HTTPS://github.com/] Site officiel de Kaggle: https: //www.kaggle. Com /, il s'agit d'un site Web qui fournit des compétitions minières de données, vous pouvez afficher d'autres personnes. Pages, vous pouvez également améliorer vos propres capacités pratiques grâce à des compétitions d'enregistrement; Bien qu'il y ait beaucoup de grands matériaux d'apprentissage, ne vous laissez pas gourmand, vous devez casser tout le processus d'apprentissage (une copie du cœur, vous pouvez utiliser votre cœur, Cliquez sur le code avec votre coeur), apprenez une manière systématique. Si vous souhaitez apprendre cet outil, ne vous inquiétez pas, cette plate-forme est très importante, sinon, la plate-forme apprend que la moitié des niveaux élevés ou de voir du code de jeu, je pense que vous serez également remplacé à nouveau. Et l'apprentissage est toujours un processus qui existe, l'insistance nécessite; insister sur l'expérience d'écriture; Insistez sur l'utilisation de tous les points de connaissance pour essayer de remplacer vos outils les plus portables (tels que Excel, SPSS, V.V.). quelconque! "La révolution n'a pas réussi et les camarades ont toujours besoin de travailler!" OK, partagez la différence de partage, j'apprends le langage R, lisez d'un côté, d'autre part, pour surmonter les livres des points de connaissance que je veux penser aux scènes que j'utiliserai, en utilisant; Dans le même temps, apprenez les idées des autres, les étapes et les conclusions partageant le contenu des autres en regardant un grand nombre d'articles (forums, blogs). Est une analyse de données ou un employéSonnerie, cette compétence d'un côté, d'autre part, c'est cultiver sa propre analyse.Après tout, la technologie est facile à remplacer et la pensée est la vôtre, vous êtes différent de vous-même.D'autres des autres.