1. Scientifiques de données, ingénieurs de données, analystes de données discriminatoires
avec la chaleur envisagée de données importantes, l'occupation des grandes données pertinentes est devenue populaire. Il a beaucoup d'occasions de développer des talents. Les scientifiques de données, les ingénieurs de données, les analystes de données sont devenus les positions les plus populaires dans la grande industrie de données. Comment déterminent-ils? Que fais-tu? De quelles compétences avez-vous besoin? Regardez.
Comment se trouvent ces trois professions localement?
1. Qu'est-ce que les scientifiques de données?
Les scientifiques de données font référence à la régénération numérique et à la connaissance de la complexité et de la majorité, des symboles, du texte, des URL, de l'audio ou de la vidéo, utilisent les outils d'extraction de données et trouvent des ingénieurs ou des experts sur les données de perspicaces (différentes de statistiques ou analystes).
2. Comment les ingénieurs de données déterminent-ils?
Les ingénieurs de données sont généralement définis comme "La compréhension profonde des ingénieurs du logiciel Star ". Si vous êtes inquiet d'un problème d'entreprise, vous avez besoin d'un ingénieur de données. Leur valeur fondamentale est qu'ils créent des tuyaux de données de pins via des données claires. Comprendre les systèmes de fichiers complets, les ordinateurs distribués et les bases de données sont les compétences. Nécessaire de devenir un excellent ingénieur de données. Les ingénieurs de données ont une bien compréhension de l'algorithme. Par conséquent, les ingénieurs de données exécuteront le modèle de données de base. Les besoins de haut niveau ont une demande de calcul. Plusieurs fois, ces besoins sont dépassés des ingénieurs de données à maîtriser La portée des connaissances, cette fois, vous devez appeler pour demander l'aide des données scientifiques.
3. Comment les analystes sont-elles compris?
Les analystes de données font référence à des industries différentes, spécialisée dans les données industrielles collecte, finition, analyse et experts dans la recherche, l'évaluation et les prévisions de l'industrie selon les données. Ils savent faire la bonne question, trèsBon analyse de données, visualisez les données et les rendus de données.
Y a-t-il une tâche?
1. Tâches de mission des scientifiques de données
Les scientifiques de données ont tendance à regarder le monde entier avec des données d'exploration. Tournez beaucoup de données dispersées dans des données structurées pour l'analyse, mais également pour trouver des sources de données riches, l'intégration d'autres sources de données peut ne pas être exhaustive et nettoyer les données de résultats. Dans un nouvel environnement concurrentiel, des défis en constante évolution et de nouvelles données sont transmis de manière continue. Les scientifiques de données ont besoin d'aide qui décident de passer par différentes analyses, analysez leur analyse d'interaction continue de données. Quand ils ont découvert, ils ont découvert, proposant de nouveaux partis d'entreprise. Ils sont très créatifs pour afficher des informations visuelles, rendre le modèle à trouver clair et persuader. Les recommandations pour le patron contiennent régulièrement des données, affectant ainsi les produitsm, processus et décision.
2. Responsabilités des ingénieurs de données
Analyse historique, prédictant le choix futur, l'optimisation, il s'agit de trois gros ingénieur de données est le plus important lorsque "Transmetteur de données". À travers trois instructions pour le faire, ils aident les entreprises à prendre de meilleures décisions commerciales.
Les gros ingénieurs de données sont un travail très important, qui consiste à comprendre les caractéristiques des événements passés en analysant des données. Par exemple, le groupe de données de Tencent construit un grand nombre de données, brossé et des informations sur les données ne sont pas contrôlées sur toutes les entreprises, résumant les fonctionnalités de la société pour répondre aux besoins de la société, y compris les sites de publicité, le développement de jeux, les réseaux sociaux, etc.
Les caractéristiques des événements passés sont d'aider les entreprises à mieux comprendre les consommateurs. En analysant la trajectoire comportementale passée de l'utilisateur, vous pouvez comprendre cette personne et prédire votre comportement.
En introduisant des facteurs clés, les grands ingénieurs de données peuvent prédire les tendances de la consommation futures. Sur la plate-forme marketing de Ali Maman, les ingénieurs tentent d'aider les vendeurs Taobao Business en introduisant des données météorologiques. Par exemple, cet été n'est pas chaud, il est probable que certains produits n'ont pas été bien vendus l'année dernière, à l'exception des climatiseurs, des ventilateurs électriques, des gilets, des maillots de bain, V.V. peut être affecté. Après cela, nous établirons la relation entre les données météorologiques et les données de vente, trouverez les catégories qui lui sont liées, l'avertissement des revenus du vendeur à l'avance.
Selon la nature commerciale de différentes entreprises, de grands ingénieurs de données peuvent atteindre des objectifs différents par l'analyse des données. À Tencent, l'exemple facile et franc reflète le travail des grands ingénieurs de données pour tester les options (TEST AB), c'est-à-dire aider les gestionnaires de produits dans les deux alternatives d'A et B. Auparavant, les principales planificateursLes livres ne peuvent être évalués qu'en fonction de leur expérience, mais les gros ingénieurs de données d'aujourd'hui peuvent vérifier une série de tests en temps réel, tels que dans l'exemple de produits de réseau social, laissez la moitié de l'utilisateur voir l'interface, une autre moitié à l'aide de l'interface B , Statistiques de suivi Cliquez sur le taux de clic et le taux de conversion pendant une période donnée pour aider le service du marché à offrir ensemble l'option finale.
3. Responsabilités de travail des analystes de données
L'Internet elle-même a des fonctionnalités numériques et interactives, fournissant une collecte de données, complète de bonnes et de recherches. Avancée révolutionnaire. Les analystes de données passées "World Atomic" ont dû dépenser un coût élevé (fonds, ressources et temps) pour obtenir une recherche de soutien, une analyse des données, des données riches, totales, continues et opportunes, bien plus que l'ère Internet.
Par rapport aux analystes de données traditionnelles, des analyseurs de données mutuels dans TLe réseau ne manque pas de données, mais des données de débordement. Par conséquent, les analystes de données de l'ère Internet doivent apprendre à effectuer un traitement efficace des données avec des techniques. Plus important encore, les analystes de données de l'ère Internet innovent et innovent constamment et rompent des méthodes de recherche de données.
Selon l'industrie concernée, la valeur des analystes de données similaires à cela. En ce qui concerne les nouvelles de l'industrie de l'édition, si l'opérateur du véhicule peut être correct ou non, l'opérateur du véhicule peut comprendre le statut et modifier la tendance détaillée et la clé du succès ou de l'échec des médias.
De plus, pour l'industrie du contenu tel que la presse et les publications, il est important que les analystes de données puissent jouer un consommateur de la fonction d'analyse de données humaine, il est essentiel d'améliorer le service à la clientèle. Une fonction.
Quelles compétences avez-vous besoin de faire dans ces trois professions?
Normalement, les scientifiques de données ont la plupart des exigences de programmation, la plate-forme professionnelle liée à l'informatique. Mettez simplement, c'est une compétence liée à la technologie de traitement parallèle à grande échelle telle que Hadoop, Mahout, V.V. Nécessaire pour gérer de grandes données.
Mathématiques, statistiques, mines de données, V.V.
Outre les mathématiques, les statistiques sur l'alphabétisation, il existe également une compétence d'analyse statistique grave telle que SPSS, SAS. Parmi eux, des langages de programmation open source pour l'analyse statistique et l'environnement d'exploitation récemment attiré l'attention. R La force de R n'est pas seulement une riche bibliothèque d'analyse statistique, mais également les fonctions pour créer des graphiques de haute qualité pour visualiser les résultats et utiliser une commande simple. De plus, il comprend également un mécanisme d'extension d'emballage appelé Cran (réseau de stockage R complet), qui peut utiliser des fonctions et des ensembles de données qui ne sont pas pris en charge dans les états standard en entrantPaquet d'extension.
Visualisation
La qualité des informations dépend principalement de son expression. L'analyse de la signification des données dans les données comprend des colonnes numériques, le développement de prototypes Web, l'utilisation d'API externes pour fusionner avec d'autres services tels que des cartes telles que des graphiques, des cartes, des panneaux de contrôle, des résultats analytiques sont visualisés, il est très important pour les scientifiques de données. Une des compétences.
2. Les ingénieurs de données doivent être compétents
pour les grands ingénieurs de données trouvant en tant que statistique maître ou doctorat de niveau et une plate-forme mathématiques. Les travailleurs de données manquent de plate-forme théoretor, plus facile à entrer dans des zones dangereuses - une variété de chiffres et ont toujours des résultats dans différents modèles de données et algorithmes, mais si vous ne connaissez pas le représentant, cela n'a pas vraiment de sens et que des résultats faciles à obtenir vous tromper. Une seule connaissance de certaines théorie peut être compriseModèle, modèle de multiplexage et même modèles innovants pour résoudre de vrais problèmes.
Capacités de cryptage informatique
Les capacités de développement réelles et la capacité de traitement de données à grande échelle sont certains des facteurs nécessaires tels que les techniciens de grandes données. Étant donné que la valeur de nombreuses données provient du processus d'excavation, vous devez le faire vous-même pour envoyer la valeur de l'or. Par exemple: Maintenant, de nombreux enregistrements créés sur des réseaux sociaux sont des données non structurelles, comment capturer des informations significatives à partir de documents, de voix, d'images et même de cette vidéo, nécessite des données complètes à détecter. Même dans certaines équipes, les tâches des grands ingénieurs de données sont basées sur l'analyse des entreprises, mais peuvent également s'habituer aux ordinateurs pour gérer des données importantes.
Les gros ingénieurs de données Ce rôle est très important, il est indissociable du marché, car les données importantes ne sont disponibles que dans des zones spécifiquement. Combinez pour créer une valeur. Par conséquent, dans une certaine industrie hPlus ou plus peut accumuler une prise de conscience de l'industrie pour le demandeur, il a une aide précieuse pour les ingénieurs de données suivants. C'est donc également plus convaincant.
. Il est préférable d'avoir ses propres idées. Si vous êtes séparé de la conscience industrielle et de la plate-forme commerciale de la société, les résultats de l'analyse ne seront qu'un cerf-volant à déconnecté et n'ont pas beaucoup de valeur.
D'une part, il est nécessaire de créer un cadre d'analyse de données. Par exemple, il est nécessaire d'utiliser la théorie du marketing, de la gestion, etc. Si la théorie de la gestion familière, il est difficile de créer un cadre d'analyse de données et d'analyser les données suivantes aussi difficiles. D'autre part, le rôle de l'analyse des données est eExporter pour faire un guide significatif.
fait référence au principe de l'analyse de données de base et de certaines méthodes d'analyse de données efficaces, et peut être appliquée flexible pour les travaux réels pour mettre en œuvre efficacement l'analyse des données. La méthode d'analyse de base est la suivante: analyse de contraste, analyse de groupe, analyse croisée, analyse structurelle, méthode d'analyse de la trémie, analyse complète d'évaluation, analyse des facteurs, méthodes d'analyse corrélation de matrice, etc. La méthode d'analyse avancée est la suivante: analyse de corrélation, analyse de régression, analyse de grappes, analyse de discrimination, analyse principale des composants, analyse factorielle, analyse respective, séries chronologiques, v.v.
Comprendre l'outil
fait référence aux outils courants liés à l'analyse des données. Les méthodes d'analyse des données sont la théorie et les outils d'analyse des données sont des outils pour obtenir des méthodes d'analyse de données. Face à l'augmentation des données,Nous ne pouvons pas compter sur des ordinateurs pour analyse et devons compter sur des outils d'analyse de données puissants pour effectuer une analyse de données.
Découvrez que la conception fait référence à l'analyse des analyseurs de données avec le graphique, ce qui rend les résultats de l'analyse en un coup d'œil. La conception du graphique est une université qui demande, telle que graphiques, conceptions de mise en page, combinaisons de couleurs, V.V vous devez maîtriser un certain principe de conception.
II. Plan de développement en 9 étapes pour les scientifiques de données de recrue
Premièrement, chaque entreprise a des définitions différentes des scientifiques de données, actuellement non disponible définition unifiée. Mais en général, un scientifique de données combine des ingénieurs logiciels et des compétences statistiques et investit beaucoup de connaissances dans son domaine dans son domaine ou espère travailler.
Environ 90% des scientifiques de données ont au moins une expérience d'enseignement supérieur et même cMauvais docteur et doctorat. Bien sûr, le domaine de leur niveau est très large. Certains employeurs découvrent même que les personnes souffrant d'humanités ont quelque chose à créer, ils peuvent enseigner certaines compétences clés.
Par conséquent, il doit exister des mesures pour devenir un scientifique de données?
1. Examinez vos compétences en mathématiques et statistiques
Un bon scientifique de données doit être un contenu abordable Compréhension de la compréhension de vous le dire, de faire cela , vous devez avoir une base linéaire linéaire, un algorithme et une compréhension des compétences statistiques. Les mathématiques plus élevées peuvent nécessiter des mathématiques plus élevées dans une occasion spécifique, mais c'est un bon départ.
2. Découvrez le concept de machine d'apprentissage
Apprendre que la machine est les prochains mots émergents, mais il y a mille liens avec de grandes données. Apprenez des machines à l'aide d'algorithmes d'intelligence artificielle pour convertir des données en valeur et n'ont pas besoin de programmation claire. 3. Code d'apprentissage
Les scientifiques de données doivent savoir comment ajuster le code pour permettre à l'ordinateur de savoir comment analyser les données. D'une langue open source comme Pyhãy commence là-bas.
4. Comprenez la base de données, le groupe de données et le stockage distribué
. Et comment créer ce remboursement de données dépend de la manière dont vous accédez, utilisez et analysez ces données. Si vous n'avez pas d'architecture maîtresse ou de planifiez avant de créer votre stockage de données, l'effet suivant sera réalisé très loin.
5. Apprenez la modification des données et la technologie de nettoyage des données
Modifier les données comme format pour aider les données brutes à un accès et d'analyse faciles que. Le nettoyage des données supprime la répétition et les données "mauvaises". Les deux sont des outils essentiels dans la boîte à outils Science de données.
6. Comprendre la connaissance de base des images et signaler de bonnes données
Vous n'êtes pas un concepteur plat, mais vous devez comprendre comment créer un rapport de données, facilement qui voyagent, tels que votre responsable ou votre PDG, peut comprendre.
7. Ajoutez plus d'outils à votre boîte à outils
Lorsque vous avez les conseils ci-dessus, il est temps d'élargir votre boîte à outils Science de données, y compris la langue Hadoop, la langue R et l'étincelle. L'expérience et la connaissance de ces outils vous permettront de rester sur un grand nombre de personnes à la recherche de sciences de la technologie.
8. Exercice
Comment pratiquez-vous de devenir des scientifiques de données avant d'avoir un emploi dans les nouveaux champs? Utilisez Open Source pour développer un projet que vous aimez, participer au concours, devenir un scientifique de données en réseau, participer à des camps de formation, de bénévolat ou de stagiaires. Les meilleurs scientifiques de données auront de l'expérience et de l'intuition dans le domaine des données et peuvent montrer les copiesMme leur m de devenir candidat.Suivez les chefs de pensée dans le même secteur, lisez les blogs et les sites Web de l'industrie, participez et posez des questions et suivez les nouvelles et la théorie.