Skip to main content

Les analystes de données sont devenus de plus en plus de tirs dans le cercle Internet national ces dernières années et de nombreux développeurs espèrent transférer à l'analyse des données. Aujourd'hui, parler de ces entretiens d'analystes de données.


En fait, la capacité d'analyser les données est les compétences nécessaires de chaque Internet, même si vous n'avez pas de plan d'analyse de données, vous recommandez également de visualiser l'article et d'améliorer votre capacité de données.



Il y avait une caractéristique des données liées à l'analyse des données, très sensible à la quantité. Dans le même temps, il nécessite également une bonne capacité de réflexion pour des données, telles que l'utilisation de services d'instruction de données, la manière de présenter des données dans le rapport.
Lors de l'interview des intervieweurs, vérifiez souvent les capacités en trois dimensions suivantes:

1. Connaissances théoriques (statistiques de probabilité, analyse de probabilité, etc.)




Maître l'algorithme lié à pLa connexion de données est la capacité nécessaire pour les ingénieurs algorithmiques nécessaires. Si votre entretien est lié à l'algorithme, l'intervieweur vous demandera et l'algorithme de problèmes connexes. Par exemple, les algorithmes d'extraction des données communs sont, quels sont vos algorithmes et la différence entre K-quel moyen et le même.

Certains analystes ont besoin d'un certain nombre de certaines plates-formes mathématiques, telles que la théorie des probabilités et les statistiques mathématiques, les principes d'optimisation. Ces connaissances seront utilisées dans l'optimisation des algorithmes.


De plus, une partie du travail des ingénieurs de données ne sont pas seulement des données pré-traitées, telles que des ingénieurs ETL. Cette position vérifie votre capacité à nettoyer et à intégrer les données. Bien qu'ils ne soient pas des liens «alchimy» de l'analyse de données, il représente 80% de l'analyse des données.


2. Outils spécifiques (Sklearn, Python, Numpy, Pandas, V.V.)

Les ingénieurs doivent avoir un outil, vousCela peut comprendre les outils utilisés dans une entreprise de JD quoi. Si vous faites quoi ce qui concerne les algorithmes, il est préférable d'être dans la langue la langue et la langue python les plus appropriées, mais aussi besoin de connaître des outils Python, tels que Numpy, Pandas, Sklearn a la plus compréhensif Dinh.
Les données d'ingénieur ETL doivent également maîtriser les outils ETL, tels que Keatict.

S'il est visualise des données, vous devez maîtriser les outils de données visuels, tels que la visualisation de Python, Tableau, V.V.

Si la collecte des travaux et les données pertinentes, vous devez également avoir besoin d'outils de collecte de données compétents, tels que Python et Octafa Reptiles.

3. Capacité commerciale (pensée des données)


L'essence de l'analyse des données est d'aider les entreprises. Par conséquent, l'analyse des données a un point de connaissance très important du portrait de l'utilisateur.
Portrait des utilisateurs est une scène relativement grande dans les entreprises d'entreprise.Pour analyser les données, c'est l'onglet Données, vraiment une capacité abstraite.

II. TITRE


Dans le cadre de la détection de puissance, un test écrit est une partie très importante. Il peut vérifier directement votre capacité à maîtriser l'analyse des données et la capacité de le faire. J'ai quelques questions simples, vous voudrez peut-être y regarder.
III. Question

1. Avec le langage de programmation, gagnez 1 + 2 + 3 + 4 + 5 + ... + 100.


Cette question est la plate-forme linguistique, vous Peut compléter cette question avec votre langue familière, telle que Python, Java, PHP, C ++, etc. Ici, j'utilise Python:

2. Comment comprendre en forme?

L'adéquation de la conformité et de l'intégration est le concept de base de l'exploitation minière de données. Prédire la formation de données est trop bon. Dans l'environnement de test réel, les erreurs peuvent être créées, de sorte que les scarlets appropriés sont également importants pour l'art.Données des opérateurs de mathématiques.

Incluant que la machine n'est pas suffisante et que l'échantillon de données est trop petit, pas assez pour que la machine se sensibilise à soi-même.

3. Pourquoi est-ce "simple"?


Simpi Bayes est un algorithme de modèle prédictif simple mais extrêmement puissant. La raison pour laquelle Bayes est simple à être appelée car elle suppose que chaque variable d'entrée est indépendante. C'est une hypothèse difficile que la situation réelle n'est pas nécessairement, mais cette technologie est toujours très efficace pour la plupart des problèmes complexes.
4. Quelle est la pensée la plus importante de SVM?
sum = 0for number in range(1,101): sum = sum + numberprint(sum) Le processus de calcul SVM consiste à nous aider à trouver un processus super plat, il a un concept de base appelé: période de classification. Le but de SVM est de déterminer le superfineur correspondant à la valeur maximale de toutes les périodes de classification. En mathématiques, il s'agit d'un problème d'optimisation convexe. De même, nous divisons SVM en un étudiant difficile basé sur la linéarité des données du logiciel, SVM Soft Space et SVMNon linéaire.

5. Quelle est la différence entre les algorithmes K-Autres et Knn?


Tout d'abord, ces deux algorithmes résolvent deux types de problèmes dans l'exploitation minière des données. K-MAINER est l'algorithme de cluster et de Knn est l'algorithme de classification. Deuxièmement, ces deux algorithmes sont deux moyens d'apprentissage différents. K-signifie un apprentissage sans surveillance, c'est-à-dire qu'il n'est pas nécessaire de fournir des étiquettes et des présidents pré-classifiés et que nous devons donner une identité de la distribution de données de formation. Enfin, le sens de la valeur k est différent. La valeur du k-moyen représentant la valeur K. La valeur de Knn représente le voisin K le plus proche.
quatre. Trust


1. Je vous fournirai un groupe de données, si vous souhaitez nettoyer les données, que ferez-vous?

En fait, dans cette question, la note de l'intervieweur est des critères de nettoyage des données de base, les données de nettoyage constituent une partie importante de l'annonce, que ce soit. Vous pouvez voir qu'il y a 2 problèmes de cendresNG Ces données: CAI Wei est apparue deux fois et le score mathématique de Zhang Fei était manquant.


Pour des lignes répétitives, vous devez supprimer l'un d'entre eux. Manquer de données, vous pouvez créer des résultats mathématiques de Zhang Fei.
2. Données de film Doban définit les règles de la relation minière

Il existe un cas très classique dans le domaine de l'analyse des données, ce qui signifie "bière + couche". Cela a effectivement été reflété dans l'analyse des données des règles de creusement. De nombreuses entreprises examineront cet algorithme pour différentes astuces, mais le changement n'est pas de son Zong.

Si vous vous permettez d'utiliser l'algorithme Apriori pour analyser le directeur et les acteurs du jeu de données de film, vous trouverez des éléments de fréquence et des règles de liaison entre les deux. Que fais-tu?


ci-dessus sont une partie du contenu du test d'analyse d'analyse de la rédaction, vous pouvez sentir la spécialité du poste de post-analyste. Bien que l'entretien soitÀ la recherche d'un emploi, mais ce n'est pas une chose qui peut être complétée, mais j'espère transmettre des colonnes pour vous aider.

Sujets

Catégories