L Language R: Choisissez des colonnes dans la zone de données par emplacement

Premièrement, le problème

Certaines colonnes sont sélectionnées dans la zone de données de l'emplacement des données.

Sélectionnez une ligne de données comme suit:

Code

DFFM [ [N]

Cela renvoie des données de colonne, à savoir la nième colonne de la DFRM.

Pour sélectionner plusieurs données de colonne dans la zone de données et l'emballer dans une nouvelle zone de données, utilisez l'expression suivante:

DFFM [N ]

Cela renvoie une zone de données qui n'inclut que les données de la colonne DFRM NTH.

DFFM [C (N1, N2, .. NK)]

Cela renvoie N1 de DFRM, N2 ,. la trame de données comprend des colonnes NK. Vous pouvez également choisir une ou plusieurs colonnes dans un indicateur de matrice:

renvoie la colonne Nombre N (Supposons n un évaluer).

DFRM [, C (N1, N2, .. NK)]

est renvoyé par N1, N2, .. la trame de données comprend des colonnes NK.

Notez que, selon votre choix, est une colonne ou plusieurs colonnes, le type d'enregistrement matriciel peut renvoyer deux types de données (colonne unique ou zone de données).

Discussion
Il existe de nombreuses façons de choisir des colonnes dans la zone de données. Avant de comprendre la relation logique entre cela, vous êtes certainement un brouillard. Lorsque vous lisez les explications ci-dessous, faites attention aux modifications du microscope dans la syntaxe, telles que des virgules, des supports et des crochets qui affectent l'expression.

Cependant, nous résoutons les données de la population de 16 grandes villes de la région de Chicago:

& GT;

City Pop District

2 Kenosha Kenosha WI 90352
3 Aurora Kane IL 171782

4 Elgin Kane IL 94487

5 Gary Lake (In) en 102746

7 Naperville Dupage IL 147779

8 Hauteur d'Arlington Cook Il 76031

10 CICERO COOK IL 72616

EVANSTON COOK IL 74239

.

13 cuisson palatine IL 67232

14 Cuire Schaumburg IL 75386

16 Waukegan Lake (IL) IL 91452

peut être sélectionné correctement avec le concept d'une liste de colonnes, telle que choisir la première colonne:

& GT; Suburbs [1]

[1] "Chicago" Kenosha "" Aurora "" Elgin "

[5]" Gary "" Joliet "" Naperville "" Arlington Heihants "]

[9] "Bolingbrook" "Cicero" "" Hammanston "

[13] [13]" "Palatine" "Schaumburg" "Skokie"

La première colonne de banlieue est un vecteur, de sorte que la banlieue [1] renvoie un vecteur. Si la première colonne est un facteur, nous obtiendrons le facteur.

Si les mots suivants sont utilisés, les résultats changent, tels que des banlieues [1] ou des banlieues [C (1, 3)]. RésultatToujours la colonne sélectionnée, mais r divisera le rapport d'une boîte de données. La première colonne est renvoyée ci-dessous est emballée dans la zone de données:

Code

& GT; Suburbs [1]

2 Kenosha

3 Aurora
4 Elgin

6 Joliet

7 Naperville

8 Arlington Hauteur

9 Bolingbrook

11 Evanston

12 Hammond

13 Palatine

15 Skokie

.

L'exemple suivant reviendra en premier et sous forme de boîte de données. Troisième colonne:

& GT; Suburbs [C (1, 4)]

POP

.

. 1 Chicago 2853114 3 Aurora 171782 5 Gary 102746 . ] 7 Naperville 147779 9 Bolingbrook 70834 10 CICERO 72616 11 Evanston 74239 14 Schaumburg 75386 15 Skokie 63348 16 WAUKEGAN 91452 Une raison importante de confondre les banlieues [1] et de la banlieue [1] sont très petits, mais les résultats des deux sont gros.: Suburbs [1] renvoie une ligne de données. Suburbs [1] Ceci est renvoyé dans une zone de données où une seule carte de colonne est disponible. C'est vraiment un cas particulier de DFRM [C (N1, N2, .. NK)]. Parce que seulement certains ici, c (...) est inutile. La clé Voici la "Données de colonne" Contrairement à la "Cadre de données contenant des données de colonne".La première expression renvoie une ligne de données, un vecteur ou un coefficient; La deuxième expression renvoie une boîte de données, pas la même. Le concept de matrices peut également être sélectionné dans R et nous avons montré à travers la solution. Ici, vous devez mettre l'accent sur une fonctionnalité étrange: vous pouvez obtenir une ligne de données ou obtenir la zone de données, en fonction du nombre d'index que vous utilisez. La situation la plus simple n'est qu'un indicateur, puis reçoit des devis de données: & GT; [1] [1] "Chicago" "Aurora" "Aurora"[5]" Gary "" Joliet "Napliville" "Arlington Heights" [9] "Bolingbrook" "Cicero" "Evanston" Hammond " [13]" Palatine "" Schaumburg "" Skokie "" Waukekegan " Plus d'un signe, revenir à plusieurs abonnements, renvoyé sous forme de boîte de données: & gt; banlieue [, c (1, 4)] POP City 3 Aurora 171782 4 Elgin 94487 7 Naperville 147 779 . . ] . . . 8 Hauteur Arlington 76031 11 Evanston 74239 12 Hammond 83048 15 Skokie 63348 16 WAUKEGAN 91452 Cela a conduit à un problème. Rejoignez votre expression dans l'ancien scénario R: DFRM [, VEC] Retourne les livres de données de noms ou une boîte de données ? OK, cela dépend d'une situation spécifique. Si une seule valeur est incluse dans la VEC, il est mDes données de colonne; Sinon, une boîte de données sera prise. Seulement à partir de cette forme de grammaire est incapable de déterminer le résultat final. Pour éviter ce problème, vous pouvez ajouter DROP = FALSE dans l'index; Forcé R a converti le résultat de retour dans une zone de données: DRFM [, VEC, DROP = FALSE] . La structure est renvoyée en ce moment ne sera pas vague et ce sera une boîte de données. En bref, ce n'est pas un bon moyen de choisir une colonne dans la zone de données avec la matrice. Je recommande de remplacer cette méthode avec l'opérateur de la liste précédente. Cette fonction est exactement la même chose, mais c'est plus concis. Je pense toujours que le type de données renvoyé par ces opérations est identique, généralement dans la matrice, le vecteur et le cadre de données et le reconnaît soudainement. Les règles étranges en r sont beaucoup.

Sujets

Les données

Catégories

Analyse des données