subset()函数,可以选择变量和观测最好的函数:实例如下:
> leadership
manager date country gender age q1 q2 q3 q4 q5 cat
1 1 10/24/08 us M 32 5 4 5 5 5 young
2 2 10/28/08 us F 45 3 5 2 5 5 young
3 3 10/1/08 uk F 25 3 5 5 5 2 young
4 4 10/12/08 uk M 39 3 3 4 NA NA young
5 5 5/1/09 uk F NA 2 2 1 2 1 <NA>
> leadership[which(leadership$age>=40&leadership$gender=="M"),]#用which来查看leadership数据框中年龄大于四十并且是男性的信息
[1] manager date country gender age q1 q2 q3 q4
[10] q5 cat
<0 行> (或0-长度的row.names)
> leadership[which(leadership$age<=40&leadership$gender=="M"),]#用which来查看leadership数据框中年龄小于四十或是男性的信息
manager date country gender age q1 q2 q3 q4 q5 cat
1 1 10/24/08 us M 32 5 4 5 5 5 young
4 4 10/12/08 uk M 39 3 3 4 NA NA young
> subset(leadership,gender=="M"|age>25,select=q1:q5)#使用subset(函数来查看年龄大于25且是男性的信息,所选择的列为q1到q5列。Subset函数第一个参数是所要选择的数据框,第二个参数是所要查看信息的方法,比如某个范围等等,第三个参数是所选取的要查看的某个区域。
q1 q2 q3 q4 q5
1 5 4 5 5 5
2 3 5 2 5 5
4 3 3 4 NA NA