测试数据内容如下:
IDNAMESALARYSEX1Huan30000男2Gua200男3Meng1200女4Yu3500女 1. 中括号选择相关列选择全部列的方法如下:
salarys[,]只选择一列的方法是:
salarys['ID']选择多列必须要使用c函数,方法如下:
# 错误的写法,无法显示正常salarys['ID','NAME']# 正确的写法salarys[c('ID','NAME')] 2. 数据转换用apply函数可以对整个数据进行转换,如果要对某一列进行转换,必须要使用属性匹配赋值,如下:
# 对数据进行处理,返回LISTsalarys$SEX <- lapply(salarys$SEX, function(x) switch(x, FEMALE='女', MALE='男'))# 将List转换为向量salarys$SEX <- c(salarys$SEX, recursive = TRUE) 3. 数据筛选筛选只满足特定条件的数据行
# 筛选ID为偶数的列subset(salarys, subset=(ID %% 2 == 0))# 筛选所有女性的数据列subset(salarys, subset=(SEX == '女'))用[]也可以进行数据行筛选,如下:
# 记住,最后的那个逗号不能省salarys[salarys$ID %% 2 == 0,]再强调一次,最后的那个逗号不能省,否则可能会出现数据列的筛选效果。