|
一、选择题(共20题,每题2分,共40分)
1.R语言中导入其他包使用的语句是?
A.use
B.library
C.install
D.import
正确答案:B
2.函数c()的作用是生成一个()?
A.矩阵
B.向量
C.数据框
D.其余都可以
正确答案:B
3.mean函数的作用是?
A.分位数
B.中位数
C.方差
D.平均数
正确答案:D
4.p<-data.frame(patientID,age),其中patientID是()?
A.其余都不对
B.行名
C.列名
D.单元值
正确答案:C
5.绘图时如需调整颜色,修改的参数是?
A.Col
B.color
C.col
D.其余都可以
正确答案:C
6.纵向合并两个数据框,使用的函数是?
A.rbind
B.其余都不对
C.bind
D.cbind
正确答案:A
7.横向合并两个数据框,使用的函数是?
A.cbind
B.bind
C.其余都不对
D.rbind
正确答案:A
8.ceiling(3.475)的返回值是?
A.3
B.4
C.5
D.2
正确答案:B
9.x <- "abcdef"
substr(x, 2, 4)的返回值是?
A.其余都不对
B.abc
C.cde
D.bcd
正确答案:D
10.拟合线性模型最基本的函数是?
A.其余都正确
B.rm
C.lm
D.fm
正确答案:C
11.b<-c("a")执行后,b是什么类型向量?
A.字符型
B.逻辑型
C.其余都不对
D.数值型
正确答案:A
12.按照性别、年龄升序排序,可以表达为?
A.其余都正确
B.order(gender), order(age)
C.order(gender,age)
D.order(gender asc)(age asc)
正确答案:C
13.while(i>0){print("hello";i<-i-1}执行后,hello被输出了多少次?
A.其余都不正确
B.11
C.9
D.10
正确答案:A
14.R语言中的无效变量是?
A.变量名称由字母、数字和下划线依次组成
B.变量名称由字母、点、下划线依次组成
C.变量名称由字母、数字和点依次组成
D.变量名称由数字开头,由字母组成
正确答案:D
15.可利用as函数将数据对象的存储类型转换为指定的类型,书写格式为?
A.as.存储类型名(数据对象名)
B.as(存储对象名)
C.as(数据对象名)
D.as.数据对象名(存储对象名)
正确答案:A
16.下列不属于R循环结构的是?
A.for
B.repeat
C.loop
D.while
正确答案:C
17.将图像输出到pdf文件的函数是什么?
A.Export
B.pdf
C.output
D.print
正确答案:B
18.有一个名为mydata的数据框,其中有变量x1和x2,如何创建一个sumx,存储x1和x2的和?
A.sumx<-x1+x2
B.sumx<-mydata$x1+mydata$x2
C.mydata$sumx<-mydata$x1+mydata$x2
D.以上都正确
正确答案:C
19.summary()函数的作用是?
A.以上都可以
B.展示值的分布
C.求和
D.展示拟合模型的详细结果
正确答案:D
20.创建自定义函数的语句是?
A.function
B.def
C.define
D.以上都可以
正确答案:A
二、判断题(共5题,每题1分,共5分)
1.R语言是收费的。
A.错误
B.正确
正确答案:A
2.线性回归模型包含一个自变量,一个因变量
A.正确
B.错误
正确答案:A
3.data.frame()的作用是创建一个数据框。
A.正确
B.错误
正确答案:A
4.矩阵是一个二维数组,每个元素都可以拥有不同的模式。
A.正确
B.错误
正确答案:B
5.summary()得到的统计结果中,median代表数值型变量的平均数
A.正确
B.错误
正确答案:B
三、填空题(共5题,每题1分,共5分)
1.为图形添加标题和坐标轴标签的函数名是( )(只写函数名,不用写括号,注意大小写)
正确答案:title
2.R语言中,为变量修改元素名称的函数是()(只写函数名,不用写括号,注意大小写)
正确答案:names
3.条形图的函数名是()(只写函数名,不用写括号,注意大小写)
正确答案:barplot
4.使用自定义函数吋可通过( )函数调用。(只写函数名,不用写括号,注意大小写)
正确答案: source
5.能修改点样式的参数是( )。
正确答案: pch
(说明:根据题目要求写出对应的R命令,并截图。)
1.创建多种数据结构,并进行数据结构的转换、索引、扩展等编辑操作,步骤如下。
- 设置工作空间目录。
- 创建一个向量x,内含元素为序列:11,23, 25, 46, 38, 30, 59, 47, 21, 67。
- 查询向量x中序号为23和46的元素,查询向量x中大于35且小于等于50的元素的位置。
- 创建一个重复因子序列Species:水平数为3,各水平重复两次,序列长度为5; 3个水平为 setosa、versicolor、virginica。
setwd("./d:/rlx") #设置工作空间目录
x<-c(11,23,25,46,38,30,59,47,21,67) #创建向量x
x[c(2,4)] #查询向量中第2,第4位置的元素
which(x>35& x<=50) #查询x中大于35小于等于50元素的位置
#创建一个重复因子序列
Species<-rep(c("setosa","versicolor","virginica"),each=2,length.out=5)
2.写出R的代码,创建一个名为student的数据框,包含这样几个元素:
学生的学号,名字:sno;值:2020001,2020002,2020003
学生的姓名,名字:sname;值:John,David,Kate
学生的年龄,名字:sage;值:20,21,22
学生的专业,名字:dept;值:cs, se, math
正确答案:
sno<-c(2020001,2020002,2020003)
sname<-c("John","David","Kate")
age<-c(20,21,22)
dept<-c("cs","se","math")
student<-data.frame(sno,sname,age,dept)
3.用条件分支语句将成绩划分为5个等级:A (大于等于90 )、B (大于等于80 )、 C (大于等于70 )、D (大于等于60 )、E (小于60 )。例如,对成绩77分进行判断。
x <- 77
if(x>=90){
grade <- '成绩等级:A'
}else if(x>=80){
grade <- '成绩等级:B'
}else if(x>=70){
grade <- '成绩等级:C'
}else if(x>=60){
grade <- '成绩等级:D'
}else{
grade <- '成绩等级:E'
}
x
grade
4.表1所示是某银行的贷款拖欠率的数据bankloan。要求使用ggplot2包完成以下图形的绘制。
- 绘制不同年龄、受教育程度和工龄的客户的收入与负债的直方图。
- 绘制不同年龄、受教育程度和工龄的客户的收人与负债的散点图,并添加回归线。
- 绘制不同年龄、受教育程度和工龄的客户违约与否的条形图。
表1 银行贷款拖欠率数据
5.打开Rattle工具的图形界面,导人Telephone.csv数据,并将数据按照70:15:15的比例分成训练集、验证集和测试集。然后对数据进行探索,完成描述性统计分析操作。
|
免责声明:
1. 本站所有资源来自网络搜集或用户上传,仅作为参考不担保其准确性!
2. 本站内容仅供学习和交流使用,版权归原作者所有!© 查看更多
3. 如有内容侵害到您,请联系我们尽快删除,邮箱:kf@codeae.com
|