评论

收藏

[R语言] R语言基础复习框架

编程语言 编程语言 发布于:2021-07-13 18:32 | 阅读数:336 | 评论:0

  
第一章   R语言概述
  1.认识R语言并学会安装R和RStudio
  2.使用help.(start),help(“”), 等获取帮助命令
  3.使用getwd()查看当前工作目录,setwd()设置当前工作路径
  4.掌握R的工作空间管理命令
  5.install.packages()安装包    library() 加载包
  6.数据集iris
  7.head()查看前6行数据    data()列出已载入的包中的所有数据集

第二章 数据对象与数据读写          
  2.1 查看数据类型
  2.1.1
  (1)基本数据类型:数值型(numeric),逻辑型(logical),字符型(character),复数型(complex ),整数型(integer )
  (2)对象包含类型
  (3)变量命名原则:变量名以字母或不以数字后跟的点开头,由字母,数字和点或下划线字符组成。
  2.1.2 查看与转换对象的类型
  1.查看数据类型:class(x)   mode(x)   typeof(x)
  2.转换数据类型:例               
  类型                       判别函数                                          转换函数
  character                    
  is.character()
  as.character()
  2.2判断数据结构
  2.2.1向量
  1.向量的创建
  (1)直接创建向量(2)c函数创建(3)sep函数创建等差序列的向量(4)rep函数创建重复序列
  2.向量索引:我们只要访问向量中的部分或个别元素
  3.向量编辑:主要包括元素扩展,删除元素、改变元素的值等编辑操作
  4.向量排序:sort函数           
  2.2.2矩阵
  1.创建矩阵:matrix函数 ,diag函数
  2.矩阵索引:使用两个下标便可以表示矩阵中的元素。
  使用下标和方括号来选择矩阵中的行、列或者元素
  3.矩阵编辑:主要包括修改矩阵元素的值、删除指定的行或列、矩阵的合并。
  4、矩阵的运算:四则运算、对矩阵各行列的求和、对矩阵各行列的求均值、转置等

  • 矩阵的合并: cbind函数 rbind函数
  2.2.3数组
  1.创建数组:array函数
  2.数组索引
  2.2.4数据框
  1.创建数据框:data.frame函数
  2.数据框索引:subset函数  sqldf函数
  3.数据框编辑:通过edit函数和fix函数手动修改,
  通过rbind函数和cbind函数分别增加新的样本数据和新属性变量
 
  2.2.5列表
  1.创建列表:list函数
  2.列表索引:可以直接使用列表下标的形式,也可以使用列名称的形式
  3.列表编辑: 与向量相似,可使用c函数合并,把列表转换为向量时需要用到unlist函数
  2.2.6数据结构的判别与使用
  2.3.读入不同数据源的数据
  2.3.1从键盘读入数据
  2.3.2读写带分隔符的文件
  1.TXT文件:read.table函数
  2.CSV文件:read.csv函数
  3.读取Excel文件
  2.3.3  导入网页数据

第3章 数据集基本处理
  3.1新增数据属性列
  3.3.1访问数据框变量
  直接调用数据框内的列,以列的名称作为向量的名称
  attatch()
  detatch()
  在函数内部,对数据进行相应调整
  with()   #with 函数内部形成一个空间,在这个空间中,函数可以对列访问。
  within()
  transform() # 数据的转换 ,如取 log
  subset()      #取数据的子集
  apply() #对数据表或矩阵应用某个函数,可减少循环
  sqldf函数索引
  3.1.2创建新变量:变量名 <-表达式
  运算符 ‘+’, ’-’ , ‘*’ , ‘/’ ,  ‘^’ , ’x%%y’ ,’x%/%y’
  1.创建数据框 2.创建新变量 3.transform函数
  3.1.3 修改变量名

  • 交互式编辑器修改变量名 2.Rename函数3.names函数 4.colnames函数 5.rownames函数
  3.2 清洗数据
  3.2.1缺失值分析
  1.is.na(x)  2.anyNA(x,recursive = FALSE)  3.na.omit(x)  4.complete.cases(x)
  3.2.2处理日期变量
  1.as.Date函数 2. 2.as.POSIXlt函数  3.strptime函数  4.strftime函数 5.format函数
  3.2.3 数据排序
  1.sort函数 2.rank函数 3.order函数
  3.2.4 合并数据集
  数据框的编辑可以通过rbind和cbind函数。
  3.3 选取变量及数据
  3.3.1选取变量
  3.3.2删除变量
  3.3.3使用subset函数选取数据
  3.3.4随机抽样
  1.srswr函数   2.srswor函数    3.sample函数
  3.4 整合数据
  3.4.1使用SQL语句操作数据
  3.4.2 汇总统计数据:aggregate()函数:
  3.4.3 重塑数据
  1.merge 函数  2.melt函数
  3.5处理字符数据
  3.5.1正则表达式
  用于描述或匹配一个文本集合的表达式。
  元字符:’.’  ,  ‘\\’  ,  ’|’ ,‘^’ , ’$’ , ‘()’ , ‘[]’ , ‘{}’ , ’*’ , ‘+’, ‘?’
  3.5.2字符串处理函数
  1.grep函数 2.sub函数 3.gsub函数 4.strsplit函数 5.paste函数

第4章 函数与控制流
  4.1使用常用函数及apply函数族处理数据
  4.1.1数据处理的常用函数
  1.数学函数
  abs(x),sqrt(x), ceiling(x), floor(x),trunc(x),等
  2.统计函数
  mean(x),median(x),range(x),sum(x),min(x),max(x)等
  常见的有密度函数,分布函数,分位数函数和生成随机数函数。
  4.1.2使用apply函数族批量处理数据
  1.apply函数 2.lapply函数 3.sapply函数 4.tapply函数 5.mapply函数
  4.2编写条件分支语句
  1.if-else结构 2.ifelse结构 3.switch分支语句
  4.3循环语句
  1.for循环语句 2.while循环语句 3.repeat-break循环语句
  4.4编写自定义函数
  求矩阵的乘积

第5章 初级绘图
  5.1绘制基础图形
  5.1.1分析数据分布情况
  1.直方图:hist函数 2.条形图:barplot函数 3.饼图:pie函数
  4.箱线图:boxplot函数
  5.1.2分析数据间的关系
  1.散点图:plot函数 2.散点矩阵图:pairs函数
  3.多变量相关矩阵图:corrgram函数
  5.1.3 绘制其他图形
  1.核密度图 2.小提琴图 3.QQ图 4.星状图 5.等高图
  5.2修改图形参数
  5.2.1修改颜色:参数col
  1.color函数 2.palette函数 3.rgb函数 4.rainbow函数
  5.RColorBrewer包
  5.2.2修改点符号和线条
  1.点样式  2.线条样式 :llines函数abline函数,segments函数,
  arrows函数,grid函数
  5.2.3修改文本属性
  1.参数:cex,col,font   2.函数:title ,text ,mtext
  5.2.4设置坐标轴:axis函数
  5.2.5添加图例:legend函数
  5.3绘制组合图形
  1.par函数 2.layout函数
  5.4保存图形

第6章高级绘图
  6.1使用lattice包绘图
  Lattice包绘制对象是一个表达式y~x
  1.图形参数
  (1)lattice包将默认的图形参数归总到指定列表对象中,
  (2)show.settings函数可展示当前的图形参数设置情况。
  (3)可使用trellis.par.get函数获取参数列表,trellis.par.set函数则可以修改参数列表。
  (4)字体参数:fontsize
  2.条件变量
  (1)lattice包绘图工具可以通过添加条件变量,创建出各个水平下的面板。
  (2)lattice包中,可以通过管道符号(|)来添加条件变量v,其格式如下所示:
  3.面板函数
  (1)在lattice包中,每个高级绘图函数都调用了一个默认的函数来绘制面板
  (2)这些默认的函数服从如下命名惯例:panel.graph_function,其中graph_function是该水平绘图函数。如xyplot函数默认的绘图函数为panel.xyplot
  4.分组变量
  (1)通过添加条件变量(x ~ y | A + B),可以创建出各个水平下的面板。
  (2)若想要把不同水平的图形结果叠加到一起,则可以将变量设定为分组变量(group参数),
  5.图形变量
  将lattice图形存储到对象中,然后利用plot函数中的split和position参数选项来进行控制。
  6.1.2使用lattice包
  1.条形图:barchart函数  2.点图:dotplot函数 3.直方图:histogram函数
  4.核密度图:densityplot函数 5.带状图: stripplot函数 6.QQ图: qqmath函数
  7.箱线图: bwplot函数 8.散点图: xyplot函数 9.散点矩阵图: splom函数
  10.三维水平图: levelplot函数 11.三维等高线图:contourplot函数
  12.三维散点图:cloud函数  13.三维曲面图:wireframe函数
  6.2使用ggplot2包绘图
  1.qplot函数
  2.ggplot2绘图
  (1)绘制画布
  (2)几何对象
  (3)统计变换
  (4)标尺设置
  (5)坐标系转换
  (6)分面
  6.3认识交互式绘图的工具
  6.3.1使用rCharts包生成网页动态图片
  1.nPlot函数  2.hPlot函数 3.mPlot函数
  6.3.2利用googleVis包实现数据动态可视化
  6.3.3 利用htmlwidgets包实现绘图的网页化分享
  1.leaflet包 2.dygraphs包 3.plotly包 4.DT包 5.networkD3包

  
关注下面的标签,发现更多相似文章