R语言学习系列05-数据文件的读写.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R语言学习系列05-数据文件的读写

05. 数据文件的读写一、键盘输入数据适合小数据集,使用函数edit(),操作步骤:1. 创建一个空的数据框或矩阵,设置对应的变量名和变量类型;2. 针对该数据对象,调用文本编辑器,输入数据,并保存。例如,执行如下代码 mydata-data.frame(age=numeric(0),gender=factor(character(0),levels = c(m,f)),weight=numeric(0)) mydata-edit(mydata) mydataage gender weight1 24 f 46将调出“数据编辑器”窗口:注意:函数edit()实际上是在对象的副本上进行操作,若不将其赋值到一个目标变量(本例中mydata),则不会保留改动;或者使用函数fix()会保留改动。二、读取不同格式的数据1. TXT文件使用函数read.table()从带分隔符的文本文件导入数据,基本格式为:read.table(file, header=..., sep=, quote = \,dec=., fill=...,s, s, encoding=unknown, ...)其中,file为包含在内的文件路径+文件名,注意 \ 要换成 / 或 \\;header指定是否将第1行作为变量名,TRUE为是,FALSE为否;sep指定字段的分隔符;quote指定用于包围字符型数据的字符;dec用来标识小数点的字符;fill设置是否填充,若为TRUE,则各行变量数目不同时,将用空白填充;s设置行名的向量,默认为行号1,2,3,…;s设定列名的向量,默认为V1,V2,…;encoding设置读取时的编码方式,避免出现乱码。例1 读取下列txt数据文件:代码及运行结果: setwd(E:/办公资料/R语言/R语言学习系列/codes) datas-read.table(ex05_txt_datas.txt,header=TRUE, sep= ) datasage weight Oxygen runtime rstpulserunpulseMaxpulse1 44 89.47 44.609 11.37 62 178 1822 40 75.07 45.313 10.07 62 185 1853 44 85.84 54.297 8.65 45 156 1684 42 68.15 59.571 8.17 40 166 1725 38 89.02 49.874 9.22 55 178 1802. CSV文件CSV文件就是用逗号分隔的TXT文件。用函数read.csv()读取并保存为数据框,基本格式为:read.csv(file, header=..., sep=,, quote = \,dec=., fill=...,s, s, comment.char=, encoding=unknown, ...)其中,参数同read.table();comment.char指定一个字符用来在数据文件中写注释,以这个字符开头的行将被忽略,若要禁用它,可使用comment.char=。3. EXCEL文件最好的方式是将EXCEL文件转存为CSV文件,再用函数read.csv()读取。使用RODBC包,但只支持32位R(略)。使用xlsx包,需要配置Java环境(略)。使用openxlsx包:(1)读取xlsx函数read.xlsx(),基本格式为:read.xlsx(xlsxFile, sheet=1, startRow=..., colNames=TRUE, rowNames=FALSE, rows=NULL, cols=NULL, namedRegion=NULL)其中,sheet指定读取的工作表;colNames=TRUE指定第1行作为变量名;rowNames=FALSE指定第1列作为行名;rows,cols,namedRegion指定读取行、列、区域。 datas=read.xlsx(iris.xlsx, colNames=TRUE) datasSepal.LengthSepal.WidthPetal.LengthPetal.Width Species1 5.1 3.5 1.4 0.2 setosa2 4.9 3.0 1.4 0.2 setosa3

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档