- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R语言初步
第一节 基本知识
一、界面介绍
R语言是一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R语言最早由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发,所以命名为R语言。
R语言是免费下载的,可以在网站Http:\\/中找到适合自己的镜像网站,下载R语言安装包和其他文件。
R的界面大致如下图所示,包括菜单、快捷键、命令窗口和图形输出窗口。
R主要通过在命令窗口中输入命令来进行操作,菜单能够提供的功能很少,因此学习R需要记住一些常用的命令,更多的命令则需要常备一份命令手册,以便查询。
R的命令窗口中有一个红色的“”符号,操作命令即写在这个符号的后面,完成一条命令后,用回车结束。
用getwd()可以知道R的工作路径,也就是操作过程中的数据、文件等所存储的目录。一般默认的目录为用户的Document目录。为了避免大量的文件混淆,可以专门为R的操作设定一个工作目录。
假定在C盘上建立一个名叫“R”的目录,用以下命令进行设定:setwd(c:\\R),如图:
在这里注意一下,当引用一个路径时,R中需要用到双斜线来表示路径引用,如上文中的c:\\R,这是R的一个特殊情况。
再比如以下操作:
x1-c(10,12,14,16,18)
y1-c(2.5,2.6,3.1,4.6,3.8)
plot(x1,y1)
注意几点:
(1)式子中的“-”表示赋值,也就是把右边的数值赋予左边的变量名。
(2)R语言中对于字母的大小写非常敏感,变量名可以用大写也可以用小写,但用大写字母命名的变量如果改用小写来调用,会无法识别。
(3)如果觉得命令窗口上的内容太多,可以用Ctrl-L来清屏幕。
(4)如果要重新调用此前用过的命令,可以用上箭头回溯此前的命令,也可以用history()来查看历史记录。
(5)命令窗口中的命令行如果太长需要分行,回车后前面会出现一个红色的+号,可以在这后面继续写命令。但如果是在脚本程序中分行,则不需要写这个+号。
二、R的工作空间
启动R之后,即开启了一个特定的工作空间。在这个工作空间中创建的变量会保存下来,在后续的操作中可以反复使用。因此,在使用R时,需要知道自己在工作空间中创建了哪些变量,这些变量分别代表了哪些含义。
比如在上一小节的例子中,我们建立了两个向量x1和y1,那么这两个向量会一直存在于工作空间中。在命令行中直接输入向量名,可以显示出其内容。
x1
[1] 10 12 14 16 18
如果想知道工作空间中有哪些变量存在,可以用ls()函数。如下图
用rm(x1)可以删除变量x1。用下列命令可以删除所有的变量:
rm(list=ls(all=TRUE))
退出R使用q()命令,这时系统会询问是否保存工作空间,可以在对话框中选择“是”或者“否”。也可以在q()命令中进行设定,如:
q(save=yes)
如果保存了工作空间,则在指定的工作目录下会出现一个工作空间文件。下一次启动R的时候,可以直接双击这个工作空间文件,这样在启动R的同时,也会载入相应的工作空间,继续此前的工作。
用load(C:\\R\\.RData)也可以实现同样的功能。
三、加载程序包
R软件安装后,仅包括了基本程序包,能够实现一些常规的统计分析。如果要做一些特殊的分析,则需要加载新的程序包。
比如说,线性判别分析需要用到的lda()函数来自于程序包MASS,用下列方式加载:
library(MASS)
有些程序包来自于其他的软件库,需要选择软件库,然后再选择“安装程序包”,这个可以通过界面上的“程序包”菜单里的选项来完成。在此前,需要先设定CRAN镜像,可以在连网的前提下选择一个中国的镜像站点。
在联网的条件下,通过help(XXXX)命令可以帮助信息,如果不清楚某个命令的参数该如何设定等等,可以边看帮助文件边操作。
第二节 数据管理
一、变量
1. 变量类型
R中的变量包括:
数值型(numeric),其中又包括整型、单精度型、双精度型三类;
逻辑型(logical),取值只能是TRUE或者FLASE,也可以简写为T或者F;
字符型(character),是夹在单引号或者双引号中间的字符串;
复数型(complex),用a+bi的形式来显示;
sqrt(-1+0i)
[1] 0+1i
原始型(raw),是指用二进制方式保存的数据。
2. 变量形式
(1)单一变量:就是存在单一值的变量。
(2)向量:由若干个相同类型的元素构成的序列,是R中最常用的对象,可以用来反映数据分析中的一个变量。
x1-c(10,12,14,16,18)
在上例中,生成了一个名叫x1的向量,包括5个元素。c()称为连接函数,用于把各个分量合并成一个向量。
看看下面的操作
(3)矩
您可能关注的文档
- RNA干扰及其应用..doc
- RLC串联谐振电路的实验研究..doc
- RLE-ME01-光学系统像差测量实验-实验讲义..doc
- RNC各接口集成手册2..doc
- RocketMQ..docx
- RocheLightCycler480中文操作说明..doc
- ROHS标准..doc
- rpc盖板作业指导..doc
- RSA加密..doc
- RSA加密算法..doc
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)