数据分析网

1.2、R语言R的使用—零基础入门教程

微信扫码观看完整版RStudio视频课程、分析师在线答疑解惑哦~

微信扫码-通用.jpg

视频教程
课程摘要

RStudio是一个集成开发环境(IDE),专门用于R语言的开发和数据分析。它提供了一个直观的界面,方便用户编写、调试和运行R代码。RStudio具有许多强大的功能,包括语法高亮、代码自动完成、代码片段、代码重构等,可以提高编码效率。此外,RStudio还提供了数据可视化工具和交互式图形界面,方便用户进行数据探索和可视化分析。它还支持版本控制系统,如Git,方便团队协作和代码管理。总之,RStudio是R语言用户的理想选择,它简化了R语言的开发过程,提供了丰富的功能和工具,帮助用户更轻松地进行数据分析和科学研究。

详细教程

RStudioR的使用


R是一种区分大小写的解释型语言。你可以在命令提示符(>)后每次输入并执行一条命令,或者一次性执行写在脚本文件中的一组命令。 R中有多种数据类型,包括向量、矩阵、数据框(与R中的多数功能是由程序内置函数、用户自编函数和对对象的创建和操作所提供的。 一个对象可以是任何能被赋值的东西。对于R来说,对象可以是任何东西(数据、函数、图形、分析结 果,等等)。每一个对象都有一个类属性,类属性可以告诉R怎么对之进行处理。


一次交互式会话期间的所有数据对象都被保存在内存中。 一些基本函数是默认直接可用的, 而其他高级函数则包含于按需加载的程序包中。


R语句由函数和赋值构成。 R使用<-,而不是传统的=作为赋值符号。例如,以下语句:

x          <-          rnorm(5)

创建了一个名为x的向量对象,它包含5个来自标准正态分布的随机偏差。


一、新手上路


如果你使用的是Windows,   从开始菜单中启动R。 在Mac上,则需要双击应用程序文件夹中的R图标。对于Linux, 在终端窗口中的命令提示符下敲入R并回车。这些方式都可以启动R(R

界面参见下图)。

1.png


让我们通过一个简单的虚构示例来直观地感受一下这个界面。假设我们正在研究生理发育问

题,并收集了10名婴儿在出生后一年内的月龄和体重数据(见下表)。我们感兴趣的是体重的分布及体重和月龄的关系。

2.png


代码清单1-1给出了分析的过程。可以使用函数c()以向量的形式输入月龄和体重数据,此函数可将其参数组合成一个向量或列表。然后用mean()、sd() 和cor()函数分别获得体重的均值和标准差,以及月龄和体重的相关度。最后使用plot()函数,从而用图形展示月龄和体重的关系,这样就可以用可视化的方式检查其中可能存在的趋势。函数q()将结束会话并允许你退出R。


代码清单1-1一个R会话示例

>         age         <-         c(1,3,5,2,11,9,3,9,12,3)

>               weight                <-                c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6. 1)

>        mean(weight)

[1] 7.06

>   sd(weight)

[1] 2.077498

>    cor(age,weight)

[1] 0.9075655

>plot(age,weight)

>   q()


从代码清单1-1中可以看到,这10名婴儿的平均体重是7.06kg, 标准差为2.08kg, 月龄和体重之间存在较强的线性关系(相关度=0.91)。这种关系也可以从下图所示的散点图中看到。不出意料,随着月龄的增长,婴儿的体重也趋于增加。


散点图的信息量充足,但过于“功利”,也不够美观。接下来的几章里,我们会讲到如何自定义图形以契合需要。

3.png


4.png


二、获取帮助


R提供了大量的帮助功能,学会如何使用这些帮助文档可以在相当程度上助力你的编程工作。 R的内置帮助系统提供了当前已安装包中所有函数°的细节、参考文献以及使用示例。你可以通过下表中列出的函数查看帮助文档。

5.png


函数help.start()会打开一个浏览器窗口,我们可在其中查看入门和高级的帮助手册、常见问题集,以及参考材料。函数RSiteSearch()可在在线帮助手册和R-Help邮件列表的讨论存档中搜索指定主题,并在浏览器中返回结果。由函数vignette()函数返回的vignette文档一般是PDF格式的实用介绍性文章。不过,并非所有的包都提供了vignette文档。不难发现, R提供了大量的帮助功能,学会如何使用这些帮助文档,毫无疑问有助于编程。我经常使用?来查看某些函数的功能(如选项或返回值)。


三、工作空间


工作空间(workspace) 就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。在一个R会话结束时,你可以将当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。各种命令可在R命令行中交互式地输入。使用上下方向键查看已输入命令的历史记录。这样我们就可以选择一个之前输入过的命令并适当修改,最后按回车重新执行它。


当前的工作目录 (working directory)是R用来读取文件和保存结果的默认目录。我们可以使用函数getwd() 来查看当前的工作目录,或使用函数setwd() 设定当前的工作目录。如果需要读入一个不在当前工作目录下的文件,则需在调用语句中写明完整的路径。记得使用引号闭合这些目录名和文件名。用于管理工作空间的部分标准命令见下表。

6.png


要了解这些命令是如何运作的,运行代码清单1-2中的代码并查看结果。

代码清单1-2用于管理R工作空间的命令使用示例

setwd("C:/myprojects/project1")

options()

options(digits=3)

x         <-        runif(20)

summary       (x)

hist(x)

q()

首先,当前工作目录被设置为C:/myprojects/project1, 当前的选项设置情况将显示出来,而数字将被格式化,显示为具有小数点后三位有效数字的格式。然后,我们创建了一个包含20个均匀分布随机变量的向量,生成了此数据的摘要统计量和直方图。当q()函数被运行的时候,程序 将向用户询问是否保存工作空间。如果用户输入y, 命令的历史记录保存到文件.Rhistory中,工 作空间(包含向量x)保存到当前目录中的文件.RData中,会话结束, R程序退出。


注意setwd()命令的路径中使用了正斜杠。 R将反斜杠(\)作为 一 个转义符。即使你在Windows平台上运行R, 在路径中也要使用正斜杠。同时注意,函数setwd()不会自动创建一个 不存在的目录。如果必要的话,可以使用函数dir.create()来创建新目录,然后使用setwd()将工作目录指向这个新目录。


在独立的目录中保存项目是一个好主意。你也许会在启动一个R会话时使用setwd()命令指定到某一个项目的路径,后接不加选项的load(",RData")   命令。这样做可以让你从上一次会话结束的地方重新开始,并保证各个项目之间的数据和设置互不干扰。在Windows和Mac OSX平台

上就更简单了。跳转到项目所在目录并双击之前保存的镜像文件即可。这样做可以启动R, 载入保存的工作空间,并设置当前工作目录到这个文件夹中。


四.输入和输出


启动R后将默认开始一个交互式的会话,从键盘接受输入并从屏幕进行输出。不过你也可以处理写在一个脚本文件(一个包含了R语句的文件)中的命令集并直接将结果输出到多类目标中。


1.输入

函数source("filename")可在当前会话中执行一个脚本。如果文件名中不包含路径, R将假设此脚本在当前工作目录中。举例来说, source("myscript.R")   将执行包含在文件myscript.R中的R语句集合。依照惯例,脚本文件以.R作为扩展名,不过这并不是必需的。


2.文本输出

函数sink("filename") 将输出重定向到文件filename中。默认情况下,如果文件已经存在, 则它的内容将被覆盖。使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。参数split=TRUE可将输出同时发送到屏幕和输出文件中。不加参数调用命令sink() 将仅向屏幕返回输出结果。


3.图形输出

虽然sink()可以重定向文本输出,但它对图形输出没有影响。要重定向图形输出,使用表 1-4中列出的函数即可。最后使用dev.off()将输出返回到终端。

7.png


让我们通过一个示例来了解整个流程。假设我们有包含R代码的三个脚本文件script1.R、 script2.R和script3.R。执行语句:

source("script1.R")

将会在当前会话中执行script1.R中的R代码,结果将出现在屏幕上。


如果执行语句:

sink("myoutput",append=TRUE,split=TRUE)

pdf("mygraphs.pdf")

source("script2.R")

文件script2.R中的R 代码将执行,结果也将显示在屏幕上。除此之外,文本输出将被追加到   

文件myoutput中,图形输出将保存到文件mygraphs.pdf中。


最后,如果我们执行语句:

sink(

dev.off()

source("script3.R")

文件script3.R中的R代码将执行,结果将显示在屏幕上。这一次,没有文本或图形输出保存到文件中。整个流程大致如下图所示。

8.png


R对输入来源和输出走向的处理相当灵活,可控性很强。



热门软件

热门软件

免费下载

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Origin.html提取码:点击获取‍【软件介绍】Origin是一款功能强大的科学数据分析和可视化软件,广泛应用于各个领域的数据处理和研究工作。Origin提供了丰富的数据分析工具和图形绘制功能,帮助用户快速处理和分析数据,并将结果以直观的图表形式展示。【安装步骤】1.鼠标右击【Ori...
【软件下载】百度云下载:https://pan.baidu.com/s/1CVXkLwjhLDw_7H6FV9O47Q‍‍‍‍‍提取码:点击获取【软件介绍】Excel是一款功能强大的电子表格软件,广泛应用于数据分析、数据处理和数据可视化。Excel提供了丰富的功能和工具,包括数据排序、筛选、公式计算、图表绘制等。它的用户界面简洁直观,操作便捷,适用于各种行业和领域。【安装步骤】1.选中下载的...
热门课程

热门课程

排行榜

【软件下载】点击下载:https://pan.baidu-download.com/extract/spss.html提取码:点击获取【软件介绍】SPSS是全球领先的统计分析软件,为研究人员和数据分析师提供强大的数据处理和分析功能。无论是进行数据探索、模型建立还是结果解释,SPSS都能提供全面的解决方案。其直观的用户界面和丰富的统计工具使得数据分析变得简单而高效。【安装步骤】1. 首先,右击...
【软件下载】点击下载:https://pan.baidu-download.com/extract/stata.html‍提取码:点击获取【软件介绍】STATA软件是一款功能强大的统计分析工具,被广泛应用于社会科学、经济学、生物医学等领域。它提供了丰富的统计方法和数据处理功能,可以进行数据清洗、数据可视化、回归分析、时间序列分析等操作。【安装步骤】1. 鼠标右击【Stata17.0(64bi...
【软件下载】点击下载:https://pan.baidu-download.com/extract/eviews.html‍提取码:点击获取‍【软件介绍】EViews是一款功能强大的经济统计分析软件,广泛应用于经济学、金融学等领域。它提供了丰富的数据处理、分析和建模工具,能够帮助用户进行数据的可视化、回归分析、时间序列分析等操作。【安装步骤】1.鼠标右击【EViews13(64bit)】压缩...
【软件下载】点击下载:https://pan.baidu-download.com/extract/matlab.html‍‍‍提取码:点击获取‍【软件介绍】MATLAB是一种高级技术计算和编程环境,广泛用于科学、工程和数学领域的数据分析、模拟和可视化。它是由MathWorks公司开发的,提供了丰富的函数库和工具箱,用于处理矩阵运算、信号处理、图像处理、优化、统计分析等各种任务。【安装步骤】...
【软件下载】百度云下载:https://pan.baidu-download.com/extract/python.html‍‍‍‍提取码:点击获取‍【软件介绍】Python是一种高级编程语言,具有简单易学、可读性强的特点。它被广泛应用于数据分析、人工智能、Web开发等领域。Python拥有丰富的库和框架,如NumPy、Pandas、TensorFlow等,可以方便地进行数据处理、机器学习和...
【软件下载】立即下载:https://pan.baidu-download.com/extract/rstudio.html‍‍‍‍‍提取码:点击获取‍‍【软件介绍】RStudio是一款专业的集成开发环境(IDE),用于R语言的开发和数据分析。它提供了丰富的功能和工具,包括代码编辑、调试、数据可视化和报告生成等。通过RStudio,用户可以高效地编写和运行R代码,进行数据处理、统计分析和机器...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Amos.html提取码:点击获取‍【软件介绍】AMOS是一款广泛应用于社会科学、教育研究、市场调研等领域的统计分析软件,它提供了强大的功能和直观的界面,帮助用户进行复杂的结构方程建模和模型验证,从而深入分析数据之间的关系和影响。【安装步骤】1.鼠标右击【Amos28】压缩包(win11...
【软件下载】点击下载:https://pan.baidu-download.com/Extraction/Mplus.html提取码:点击获取‍【软件介绍】Mplus是一款专业的统计分析软件,主要用于结构方程模型(SEM)和混合效应模型(HLM)的建模和分析。Mplus提供了丰富的功能和工具,包括路径分析、因子分析、多水平建模等。Mplus的用户界面友好易用,支持图形化操作,使得模型构建和分...
数据分析网 专业数据分析服务
专业学术和研究领域的综合性数据分析服务平台
——————————————————————————————————————————————————————
微信客服            
本站教程已获得国家版权登记证书,受版权保护。未经授权,任何个人或机构不得以任何形式复制、传播、修改或用于商业目的。违反者将承担法律责任。
如需使用本站教程内容,请联系我们获取授权。谢谢合作!
以下为部分版权登记号:鲁作登字-2023-L-00466766   鲁作登字-2023-L-00466759   鲁作登字-2023-L-00466761   鲁作登字-2023-L-00466763   鲁作登字-2023-L-00466757