首页 > 编程知识 正文

数据挖掘r语言实战,r语言读取excel数据

时间:2023-05-03 08:50:01 阅读:206584 作者:1530

原标题:R语言数据实战 | 安装R语言

1、R的获取和安装

获取和安装R很容易(这也是它“亲民”的地方),具体步骤如下:

Step 1: 登陆R语言官方网站https://www.r-project.org,点击download R。

图1 R官方网站

Step 2:在弹出的镜像(Mirrors)页面上选择合适的镜像入口,如果你在中国,就直接选择China下离你近的一个镜像即可。

图2 镜像页面

图3 选择合适的镜像入口

Step 3:选择镜像后就会跳转到下载页面,此时即可根据自己电脑的操作系统酌情选择啦!

图4 根据电脑操作系统选择并安装

下面分别介绍在Windows和在Mac OS X系统安装的区别。

1. Windows 下安装

点开Download R for Windows之后界面如图5所示。

图5 Download R for Windows界面

网站上提供了两类Windows上的R安装文件:base和contrib。后者是一个包含了所有扩展包的Windows二进制安装文件,而前者仅仅是包含基本功能的二进制版本,由于我们之后还会不断安装自己需要的包,所以在安装阶段选base版本就可以。

安装成功之后,在开始菜单中就会弹出R应用程序的图标,点击该图标,就同时打开了R图形用户界面(RGui)和R控制台(R Console)。

图6 Windows系统R界面

2. Mac OS X下安装

在Mac OS X上安装就更简单了,进入R官网,选择Mac的二进制版本(binary for Mac OS X),下载pkg格式文件安装即可。

图7 Download R for Mac OS X界面

安装后,可以在Applications文件夹下找到它,打开的界面如图8所示。

图8 Mac系统R界面

【科普小知识】

1. CRAN是什么?

它是Comprehensive R Archive Network的简写, 是拥有同一资料,包括R的发布版本、包、文档和源代码的网络集合。

2. 镜像CRAN Mirrors是什么?为什么要选择一个镜像?

所谓镜像站,就是把一个网站资源的副本放在镜像服务器上,也就是说登录不同的镜像网站都跟登录主网站一样。而我们选择一个离我们近的镜像主要是为了下载得快!当然如果主站哪天不小心坏掉,镜像网站也是一个很好的后备军。

3. 上面提到的安装二进制版本,是唯一的安装方式吗?

并不是,二进制是一种编译好的版本,不满足于基本配置并熟悉源代码安装的也可以采用“源代码”安装方式,当然这需要其他的编译器,感兴趣的读者可以马上去谷歌一探究竟。

2、R的升级版武器:RStudio介绍

上面我们对R语言的基础版本进行了介绍,但很多人都嫌弃它的界面简陋,下面我们就来介绍R语言的升级版武器——RStudio。

图9 RStudio界面

RStudio是一个R语言的集成开发环境(IDE) 。所谓集成开发环境,就是把你做开发工作所需要的代码编辑器、编译器、调试器等工具都集成在一个界面环境下,方便同时开工。

接下来,我们就通过一个简单的示例图来详细了解下RStudio各个模块的定义以及使用流程(见图10)。

图10 RStudio模块

首先,图10左上是脚本编辑器,你需要先在这里写入你的编程代码。用#可为代码加注释,机器看到它就会自动跳过运行下一行,合理的运用注释可大大增加我们代码的可读性。

写好代码后,选中或把光标停留在某行,点击run,即会给电脑下指令,让它把代码运行起来。另外,你也可以试试快捷键Ctrl+enter(Mac用户试command+enter),看看是否也可以达到同样效果。

当程序运行完毕后,界面会出现三个变化:第一个变化是在图10左下角的“控制台”,可以看到所有代码的运行结果;第二个变化是在图10右上角的 “工作空间展示区”,可以看到程序新生成或者加载进工作空间的数据、函数等对象;如果程序中还有画图命令的话,还会在图10右下角展示出漂亮的图形。这就是一个完整的运行流程了。

而且,RStudio还有很多贴心技能,举例如下:

首先,它的安装不仅支持个人电脑的Windows,Mac OX,服务器的Ubuntu,甚至在浏览器上你都可以通过RStudio Server编辑运行代码,界面跟桌面版完全相同,完全没有转移障碍。

其次,在写代码时,它能够自动填补以及快速显示函数定义。下面举一个简单的例子,如果想输入求均值的mean函数,不需要拼写完整,RStudio就会自动显示出可能用到的完整函数和定义。另外,与round函数前面左括号匹配的右括号也自动地跟在mean后面,即使你忘记写了它也能帮你补全。

图11 RStudio功能展示

3、R包的获取与安装

这一小节,我们来介绍R中可大大拓展你的分析技能的利器:R包。

1. 什么是R包,为什么要装它?

所谓R包,就是一个把R函数、数据、预编译代码以一种定义完善的格式组成在一起的集合(见图12)。

图12 RStudio中的R包

R在安装时会自带一系列默认包(包括base,datasets,stats,methods,graphics等包), 它们提供了很多功能丰富的函数与数据,大家可以自行调出学习,命令search可以告诉你工作空间里已有哪些包可被直接使用。当然,如果需要装备更多、更厉害的拓展技能,就需要安装新包来实现了!

2.怎样安装包?

一般的安装做法有两种:一种是通过CRAN服务器安装;另一种是从Github上下载安装,可做为第一种的补充。

第一种方法最常用。在RStudio中可以有两种方法实现:一种是直接通过命令装包:install.packages (“package_name”) ;另一种是选中如图10所示的右下方的界面中的Packages后,点击Install,就会弹出如图13所示的方框,直接在其中输入包的名称就可以了。

图13 RStudio安装R包

另外,细心的读者可能会发现这里竟然不能选择镜像!对,RStudio默认采用的是Global镜像,如果想换为本地镜像的话,可以点击“Tools→Global Options” 打开Options界面(见图14),在Packages选项卡中可以更换镜像。

图14 RStudio更换镜像

第二种方式是:通过Github来装。前文介绍过的Github网站,新手建好包一般会先放在那里接受群众检阅,因此就有了一个下载新包的渠道——Github。一个R包在Github上的呈现如图15所示。

图15 Github上的R包

这些包并不需要从网站上下载好后再装进R,R里有一些方便与Github交互的包如devtools,其中的install_github函数就专为从Github安装包设计。下面以一个R包praise为例,它的安装语句如下:

> library(devtools)

> install_github("gaborcsardi/praise")

需要注意的是,用此函数安装包时需在前面加上它的作者在github上的用户名,此处praise包的作者用户名是gaborcsardi。

另外,一个包只要安装一次即可永久使用。但当遇到包的作者进行了更新,通过命令update.packages即可迅速检查并更新已经安装的包。RStudio中右下部分有一键更新包按钮。

3. 安装完就能直接用?

安装好了包,只是把它放在本地硬盘里,用时需要打开才能调用它的函数。打开的方式很简单,选用以下函数之一即可完成。

> library(“package_name”)

> require(“package_name”)

4. 如何用好一个包?

(1)寻找可用的包。

对于包的选择,首先可以通过谷歌进行搜索,来确定什么样的包适合你的要求;其次为大家介绍一个按照任务归类方法及包的地方:http://cran.r-project.org/web/views/,可以在其中寻找与你的研究相近的主题。

图16 网页展示

(2)在各种可用的包中如何选择?

可以参考Crantastic网站(http://www.crantastic.org/popcon),上面有各种包的使用热度排名。

(3)选择好合适的包后,如何使用呢?

可以通过R中的帮助功能,即通过RStudio右下角界面的搜索框(见图17)。

图17 RStudio函数文档界面

另外,输入命令:

> help(package=“package_name”)

也会把文档界面自动打开,里面既有对此包技能的整体描述、使用指南等文档,还有包内所含的函数列表。对于具体函数用法,直接点击函数名即可。

图18 ggplot2包帮助展示

(4)函数文档很长,从哪里看起呢?

一般来说,从两个地方切入看更方便:一个是先读Deion和Usage,整体了解函数基本功能及参数设置;第二个就是帮助文档最后附带的Examples,把它粘进编辑器,反复运行体会每个参数的含义。当然如果需要更高级、更透彻地理解函数,就要弄懂术语,理解中间每个参数的用法,这是zxdggx的进阶之路。

图19 帮助文档中的Deion和Usage

图20 帮助文档中的Examples

购买指南

《R语言:从数据思维到数据实战》

1

京东

2

当当网

3

天猫

https://detail.tmall.com/item.htm?spm=a220z.1000880.0.0.0A6pvS&id=581845865737返回搜狐,查看更多

责任编辑:

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。