首页 > 编程知识 正文

r语言统计入门第二版(r语言基本教程)

时间:2023-05-03 19:28:14 阅读:102553 作者:2498

你怎么能在几分钟内知道R的基本知识?让我给你看看《R in action》“简介”部分的目录——。

再有一面,我就不放出来了。总共有100多页。

说实话,虽然是经典的教科书,《R in action》,欺负浮躁的现代人的做法,还是让我的心剧烈抽搐,差点放弃(虽然我还是全部看完了)。

拜托,我不是来表现优越感的。我只想说,不是每个人在学习r的核心内容之前都需要啃透100页的长城,更何况100多页里面有很多抽象概括和类似的功能,极难记忆。

在我看来,这里的大部分内容不需要先掌握。

一三大块,你还记得吗?

A频道的三项:数据清理、数据分析、数据可视化,今天暂时不谈。我们需要一些入门的初步知识。

接下来要做的就是练习题中的内容:花几分钟时间了解r的基础知识。

第二,首先你要确定你的电脑里安装了R(这样简单的问题我就不需要再讲了。)

未安装的点这里下载!

还有,必须安装R studio。这是我觉得目前最好用的R用户界面。它不装对不起,它不装不是中国人,13亿人在装你还等什么?(单击选择下载Rstidio桌面)

3.R的基础知识有哪些?

我将其归纳为以下四个标题:

命令行,数据对象,函数,解析

先记住这四个名字,本文的一切都会围绕着它们展开。

其他的,我觉得没必要开始。虽然它们有用,但没有必要。

让我们一个一个开始。

第四,命令行

r使用命令行输入接口,也就是我们常说的写代码。代码如下所示:

光标后可以输入数字、公式、函数和变量,或者R能理解的任何语言。r会给你热情的反馈。

在激动人心的音乐中安装了r和Rstudio之后,您可以尽情地尝试(跳)和(xi)命令行。在Rstudio中,命令行默认位于屏幕的左下方区域,如图所示:

左上角区域是代码存储窗口,可以随便写一些代码,如果不同意可以点击Run运行。(以你现在的实力,R应该马上给你一个错误。)

在命令行上,您通常输入什么?

第一个——公式,比如1 1,35等等。此时,R可以用作计算器。(废话)值得一提的是,注意上图。输入1 1后,R给出的返回值为[1] 2。这里,方括号中的[1]代表顺序,我们将在后面详细解释(数据对象)。

第二个——调用对象。将在数据对象中解释。

第三类——函数,函数,函数,和重要的东西都说了三遍。命令行中99%以上的输入是函数。你觉得重要不重要?具体来说,我们将在函数中详细解释。

动词(verb的缩写)数据对象

如果R是一个厨房,那么数据对象就是不同的容器,里面什么都有。只有通过容器,数据才能被清理、处理和用于分析。

厨房里的锅碗瓢盆有很多种,r的数据对象也有很多种,但目前我们只需要记住其中的三种:

1.碗——矢量

厨房里最小的容器通常是一个碗。Vector也是r中最小最基础的数据对象。

C (1,2,3,4,5) [1] 1,234 5c (13,336,020)函数C()的作用是把括号里的东西做成向量,向量的不同元素用“,”隔开

“:”的作用很明显,1:20代表1到20的20个数。

注意,看看代码的最后一行,它以方括号[23]开始。这意味着这条线从向量的第23个元素开始。回顾上一节,为什么“1 1”的返回值是“[1] 2”?因为向量是R中最小的数据对象,所以1 1必须生成一个只有一个元素的向量。就好像厨房里最小的碗有拳头那么大,但是为了装一颗豆子,还是需要大材小用。

X-c(1,2,3,4) #将向量赋给x y-c(3,5,7,9) x #调用向量x[1] 1 2 3 4 y[1] 3 5 7 9 x[2] #调用向量x。

的第二个元素[1] 2

上面的代码很重要,它进行了一个最基本也是最重要的操作:赋值。可以看做是“给容器贴标签”

方法很简单,采用“<-”符号就可以了。箭头指向标签名。上面的代码表示,有一个碗里放了四颗豆子分别叫做1、2、3、4,于是我们给这个碗贴上标签叫做“x”。另一个碗里放了四颗豆子叫做3、5、7、9,我们贴上“y”的标签。

赋值有什么作用呢?作用就是,如果没有标签,我们可能就找不到这两个碗和里面的豆子了。

赋值之后就是调用,只要输入变量名称(标签名)就能调用对应的内容(碗)。而输入变量名称+顺序号,就能调用单个元素(豆子)。如上所示

> x+y[1] 4 7 10 13> x%*%y #这里“%*%”表示求两个向量的内积,然后会生成一个1*1矩阵

向量之间也可以直接运算,方法和初高中数学里学的向量运算差不多,类似于上面那些。大家可以自己实验一下。不明白的,你们就自己百度去吧。(不负责任的我啊。。)

2.多功能橱柜——列表(list)

列表是一个神奇的数据对象,如同厨房里的多功能橱柜。

橱柜里有很多格子,每个格子都能盛放很多东西。列表也是这样,列表里可以单独分出很多格子,每个格子都能盛放一个单独的数据对象(可以是向量、矩阵,甚至是另外一个列表)。

而橱柜的格子也需要编号,编号方法略有不同。看下面的例子:

> list1<-list(x,y,c(3,3))> list1[[1]][1] 1 2 3 4[[2]][1] 3 5 7 9[[3]][1] 3 3

通过list()函数,我们定义了一个叫做list1的列表(多功能橱柜)。这里面现在有三个格子,非常清晰地显示在代码中,它们的编号方式是两个方括号[[1]]。

聪明的读者应该也能想到,列表及其中的元素同样也能进行调用。

> list1[[1]]

三个格子中,每个格子装一个向量。

列表的作用是什么?等到下一章,你们就知道了。

3.炒锅——数据框(data frame)

数据框是R里面最重要的数据对象!数据框是R里面最重要的数据对象!数据框是R里面最重要的数据对象!重要的事情说三遍!

炒锅在厨房里无疑也是最重要的。菜品的完成,大部分时间都依赖炒锅。我们数据分析的过程中,数据大部分时间也是呆在数据框里面的。

但数据框这个名字有点抽象。其实,他就是二维表。或者再通俗一点,就是我们天天见到的表格。在R里面大概长成下面这样:

States是一个数据框(表格),head()函数帮助我们调用了这个表格的前五行。

我们能看到,这个表格包括美国各个州的人口、收入等等数据。虽然没有画线,但是还是能看得出典型的行标签、列标签和数据内容的。显然,这就是我们日常处理数据的时候,最喜欢用的方法:表格。

数据框的赋值通过函数data.frame()完成。很简单,日后提到的时候,一看就懂。

表格里的内容当然也可以调用,但似乎没有前两个那么直观。方法如下:

> States$pop

日常操作中,我们一般会用attach()来锁定一个数据框。之后,只要直接输入列名称,就能调用列了。如下。

> attach(States)> pop #效果相当于语句States$pop

4.数据对象小结

R的数据对象有很多种,我们现在先记住其中的三种。

碗——向量(vector)

多功能橱柜——列表(list)

炒锅——数据框(data frame)

并且,记住他们的结构,赋值方法,以及调用方法。

其他的数据对象包括矩阵(matrix),数组(array),时间序列(ts)等等,以后再谈。

值得一提的是,千万不要把数据对象和数据类型搞混。前者就是我们刚刚讲的容器的种类,而后者则是豆子的种类。

数据类型包括数值型(numeric),字符型(character),缺失值(NA)等等,一看就懂。可以通过mode()函数检测数据类型:

> x<-c(1,2,3.3,pi)

美好的一天,再写下去可能看官们就要睡着了。(你们是不是已经忘掉了标题中的“几分钟”呢?哈哈哈哈)

文章来源:知乎专栏——Still的数据分析笔记(作者的文章不多,但是都很有趣,内容也很好)

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。