随着观测手段的不断进步和长期观测数据的不断积累,生态学研究已经跨入的大数据的时代。因此,现代生态学研究对研究者的数据分析和处理能力要求更高。R语言以其灵活、开放、易于掌握、免费等诸多优点,在生态学研究各领域迅速传播并赢得广大研究者的青睐和应用。为了促进同学之间的学习、交流、合作,生命学院511班于3月17日15:00 - 18:00在教2105举办学术沙龙活动,邀请511班孙鹏同学分享有关R语言的学习。
孙鹏同学交流内容包括:R语言基本概念、R语言数据结构基础和R语言包的使用调用。
首先介绍了R语言的基本概念。R是用于统计分析、绘图的语言和操作环境,是属于GNU系统的一个自由、免费、源代码开放的软件。其功能包括:数据存储和处理系统;数组运算工具,其向量、矩阵运算方面功能尤其强大;完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言。
R语言数据结构基础:
向量:向量是R语言中最基本的数据类型,R中可以用“=”或者“<-”来进行赋值,“<-”的快捷键是“alt”+“-”。我们可以用下标来筛选也可以用逻辑进行筛选,负数下标表示不选这个、这些下标。“c()”可以合并向量。
矩阵:从本质上来说就是多维的向量。向量元素变为矩阵元素的方式是按列的,从第一列到第二列,如果我们想按行输入元素,那么需要加入“byrow = TRUE”的参数筛选矩阵,用下标来筛选矩阵。在乘法旁边加两个百分号来做矩阵乘法。
数据框:把一个类似excel的表格读入R,默认的格式就是数据框。
列表:列表是一种递归式的向量,我们可以用列表来存储不同类型的数据。
接下来孙鹏同学结合具体案例带着大家一起学习R语言的具体实践,并亲手结合案例100年内的人口增长模型等的基础训练、R数据的挖掘教程(回归代码)、CO2浓度升高对松树繁殖力的影响的案例研究和贝叶斯分析案例向同学们展示数据的分析和作图。
本次学习活动很多同学携带电脑,在孙鹏同学讲解过程中自主练习。讲解结束后,同学们积极提出学习过程中的疑问,孙鹏同学耐心解答。交流结束,同学们合照留念。
交流会结束后的合影