R 备忘清单

该备忘单提供了使用 R 语言的示例,涵盖 R 语言基础知识、控制流、类型、结构/类、运算符、函数方法等

入门

获取帮助

访问帮助文件

?mean
# 获取特定功能的帮助
help.search('weighted mean')
# 在帮助文件中搜索单词或短语
help(package = 'dplyr')
# 查找软件包的帮助。

有关对象的更多信息

str(iris)
# 获取对象结构的摘要
class(iris)
# 查找对象所属的类

下载和使用库

install.packages('dplyr')
# 从 CRAN 下载并安装软件包
install.packages(“BiocManager”)
library(BiocManager)
BiocManager::install("dplyr")
# 使用Bioconductor的BiocManager包下载并安装软件包
devtools::install_github("clusterProfiler")
# 直接从github中下载并安装软件包
library(dplyr)
# 将包加载到会话中,使所有其功能可供使用
dplyr::select
# 使用包中的特定函数
data(iris)
# 将内置数据集加载到环境中。

工作目录

查找当前工作目录(其中找到输入并发送输出)

getwd()

更改当前工作目录

setwd(‘C://file/path’)

使用 RStudio 中的项目来设置工作目录到您正在使用的文件夹

基础入门

变量和赋值

x <- 10   # 使用箭头赋值
y = 20    # 或者直接使用等号赋值

数据类型

numeric_var <- 3.14   # 数值型
character_var <- "hello"  # 字符串
logical_var <- TRUE   # 逻辑型

向量和列表

# 向量
numeric_vector <- c(1, 2, 3, 4)
character_vector <- c("apple", "orange", "banana")

# 列表
my_list <- list(name = "John", age = 30, city = "New York")

向量和操作

# 创建向量
numbers <- c(1, 2, 3, 4, 5)
# 计算向量的和
sum_result <- sum(numbers)
# 计算向量的平均值
mean_result <- mean(numbers)

数据框(Data Frame)

my_df <- data.frame(name = c("John", "Alice"), age = c(30, 25))

# 创建数据框
student_data <- data.frame(
  name = c("John", "Alice", "Bob"),
  age = c(25, 23, 22),
  grade = c("A", "B", "C")
)

# 显示数据框
print(student_data)

函数

# 定义函数
add_numbers <- function(a, b) {
  result <- a + b
  return(result)
}

# 调用函数
sum_result <- add_numbers(10, 5)

条件语句

if (x > 0) {
  print("Positive")
} else {
  print("Non-positive")
}

for 循环语句

for (i in 1:5) {
  print(i)
}

while 循环

counter <- 1
while (counter <= 5) {
  print(counter)
  counter <- counter + 1
}

数据读取和输出

# 读取数据
my_data <- read.csv("data.csv")
# 输出数据
write.csv(my_data, "output.csv")

清理工作空间

# 清空所有变量
rm(list = ls())
# 退出 R
q()

图形绘制

散点图

plot(x, y)

直方图

hist(data)

线图

plot(x, y, type = "l")

绘制散点图

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 6, 7)
plot(x, y, main = "Scatter Plot", xlab = "X-axis", ylab = "Y-axis")

绘制直方图

data <- c(1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5)
hist(data, main = "Histogram", xlab = "Value", col = "lightblue")

绘制折线图

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 6, 7)
plot(x, y, type = "l", main = "Line Plot", xlab = "X-axis", ylab = "Y-axis")

向量

创建向量

:- - -
c(2, 4, 6) 2 4 6 将元素连接成向量
2:6 2 3 4 5 6 整数序列
seq(2, 3, by=0.5) 2.0 2.5 3.0 复杂的序列
rep(1:2, times=3) 1 2 1 2 1 2 重复向量
rep(1:2, each=3) 1 1 1 2 2 2 重复向量的元素

选择向量元素

按位置

:- -
x[4] 第四个元素
x[-4] 除了第四个之外的所有
x[2:4] 元素二到四
x[-(2:4)] 除二到四之外的所有元素
x[c(1, 5)] 元素一和元素五

按值

:- -
x[x == 10] 等于 10 的元素
x[x < 0] 所有元素小于零
x[x %in% c(1, 2, 5)] 集合 1, 2, 5 中的元素

命名向量

:- -
x['apple'] 名为“apple”的元素。

重复向量的元素

:- -
sort(x) 返回排序后的 x
rev(x) 返回 x 的反转
table(x) 查看值的计数
unique(x) 查看唯一值

另见