您好,欢迎来到华拓科技网。
搜索
您的当前位置:首页R的数据框(Data frame)

R的数据框(Data frame)

来源:华拓科技网

下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容。栏目后续章节的文章将深入概括R语言在临床研究和新药创新领域的应用,填补了国内R教材中尚未广泛覆盖的部分内容。​​​​​​​

欢迎订阅我们专栏

.......前面部分请点击上面链接看原文(原文5613字)

 3、数组(Array)

 4、数据框(Data frame)

数组与矩阵有一定的相似性,都以规整的方式存储数据。但与矩阵不同的是,数组的维度可以大于 2,并且像矩阵一样,数组中的元素必须是同一类型的数据。而数据框则类似于矩阵形式的数据,然而它具有一个显著的优势,那就是数据框中的各列可以是不同类型的数据,比如可以同时包含数值型、字符型、逻辑型等多种不同类型的变量。这使得数据框在处理复杂和多样化的数据时非常灵活和实用。数据框可以使用data.frame()函数创建,每列的数据类型可以不同。

以下示例展示了使用 data.frame() 函数来创建一个关于高血压患者的数据框 patientdata ,其中包含患者的年龄(数值型)、性别(因子型)、患病预后状态(因子型)等不同类型的数据。

patientID <- c(1:4)
age <- c(55, , 58, 62)
sex <- as.factor(c("Male", "Female", "Male", "Female"))
status <- as.factor(c("Poor", "Improved", "Excellent", "Improved"))
patientdata <- data.frame(patientID, age, sex, status)
print(patientdata)

输出结果:

  patientID age    sex    status
1         1  55   Male      Poor
2         2   Female  Improved
3         3  58   Male Excellent
4         4  62 Female  Improved

输出结果:

生成正态分布随机数是数据分析和模拟中的常见任务。在R语言中,rnorm()函数被广泛用于生成正态分布的随机数。我们可以使用该函数来生成50个服从标准正态分布的随机数,并将这些随机数创建成一个5列的矩阵。接下来,我们会使用head()函数查看矩阵的前两行。

mat.1 <- matrix(rnorm(50), ncol = 5)
colnames(mat.1) <- c("a", "b", "c", "d", "e")
head(mat.1, n = 2)

输出结果:

            a            b          c         d          e
[1,] 2.092190  0.502715552 -0.47362 -1.769090  0.1247273
[2,] 1.4235 -0.005080861 -0.686  1.388739 -2.4386240

在上述代码中,我们生成了一个50个随机数的矩阵,并将其前两行输出。

使用dplyr包创建和查看数据框

dplyr是R语言中的一个非常流行的数据操作包,它提供了简单且直观的语法来进行数据操作。dplyr主要用于数据帧(data frame)的操作,包括过滤行、选择列、重新排序、添加新列、以及汇总数据等。其中,as_tibble()函数可以将矩阵转换为数据框,并显示更多信息(记得要先自行安装dplyr扩展包):

library(dplyr)
df.1 <- as_tibble(mat.1)
print(df.1)

输出结果:

# A tibble: 10 × 5
         a        b      c      d      e
     <dbl>    <dbl>  <dbl>  <dbl>  <dbl>
 1  2.09    0.503   -0.474 -1.77   0.125
 2  1.   -0.00508 -0.7  1.39  -2.44 
 3  1.65   -0.676   -0.540  1.99   0.278
 4  0.0208  0.272    0.634  0.857  1.74 
 5 -0.948   2.10     0.317  1.25  -0.985
 6  0.383   0.470   -0.387  1.41  -0.2
 7  0.504   0.611    0.773 -0.110 -1.56 
 8 -1.21    1.81    -1.38   1.  -2.15 
 9  0.572  -2.74     0.900 -0.926 -0.498
10 -1.33   -2.09     1.42  -0.628 -0.627

5、列表(List)

第一章:认识数据科学和R

第二章:R的安装和数据读取

第三章:认识数据

第四章:数据的预处理

第五章:定量数据的统计描述

第六章:定性数据的统计描述 

​​​​​​​

​​​​​​​

​​​​​​​

第七章:R的传统绘图

​​​​​​​

第八章:R的进阶绘图

 

 

 

 ​​​​​​​

 ​​​​​​​

第九章:临床试验的统计

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo6.cn 版权所有 赣ICP备2024042791号-9

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务