使用 R 中的数据类型

发布日期:2026-06-25 05:39:03   来源 : 杭州电子商务研究院    浏览量 :13
杭州电子商务研究院 发布日期:2026-06-25 05:39:03  
13

介绍

作为一种强大的统计编程语言,R 具有多种数据类型和数据结构。要熟练掌握 R,了解这些数据类型并学习如何使用它们非常重要。

在本指南中,您将学习使用 R 中的数据类型的概念和技术。

数据类型

R 可以使用多种数据类型。一些基本数据类型包括:

  1. 字符:文本(或字符串)值称为字符,如下例所示。如果我们想确认其类型,可以使用class()函数。事实上,R 提供了很多类似class() 的函数,可用于检查对象的特征,例如typeof()、length()attribute()
      t = "data types"
class(t)
    

输出:

      1] "character"
    
  1. 数字:像 2.3 这样的十进制值在 R 中称为数字。它是默认的计算数据类型。
      N = 2.3
class(N)
    

输出:

      1] "numeric"
    

请注意,变量“N”存储为数值而不是整数。可以使用is.integer()函数检查,如下所示:

      is.integer(N)
    

输出:

      1] FALSE
    
  1. 整数:如果我们想创建一个整数变量,我们可以使用整数函数。此外,所有整数都是数字,但反之则不然。
      i = as.integer(3)
is.integer(i)

is.numeric(i)
    

输出:

      1] TRUE

[1] TRUE
    
  1. 逻辑:逻辑值通常通过比较两个或多个变量来创建。这些值用布尔值TRUEFALSE表示。
      x = 100
y = 56
x < y
    

输出:

      1] FALSE
    
  1. 复数:复变量由虚数i定义
      z = 3 + 2i 
class(z)
    

输出:

      1] "complex"
    

以上示例是 R 中的基本数据类型。但这并不是 R 中所有类型的详尽列表。R 还具有许多数据结构,我们将在后续章节中进行讨论。

数据结构

向量

向量是 R 中最常见的数据结构。它是相同数据类型的元素序列。vector ()函数可用于创建向量。默认模式是逻辑的,但我们可以使用character()、numeric()等构造函数来创建特定类型的向量。

下面的代码行分别构造一个数字向量和一个逻辑向量。向量还可以包含字符串,如向量“s”所示。

      n <- c(1,2,5.3,6,-2,4) 
l <- c(TRUE,TRUE,TRUE,FALSE,TRUE,FALSE) 
s = c("USA", "UK", "AFRICA", "INDIA", "CHINA") 

class(n)
class(l)
class(s)
    

输出:

      1] "numeric"

[1] "list"

[1] "character"
    

还可以对向量执行多种操作,例如组合向量和向量数学。例如,下面的第一行代码组合了向量“n”和“l”,而第二行打印了新向量的元素。您可以使用长度函数检查结果向量的长度,如第三条命令所示第四行检查数据类型,结果向量为“字符”类型。这称为向量组合中的值强制。

      comb = c(n, s)
comb

length(comb)
class(comb
    

输出:

      1] "1"      "2"      "5.3"    "6"      "-2"     "4"      "USA"    "UK"    
 [9] "AFRICA" "INDIA"  "CHINA"


[1] 11


[1] "character"
    

还可以对向量执行数学运算,如下面的代码行所示。

      x = c(5, 3, 4) 
y = c(1, 2, 3)

#Arithmetic Operations
5 * x
x-y
x+y
x/y
    

输出:

      1] 25 15 20

[1] 4 1 1

[1] 6 5 7

[1] 5.000000 1.500000 1.333333
    

矩阵

在 R 中,矩阵是数字或字符向量的扩展。矩阵中的所有列必须具有相同的模式和相同的长度。此外,与原子向量类似,矩阵的元素必须具有相同的数据类型。矩阵的一般表示如下面一行代码所示。

参数nrowncol分别表示行数和列数。参数byrow = TRUE表示矩阵应由行填充。

      m = matrix(c(20, 45, 33, 19, 52, 37), nrow=2, ncol=3, byrow = TRUE)    
print(m)
    

输出:

可以使用下标来标识矩阵的行、列或元素。例如,可以使用以下命令访问第二行和第二列的元素。

      m[2, 2]
    

输出:

      1] 52
    

列表

列表是包含对象(或组件)集合的通用向量。列表的优点是它允许您将各种可能不相关的对象存储在一个名称下。

下面的代码行创建一个包含三个向量的列表:姓名、地点和年龄。

      name = c("abhi", "ansh", "ajay") 
place = c("delhi", "mumbai", "pune") 
age = c(TRUE, FALSE, TRUE, FALSE, FALSE) 

l = list(name, place, age)   
print(l)
    

输出:

      [1]]
[1] "abhi" "ansh" "ajay"

[[2]]
[1] "delhi"  "mumbai" "pune"  

[[3]]
[1]  TRUE FALSE  TRUE FALSE FALSE
    

也可以使用单个方括号“[ ]”运算符来切分列表。

      l[2] 

l[c(2, 3)]
    

输出:

      [1]]
[1] "delhi"  "mumbai" "pune"  

[[2]]
[1]  TRUE FALSE  TRUE FALSE FALSE
    

数据框

数据框可能是 R 中最重要的数据类型。事实上,它是大多数表格数据的实际数据结构,在数据科学中得到广泛使用。简单来说,它是一种特殊类型的列表,其中所有元素的长度都相等。

通常使用read.csv()read.table()函数将数据框导入 R。您还可以使用data.frame()函数创建一个新的数据框,如下面的代码行所示。

      df <- data.frame(rollnum = seq(1:10), h1 = 15:24, h2 = 81:90)
df
    

输出:

      | rollnum 	| h1 	| h2 	|
|---------	|----	|----	|
| 1       	| 15 	| 81 	|
| 2       	| 16 	| 82 	|
| 3       	| 17 	| 83 	|
| 4       	| 18 	| 84 	|
| 5       	| 19 	| 85 	|
| 6       	| 20 	| 86 	|
| 7       	| 21 	| 87 	|
| 8       	| 22 	| 88 	|
| 9       	| 23 	| 89 	|
| 10      	| 24 	| 90 	|
    

结论

在本指南中,您了解了不同类型和结构的数据,包括在 R 中创建和使用数据类型的概念和技术。要了解有关使用 R 进行数据科学的更多信息,请参阅以下指南:

  1. <a href="https://www-pluralsight-com.translate.goog/resources/blog/guides/interpreting-data-using-descriptive-statistics-r?_x_tr
以上内容来自杭州电子商务研究院推送
关注
关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
Copyright © 2025-2027 ToB产业网址导航 公安备案 浙公网安备33010602013138号 浙ICP备16025413号-9
支持 反馈 关注 数据