数据分析学习之R-stringr(字符串处理)
概述:
在R中,字符串并不是很受重视的部分,但是它在数据清洗和数据准备中确实起着重要的作用。stringr包中提供了一系列字符
此文章是Hadley Wickham个人主页中关于stringr包的使用翻译。 概述: 在R中,字符串并不是很受重视的部分,但是它在数据清洗和数据准备中确实起着重要的作用。stringr包中提供了一系列字符串处理函数,这些函数的设计使得字符串的处理尽可能的简单。如果你对字符串不是很熟悉,最好从R for Data Science的字符串部分开始学起。 stringr包是建立在stringi上的,stringi包使用ICU C库提供快速、准确的常见字符串操作。stringr主要提供了最重要和最常用的字符串处理函数,而stringi涵盖了几乎所有你能想象到的字符串内容的综合集。如果你在使用stringr包时发现没有你想用的函数,试试在stringi包中寻找。这两个包很类似,有几乎相同的规则,所以你一旦掌握了stringr包的使用,stringi包也会快速上手。
stringr包中函数的用法: stringr包中所有的函数均以str_开头,第一个参数为字符串向量。 (1)str_length(string)函数:计算字符串的长度 实例不一一列举,祥看stringr.tidyverse.org/reference/str_length.html
(2)str_c()函数:字符串拼接函数,将多个字符串合并成一个字符串。 str_c(..., sep = "", collapse = NULL)#默认参数。sep的作用为多个字符串连接成一个字符串时的分隔符,相当于这个新字符串的一部分,最终输出的是字符串向量。collapse的作用是字符串连接后的分隔符Mssq字符串函数,最终输出单个字符串。如果collapse为NULL,输出字符串向量的元素个数为输入元素最大的字符串向量个数,如果collapse不为NULL,输出字符串长度为1。以下结果可以看出两者的区别。
(3)str_sub()函数:从字符串向量中截取、替换子字符串。
start表示从哪个字符开始,默认是第一个。end表示到哪个字符结束,默认最后一个。 注:如果是负数,要倒着数;要注意字符串中的特殊字符也是字符串的一部分,切勿遗漏;参数可以是数值型向量,但维度需相等。
(4)str_subset(string,pattern)函数:返回匹配的字符串。
(4)str_count(string, pattern = "")#返回字符串中所含匹配字符的个数
(编辑:站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- 微软改动IE将对有Flash的网络广告产生影响
- sql-server – 在另一个数据库中创建存储过程
- sql-server – 为什么ORDER BY不属于View?
- sql-server – 在运行性能比较之前清除缓存的SQL Server命令
- sql-server – 层次结构中子级别总和的总和
- 像SQL一样设计Redis数据库表?
- sql-server – 将每日时间表分组为[开始日期;结束日期]与工
- sql-server-2008 – 为什么我不能使用NEWSEQUENTIALID()作为
- sql-server – 从备份SQL Server还原,只是主文件组
- HTML表格标记教程(5):亮边框色属性BORDERCOLORLIGHT