R语言 --- split 二三事

2023-02-26 12:42:02Python029

R语言 --- split 二三事,第1张

最近有很多对文件的操作，经常使用到split函数，但是存在三个split函数，有时候会弄混，谨以此文以记之。

1. split()

2. str_spit()

3. strsplit()

总结： split(参数):split(向量/列表/数据框,因子/因子列表)

split()函数可以分组数据框和向量，返回list。

可以直接使用unsplit()。

split是按照factor去切分vector或者数据框，因此不能这样用：

切割数据框的用法：

针对vector的用法：

str_spllit()主要用于 split a vector of strings. 返回一个list。

str_spllit_fixed()可以返回一个matrix。

举个栗子:

上栗子：

data.txt

思路：

1 strsplit切割，切割后的结果是列表格式，用unlist转成数组

2 用paste(c(), collapse="_")把菌科菌属粘贴到一起

paste(a, b, sep="")是另一种用法

3 门信息单独提取

4 利用循环把结果收集到new_name phylum

菌科_菌属：

想了一个比较笨的方法。先在R里定义这个函数：

split.string<-function(string){

str2<-strsplit(string,"")[[1]]

string.split<-NULL

j<-1

string.split[j]<-str2[1]

find.type<-function(char){

if(grepl("[[:alpha:]]",char))

type<-"alphabet"

else if(grepl("[[:digit:]]",char))

type<-"digit"

else type<-"chinese"

type

}

type<-find.type(str2[1])

for(i in 2:length(str2)){

type2<-find.type(str2[i])

if(type2==type) string.split[j]<-paste(string.split[j],str2[i],sep="")

else{

j<-j+1

type<-type2

string.split<-c(string.split,str2[i])

}

string.split

}

直接跑

split.string("中国123abc")

就好了

如果要区分更多的东西，就改一下内部的find.type()函数。我现在写的只能区分字母、数字和其他东西（比如标点和中文就分不开了）。

函数数据向量因子列表

# 上一篇：想学Java，该选择哪家培训机构好点？

# 下一篇：请问java是哪家公司的

给您推荐相同类型的内容：

如何利用python进行数据分析
近年来分析学在数据、网络、金融等领域获得了突出的地位。应用各种软件组合起来进行数据收集，数据管理，以及数据分析，得出的结论用作商业决策，业务需求分析等等。分析学用于研究一个产品的市场效应，银行的贷款决定，这些都只是分析学的冰山一角。它在大数
C语言中的exit函数
exit()通常是用在子程序中用来终结程序用的，使用后程序自动结束，跳回操作系统。在c语言中： exit(0)：表示正常退出；exit(1):表示异常退出，这个1是返回给操作系统；值是返回操作系统的：0是正常退出，而其他值都是异常退出，所
Go语言的跨平台能力到底有多强？看完你就知道了
对比于其他语言的程序，Go语言的跨平台能力是真的强，拿.Net和JAVA来说吧，.Net在.Net core出现之前是不能跨平台的，只能在windows上编译运行，即使是.net core出现以后，跨平台的程序也是相当的麻烦。而java虽然
r语言横坐标设置不同颜色
R语言中的颜色1 颜色名称表示法R语言中的颜色表示方式主要有两种，一种是用颜色的名称表示，例如：blue、red、orange等等，要知道R语言中颜色名称可以使用colors()方法得到。下图只显示50个颜色值：library(scales
go程序可以在linux上运行吗
可以。 Go语言是谷歌推出的一种编程语言，可以在不损失应用程序性能的情况下降低代码的复杂性。Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程1.1 Go 安装G
C＋＋或者C可以写游戏脚本吗？
可以，但C++和C语言是易学难精的语言，编写脚本很容易出现bug和其他问题，但他的灵活性和简易性也不可忽略，而目前比较流行的脚本：Python、Lua、ruby和Erlang，具体可以看看这篇文章http:wenku.baidu.com
r语言指的是什么？
R语言是用于统计分析、绘图的语言和操作环境。R语言是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。R语言是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R语言是S语言的一种
《Go程序设计语言中文版》pdf下载在线阅读全文，求百度网盘云资源
《Go程序设计语言中文版》百度网盘pdf最新全集下载:链接：https:pan.baidu.coms1K2XHYlNbRyQMiBkckaPr7A?pwd=0cii 提取码：0cii简介：本书由《C程序设计语言》的作者Kernig
golang的双引号文本和反引号文本
golang的双引号和反引号反引号(back quote)就是"`"，就是键盘上和"~"一个键的那个。他们的区别就是：举个例子来说：上面程序运行结果就是：双引号文本里面的
学习java怎么样？
学习 Java 编程开发工程师是一项重要的技能，它可以帮助你成为一名优秀的软件开发工程师。 Java 是一种面向对象的编程语言，用于开发企业级应用程序，是全球使用最广泛的编程语言之一。适合的人群：无论您是初学者，还是有编程基础的人，都可
学习python对计算机图形学有用么?
任何语言实际上都是工具，只有顺手不顺手之分，python作为一种脚本语言，学习相对简单资料也很多，功能也很强大，主流的计算机图形学库都有python版本的api（如OpenCV），自己的库也很丰富，更重要的是可以作为各种语言之间的粘合剂来使
C语言怎么实现函数不定参数
C语言中定义了va_list, va_start( ), va_arg( ), va_end( ) 这样一组宏来处理可变参数问题。可以参考printf的声明，创建自己的实现函数。示例：#include&ltstdio.h&
全国计算机二级C语言每年考试时间？
NCRE考试每年开考两次，上半年开考一、二、三级，下半年开考一、二、三、四级。上半年考试时间为四月第一个星期六上午（笔试），下半年考试时间为九月倒数第二个星期六上午（笔试），上机考试从笔试的当天下午开始。上机考试期限原则上定为五天，由考点根
学习java需要多少钱？
正常来讲正规的Java培训班学习费用在2-3万左右，各家的学习费用不相同，这和各家的课程研发投入、师资投入还有所在城市的消费水平有很大的关系。具体学习费用取决于参加培训的城市。如今，多数Java培训机构是培训初级程序员，学习6个月，掌握基础
用C语言模拟ATM机工作流程编程
#include"stdio.h"对ATM机器的模拟就是一个对队列的模拟下面代码在VC6环境下调试已经通过了其中有个缺陷就是因为代码执行速度过快导致二次执行根据时间随机出来的数字都是一样的因此你可以自己加上一个延迟子程序
学java去哪个培训机构好点？
国内的java培训机构非常多，比较知名的品牌有千锋教育、动力节点、中软国际教育集团、课工场、开课吧等等。千锋教育就有线上免费Java线上公开课。值得注意的是，因为java属于新兴行业，培训机构的教学水平和师资力量参差不齐，有些机构会宣传为
如何使用Go语言实现远程执行命令
连接包含了认证，可以使用 password 或者 sshkey 2种方式来认证。下面的示例为了简单，使用了密码认证的方式来完成连接。import ("fmt" "time" "golan
“Python”有什么缺点？
python的整个系统，我其实有非常多的不满。但是用任何一门语言都是取舍问题，如果有一门语言，库够多，已读，易用，性能高，我毫不犹豫立刻转过去。python的强处在于庞大的库，还有非常好的易读和易用性。但是相比来说，性能一直是个问题。pyt
北大青鸟java培训：安卓手机游戏开发培训有什么课程？
手机游戏开呈现的爆炸式的增长，是我们不曾想到的，当乔布斯在苹果上咬了一口后，智能平板手机为我们带来了意想不到的体验，而现在的手机游戏开发者借此之福，薪资摇摇其上，浙江北大青鸟IT培训机构就是一个专门培养移动互联网开发人才的地方，那么浙江北大
python读写文件
读文件 1）使用open()方法打开文件，返回一个文件对象原型：open(file, mode='r', buffering=None, encoding=None, errors=N
C语言pow函数
pow()函数用来求x的y次幂，x、y及函数值都是double型，其原型为：double pow(double x, double y)。实例代码如下：#include&ltstdio.h&gt#include&am
组件分享之后端组件——基于Go语言的HTML和CSS网站生成器Hugo
近期正在探索前端、后端、系统端各类常用组件与工具，对其一些常见的组件进行再次整理一下，形成标准化组件专题，后续该专题将包含各类语言中的一些常用组件。欢迎大家进行持续关注。本节分享一个基于Go语言的HTML和CSS网站生成器 hugo
怎么自学c语言，需要怎么学习？
学习中的困难莫过于一节一节的台阶，虽然台阶很陡，但只要一步一个脚印地踏，攀登一层一层的台阶，才能实现学习的最高理想。C语言学不会怎么办？我大一的时候也需要学C语言，C语言自学方法有很多，下面是我的建议。1.首先应该记住基础知识点，如数组
武汉java培训机构排名榜
武汉java培训机构排名榜：1.武汉动力节点上榜理由：我相信大家对于动力节点的上榜不会有所争议，毕竟动力节点在Java的教育上面做到了极致，10年来不断的在对Java的课程研发上下苦功，最后研发出了一套自己独家的教学方法。师资方面也是非
C语言中ASCII码是什么意思
美国信息交换标准代码。ASCII(AmericanStandardCodeforInformationInterchange)：美国信息交换标准代码是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标
java培训一般需要多长时间
4-6个月左右。【点击测试我适不适合学设计】挑选java培训班的关键：1、看课程内容，就是看课程中包含哪些内容，是否都是差不多的知识点，是否都包含了企业项目学习内容，一般情况下影响学习周期的主要因素是因为知识内容量和项目内容的多少。2、
北大青鸟java培训：Java项目实战能够学习到什么？
很多学Java的朋友都知道，Java项目实战是特别的重要，但是Java项目实战到底需要了解些什么内容，很多朋友就摸不着头脑。只知道拿到一个Java项目的时候，就开始按照老师的要求，分工合作，自己跟其他同学每个人负责一块，就整体的Java项目
set.seed()作用
R语言中set.seed()作用是设定生成随机数的种子，种子是为了让结果具有重复性，重现结果。如果不设定种子，生成的随机数无法重现。后两次在设定了相同的种子前提下，生成的随机数是相同的。说明，来源于网络计算机并不能产
python好学吗？
有网友点评说：Python语言本身是比较容易的，楼主说的难应该指programming本身。不觉得非计算机专业出身就学不好编程，我就是学通信的，学Python全凭兴趣。平时用Python干各种脏活累活，数值计算、数据处理、复杂文本处理、数据
想参加西安Java培训，哪个培训机构比较好？
西安现在的java培训机构有千锋教育、IT培训网、中软国际教育集团、课工场、开课吧等等，这些都是知名的品牌。千锋教育就有线上免费Java线上公开课。随着IT行业特别是Java行业的迅速发展，企业对于技术人才Java程序员的需求量与日俱增。但

推荐阅读

热门文章

最新发布

标签列表

R语言 --- split 二三事

给您推荐相同类型的内容：