library(stringr)
df$ID <- row.names(df)
df$ID <- str_extract(df$ID, '\\d+')##提取数字
参考 https://vip.biotrainee.com/d/761-r-id-symbol
在输出的文件里面可以搜索:
可以看到,有趣的是 ERBB1家族的 ERBB1的正式名字就是大名鼎鼎的EGFR, 而 大名鼎鼎的HER-2 正式名字却是ERBB2
都是 SWI/SNF Related, Matrix Associated, Actin Dependent Regulator Of Chromatin,我是在genecard里面 检查 SMARC发现的
http://www.genecards.org/Search/Keyword?queryString=SMARC
但是大部分文章里面却总是使用它们的别名。