用regular expression. 将html的source打开,比如可以将其按照txt的格式打开。里面的编码都是有规律的,接下来用regular experssion打开。比较常用的函数gsub, strsplit, grep等,可以看帮助文件。
R可以在网页上抓取数据,一种途径是使用函数readlines()下载网页,然后使用如grep()和gsub()一类的函数处理,对于结构复杂的网页,可以使用RCurl和XML包来提取其中想要的信息。
更多信息和示例,参考在Programming with R上找到的“Webscraping Using ReadLines and Rcurl”一文;
R语言使用shiny包创建web界面。
使用 shinydashboard 包和 shinytheme ,美化界面样式,设置界面主题,提升界面整体水平。
Shiny界面图库
shinydashboard
shinytheme界面主题
shinydashboard包创建的基础界面样式分为三个板块:标题,侧边栏,主界面。
shiny包支持 recharts 包的使用,可以创建界面的交互式图形
shinyapps网址
Rstudio推出了 shiny 和 shinyapps 两个包,shiny可以帮助我们更快更好的开发一些app,然后shinyapps可以提供了一个免费的云服务器,供我们发布app。
以知乎 用R语言分析NBA球员得分 分析结果为主题,做web界面展示。
侧边栏设置两个选项:datas display和players' score,点击不同的选项,展示对应的内容。
datas display界面展现3个数据框:NBA,Away team,Host team。通过show 10/25/50 entries 等控制页面展示数值的条数;右上角search实现数值的搜索功能(使用DT包实现)。
players' score展示主队、客队球员得分情况。使用ggplot2包绘制客队各个球员的得分情况
使用 recharts 包绘制主队各个球员的得分情况,recarts包实现图形交互式展现。
建立完UI界面后,设置对应的数值,表格,图形,使web界面变成动态的界面。
挣扎了好久终于把界面创建成功了,shiny的初步学习先画个句号。