β

CiteRivers-引用模式的可视化分析系统

VAG 289 阅读

CiteRivers: Visual Analytics of Citation Patterns

Florian Heimerl, Qi Han, Steffen Koch Member , IEEE, Thomas Ertl Member , IEEE
Citation information: DOI 10.1109/TVCG.2015.2467621, IEEE Transactions on Visualization and Computer Graphics

对科学文献的组织、分析、探索是高效知识管理的重要任务,CiteRivers结合已有的分析系统,扩展新的分析技术,设计了全新的对文献的内容、属性以及引用模式的可视化分析系统。

图1-系统预览(a)文献面板(b)文献聚类等级滑条(c)引用属性面板(d)作者面板(e)引用面板(f)引用聚类等级滑条(g)文献趋势图

系统功能剖析

(a)文献面板

文献面板:通过steamgraph的方法来展示文献。根据文献的属性或者相似度,文献被划分到某个聚类(流)中;每个聚类(流)又由不同时间的块组成;每个块中的论文抽取出相应的关键词云。

(c)引用属性面板

引用属性面板:展现了高亮流中每个块中文献的引用的统计属性,包括:引用年龄和引用熵。

(d)作者面板

作者面板:在高亮流的每个块中,统计出最高产的10位作者,并展现其中的变化。

(e)引用面板

引用面板:通过flowgraph的方法来展示引用信息。通过被引用文献的发表期刊\杂志和DBLP的社区结构,将高亮流中所有文献的引用划分到某个聚类中。

(g)文献趋势图

文献趋势图:通过散点图,展现文献的成就性和新颖性。

图2-文献趋势图

用例分析

作者通过VIS 1998~2011收录的所有文献作为数据集,展开了一系列的分析。其中,文献的聚类数量为3,引用的聚类数量为5。

图3-VIS 1998~2011文献分析

从图3中,作者做出了如下的解释:

    1. 文献面板将文献聚为3类,其中底部(红色)为SciVis,中间(绿色)为InfoVis,顶部(紫色)为VAST
    2. VAST始于2006年,所以紫色的聚类从2006年开始才有数据
    3. 图3-a中,蓝色的CitationAge曲线,在2006年出现的一个峰,紧接着在2007/2008年不断下降,而2009年后趋于平缓

针对情况,作者提出的解释是,当VAST创立之初,作为一个新的方向,文献趋向于在过去的文献中寻找相似的引用,所以引用年龄偏大;在第二、第三年,文献趋向于参考不多的仅有的VAST文献,所以引用年龄呈现下降趋势;随着时间推移,VAST文献的年龄也在变大,所以2009年后,引用年龄常态化,趋于平缓。

    1. 引用大量集中在可视化领域和数据挖掘领域

对此,作者表示出极大的兴趣,所以分别查看了,多年中对数据挖掘的引用情况(图4),以及对VAST自身的引用情况(图5)。可以看出,总体的引用都在呈上升趋势;另外,图5中没有2005年以前的数据,同样是因为VAST始于2006年。

图4-VIS 1998~2011对数据挖掘的引用情况

图5-VIS 1998~2011对VAST的引用情况

总结

不足

未来工作

文章中所使用的聚类方法为谱聚类,仅支持自顶向下的分析方法

更多内容与细节,请参阅作者文章原文。总体上,这还是一篇很有意思、有创新思维的好文章。

作者:VAG
浙江大学可视分析小组博客
原文地址:CiteRivers-引用模式的可视化分析系统, 感谢原作者分享。