β

AMPLab开发的类Hadoop项目Tachyon介绍

邓的博客 1919 阅读

在2013年4月,AMPLab共享了其Tachyon 0.2.0 Alpha版本的Tachyon,其宣称性能为HDFS的300倍,受到了极大的关注。截至目前(2013.7.22),其最新版本为0.3.0-SNAPSHOT,项目地址为:

https://github.com/amplab/tachyon/wiki

下面是官方对Tachyon的一个介绍:

Tachyon是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架中进行可靠的共享,就像Spark和 MapReduce那样。通过利用信息继承,内存侵入,Tachyon获得了高性能。Tachyon工作集文件缓存在内存中,并且让不同的 Jobs/Queries以及框架都能内存的速度来访问缓存文件”。因此,Tachyon可以减少那些需要经常使用的数据集通过访问磁盘来获得的次数。

1. 特性:

2. 项目依赖

Maven

<dependency>
  <groupId>org.tachyonproject</groupId>
  <artifactId>tachyon</artifactId>
  <version>0.2.1</version>
</dependency>

Ant

<dependency org="org.tachyonproject" name="tachyon" rev="0.2.1">

  <artifact name="tachyon" type="jar" />

</dependency>

3. 教程

Running Tachyon Locally: Get Tachyon up and running on a single node for a quick spin in ~ 5 mins.

Running Tachyon on a Cluster: Get Tachyon up and running on your own cluster.

Running Spark on Tachyon: Get Spark running on Tachyon

Running Shark on Tachyon: Get Shark running on Tachyon

Running Hadoop MapReduce on Tachyon: Get Hadoop MapReduce running on Tachyon

Configuration-Settings: How to configure Tachyon.

Command-Line-Interface: Interact with Tachyon through command line.

Tachyon Developer Preview presentation at Spark User Meetup (May, 2013)

4. 总结

本文对Tachyon的来源和特性进行了介绍。

非特别说明,均为原创文章,转载请注明: 转载自邓的博客

本文链接地址: AMPLab开发的类Hadoop项目Tachyon介绍

作者:邓的博客
关注Hadoop、NoSql和搜索相关开源技术
原文地址:AMPLab开发的类Hadoop项目Tachyon介绍, 感谢原作者分享。

发表评论