Scikit-learn 基于Scipy机器习建造Python模块特色化类归聚类算包括支持向量机逻辑归朴素贝叶斯类器随机森林Gradient Boosting聚类算DBSCAN且设计Python numericalscientific libraries Numpy and Scipy
2.Pylearn2
Pylearn让机器习研究简单化基于Theano库程序
3.NuPIC
NuPICHTM习算工具机器智能平台HTM皮层精确计算HTM核基于间持续习算储存撤销空模式NuPIC适合于各种各问题,尤其检测异预测流数据源
4. Nilearn
Nilearn 能够快速统计习神经影像数据Python模块利用Python语言scikit-learn 工具箱些进行预测建模类解码连通性析应用程序进行元统计
5.PyBrain
Pybrain基于Python语言强化习工智能神经网络库简称 目标提供灵、容易使用并且强机器习算进行各种各预定义环境测试比较算
6.Pattern
Pattern Python语言网络挖掘模块数据挖掘自语言处理网络析机器习提供工具支持向量空间模型、聚类、支持向量机知机并且用KNN类进行类
7.Fuel
Fuel机器习模型提供数据共享MNIST, CIFAR-10 (图片数据集), Google’s One Billion Words (文字)类数据集接口使用通种式替代自数据
8.Bob
Bob免费信号处理机器习工具工具箱用PythonC++语言共同编写设计目变更加高效并且减少发间由处理图像工具,音频视频处理、机器习模式识别量软件包构
9.Skdata
Skdata机器习统计数据集库程序模块于玩具问题流行计算机视觉自语言数据集提供标准Python语言使用
10.MILK
MILKPython语言机器习工具包主要类比SVMS,K-NN,随机森林决策树使用监督类 执行特征选择 些类器许面相结合,形同例监督习、密切关系金传播由MILK支持K-means聚类等类系统
11.IEPY
IEPY专注于关系抽取源性信息抽取工具主要针需要型数据集进行信息提取用户想要尝试新算科家
12.Quepy
Quepy通改变自语言问题数据库查询语言进行查询Python框架简单定义自语言数据库查询同类型问题所用编码建立自用自语言进入数据库系统
现Quepy提供于SparqlMQL查询语言支持并且计划延伸其数据库查询语言
13.Hebel
HebelPython语言于神经网络深度习库程序使用通PyCUDA进行GPUCUDA加速重要神经网络模型类型工具且能提供些同函数激功能例力涅斯捷罗夫力信号丢失停止
14.mlxtend
由用工具数据科任务扩展组库程序
15.nolearn
程序包容纳量能完机器习任务帮助实用程序模块其量模块scikit-learn起工作其通更用
16.Ramp
RampPython语言制定机器习加快原型设计解决案库程序轻型pandas-based机器习插入框架现存Python语言机器习统计工具(比scikit-learn,rpy2等)Ramp提供简单声明性语探索功能能够快速效实施算转换
17.Feature Forge
系列工具通与scikit-learn兼容API创建测试机器习功能
库程序提供组工具让许机器习程序使用受用使用scikit-learn工具觉受帮助(虽能同算起作用)
18.REP
REP种谐、再式指挥数据移驱所提供种环境
统类器包装提供各种各操作例TMVA, Sklearn, XGBoost, uBoost等等并且群体平行式训练类器同提供交互式情节
19.Python 习机器品
用亚马逊机器习建造简单软件收集
20.Python-ELM
Python语言基于scikit-learn极端习机器实现
#coding=utf-8'''
Created on 2014-11-10
@author: Neo
'''
import os
def GetFileList(dir, fileList, nameList):
#文件列表fileList
#只取文件名的列表nameList
newDir = dir
if os.path.isfile(dir):
fileList.append(dir.decode('gbk'))
nameList.append(os.path.basename(dir.decode('gbk')))
elif os.path.isdir(dir):
for s in os.listdir(dir):
if s == ".popoCloud":
continue
newDir=os.path.join(dir,s)
GetFileList(newDir, fileList, nameList)
return fileList, nameList
fileList = []
nameList = []
#你存放fas文件的目录,如:
#dir = 'd:/xxx/xxx/'
dir = (os.getcwd() + '\\fas\\').replace('\\','/')
fileList, nameList = GetFileList(dir, fileList, nameList)
print fileList, nameList
#根据你的要求替换文件内容
for i in range(fileList.__len__()):
print fileList[i]
fp = open(fileList[i],'r')
#我不清楚你的每个fas有多大,如果比较大,就换一种读写方式
str = fp.read()
fp.close()
# print str
str = str.replace('>', '>' + nameList[i][:-4] +'_')
# print str
fp = open(fileList[i],'w')
fp.write(str)
fp.close()
print "OK"
效果如下:
[u'D:/workspace/PyDemo/fas/AAAA.fas', u'D:/workspace/PyDemo/fas/BBBB.fas', u'D:/workspace/PyDemo/fas/CCCC.fas'] [u'AAAA.fas', u'BBBB.fas', u'CCCC.fas']
D:/workspace/PyDemo/fas/AAAA.fas
D:/workspace/PyDemo/fas/BBBB.fas
D:/workspace/PyDemo/fas/CCCC.fas
OK