全球四个最大的四个开源库

Python012

全球四个最大的四个开源库,第1张

开源数据MySQLMySQL是一个开放源码的小型关联式数据库管理系统,开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源...开源数据库MySQLMySQL是一个开放源码的小型关联式数据库管理系统,开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。盘点:开源社区那些免费的数据库软件MySQL为多种编程语言提供了API,包括C、C++、C#、Delphi、Eiffel、Java、Perl、PHP、Python、Ruby和Tcl等。而其自身是采用C和C++编写的,使用了多种编译器进行测试,所以,MySQL能够保证源代码具有很强的可移植性。这样的一款数据库,自然能够支持几乎所有的操作系统,从Unix、Linux到Windows,具体包括AIX、BSDi、FreeBSD、HP-UX、Linux、Mac OS、Novell Netware、NetBSD、OpenBSD、OS/2 Wrap、Solaris、SunOS、Windows等多种操作系统。最重要的是,它是一个可以处理拥有上千万条记录的大型数据库。与此同时,MySQL也产生了很多分支版本的数据库也非常值得推荐。首先是MariaDB,它是一个采用Maria存储引擎的MySQL分支版本,是由原来MySQL的作者 Michael Widenius创办的公司所开发的免费开源的数据库服务器。与MySQL相比较,MariaDB更强的地方在于它拥有更多的引擎,包括Maria存储引擎、PBXT存储引擎、XtraDB存储引擎、FederatedX存储引擎,它能够更快的复制查询处理、运行的速度更快、更好的功能测试以及支持对Unicode的排序等。其次是rcona,它为MySQL数据库服务器进行了改进,在功能和性能上较MySQL有着很显著的提升。该版本提升了在高负载情况下的InnoDB的性能,同时,它还为DBA提供一些非常有用的性能诊断工具,并且提供很多参数和命令来控制服务器行为。第三是Percona Server,它使用了诸如google-mysql-tools、Proven Scaling和 Open Query对MySQL进行改造。并且,它只包含MySQL的服务器版,并没有提供相应对 MySQL的Connector和GUI工具进行改进。非关系型数据库NoSQL从NoSQL的字面上理解,NoSQL就是Not Only SQL,被业界认为是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储,相对于目前铺天盖地的关系型数据库运用,这一概念无疑是一种全新的思维的注入。盘点:开源社区那些免费的数据库软件当然,NoSQL也是随着互联网Web2.0网站的兴起才能取得长足的进步。关键的需求在于,传统的关系数据库在应付Web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。首先推荐的是Oracle NoSQL Database,这是一个社区版。Oracle的这个NoSQL Database, 是在10月4号的甲骨文全球大全上发布的Big Data Appliance的其中一个组件,Big Data Appliance是一个集成了Hadoop、NoSQL Database、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。其次推荐的是Membase。Membase是NoSQL家族的一个新的重量级的成员。Membase是开源项目,源代码采用了Apache2.0的使用许可。该项目托管在GitHub.Source tarballs上,目前可以下载beta版本的Linux二进制包。该产品主要是由North Scale的memcached核心团队成员开发完成,其中还包括Zynga和NHN这两个主要贡献者的工程师,这两个组织都是很大的在线游戏和社区网络空间的供应商。并且,Membase容易安装、操作,可以从单节点方便的扩展到集群,而且为memcached(有线协议的兼容性)实现了即插即用功能,在应用方面为开 发者和经营者提供了一个比较低的门槛。做为缓存解决方案,Memcached已经在不同类型的领域(特别是大容量的Web应用)有了广泛的使用,其中 Memcached的部分基础代码被直接应用到了Membase服务器的前端。通过兼容多种编程语言和框架,Membase具备了很好的复用性。在安装和配置方面,Membase提供了有效的图形化界面和编程接口,包括可配置 的告警信息。Membase的目标是提供对外的线性扩展能力,包括为了增加集群容量,可以针对统一的节点进行复制。 另外,对存储的数据进行再分配仍然是必要的。第三推荐的是Hibari。Hibari在日语中意思为“云雀”,它是一个专为高可靠性和大数据存储的数据库引擎,可用于云计算环境中,例如 webmail、SNS和其他要求T/P级数据存储的环境中。同时,Hibari也支持Java,C/C++,Python,Ruby和Erlang语言的客户端。第四推荐的是memcachedb。这是一个由新浪网的开发人员开放出来的开源项目,给memcached分布式缓存服务器添加了Berkeley DB的持久化存储机制和异步主辅复制机制,让memcached具备了事务恢复能力、持久化能力和分布式复制能力,非常适合于需要超高性能读写速度,但是 不需要严格事务约束,能够被持久化保存的应用场景,例如memcachedb被应用在新浪博客上面。第五推荐的是Leveldb。这是一个Google实现的非常高效的kv数据库,目前的版本1.2能够支持billion级别的数据量了。 在这个数量级别下还有着非常高的性能,主要归功于它的良好的设计,特别是LSM算法。LevelDB是单进程的服务,性能非常之高,在一台4个Q6600的CPU机器上,每秒钟写数据超过40w,而随机读的性能每秒钟超过10w。XML数据库的优势XML数据库是一种支持对XML格式文档进行存储和查询等操作的数据管理系统。在系统中,开发人员可以对数据库中的XML文档进行查询、导出和指定格式的序列化。目前XML数据库有三种类型:XMLEnabledDatabase(XEDB),即能处理XML的数据库NativeXMLDatabase(NXD),即纯XML数据库HybridXMLDatabase(HXD),即混合XML数据库。关系数据库中的第一代XML支持是切分(或分解)文档,以适应关系表格或将文档原封不动地存储为字符或二进制大对象(CLOB 或 BLOB)。这两个方法中的任一种都尝试将XML模型强制转换成关系模型。然而,这两种方法在功能和性能上都有很大的局限性。混合型模型将XML存储在类似于DOM的模型中。XML数据被格式化为缓冲数据页,以便快速导航和执行查询以及简化索引编制。在这里,首要要推荐的XML数据库是Sedna。它号称是一款原生态的XML数据库,提供了全功能的核心数据库服务,包括持久化存储、ACID事务、索引、安全、热备、UTF8等。实现了 W3C XQuery 规范,支持全文搜索以及节点级别的更新操作。第二款XML数据库是BaseX。这款数据库用来存储紧缩的XML数据,提供了高效的 XPath和XQuery的实现,同时,它还提供一个前端操作界面。盘点:开源社区那些免费的数据库软件第三款推荐的是XMLDB。这款数据库使用了关系型数据库来存储任意的XML文档,因为所采用的存储机制,所以文档的搜索速度特别快,同时执行XSL转换也相当快。XMLDB同时还提供了一个PHP的模块,可以应用在Web应用中。第四块推荐的是X-Hive/DB。它是一个为需要高级XML数据处理和存储功能的软件开发者设计的强大的专属XML数据库。X-Hive/DB Java API包含存储、查询、检索、转换和发表XML数据的方法。与传统关系型数据库相比,XML数据库具有以下优势:第一,XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。第二,提供对标签和路径的操作。传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。第三,当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,则XML数据库利于文档存储和检索可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。

一:获取app-key 和 app-secret

使用自己的微博账号登录微博开放平台(http://open.weibo.com/),在微博开放中心下“创建应用”创建一个应用,应用信息那些随便填,填写完毕后,不需要提交审核,需要的只是那个app-key和app-secret

二:设置授权回调页

在“微博开放平台”的“管理中心”找到刚才创建的应用,点开这个应用,点开左边“应用信息”栏,会看见“App key”和“App Secret”的字样,这两个东西是要在后面程序中使用的。然后在“应用信息”下的“高级信息”点击“编辑”按钮,将“授权回调页面”设置为:https://api.weibo.com/oauth2/default.html,将“取消授权回调页”也设置为:https://api.weibo.com/oauth2/default.html。

三:安装微博 python SDK

有两种安装方式:

1:http://github.liaoxuefeng.com/sinaweibopy/下载新浪微博SDK

2:python有个简单的安装方式:直接在命令行下键入:

[python] view plain copy

sudo pip install sinaweibopy

四:实例验证,获取当前登录用户及其所关注(授权)用户的最新微博

这里需要注意的是在浏览器弹出一个页面,要先点击“授权”(这里进行的OAuth 2认证,我理解为就是用户访问我的应用后将页面导向新浪服务器然后用户输入信息到新浪服务器后授权给我的应用访问用户数据,这里我将的微博授权给下面的程序了),授权后浏览器中的URL类似:https://api.weibo.com/oauth2/default.html?code=2024222384d5dc88316d21675259d73a将code后面那个复制到控制端,程序需要读入2024222384d5dc88316d21675259d73a这个数据

注意:如果想获取别的信息,只需修改

[python] view plain copy

statuses = client.statuses__friends_timeline()['statuses']

中的 statuses__friends_timeline即可

[python] view plain copy

# -*- coding: utf-8 -*-

from weibo import APIClient

import webbrowser        #python内置的包

APP_KEY = 'xxxxxxxx'#注意替换这里为自己申请的App信息

APP_SECRET = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'

CALLBACK_URL = 'https://api.weibo.com/oauth2/default.html'#回调授权页面

#利用官方微博SDK

client = APIClient(app_key=APP_KEY, app_secret=APP_SECRET, redirect_uri=CALLBACK_URL)

#得到授权页面的url,利用webbrowser打开这个url

url = client.get_authorize_url()

print url

webbrowser.open_new(url)

#获取code=后面的内容

print '输入url中code后面的内容后按回车键:'

code = raw_input()

#code = your.web.framework.request.get('code')

#client = APIClient(app_key=APP_KEY, app_secret=APP_SECRET, redirect_uri=CALLBACK_URL)

r = client.request_access_token(code)

access_token = r.access_token # 新浪返回的token,类似abc123xyz456

expires_in = r.expires_in

# 设置得到的access_token

client.set_access_token(access_token, expires_in)

#可以打印下看看里面都有什么东西

statuses = client.statuses__friends_timeline()['statuses'] #获取当前登录用户以及所关注用户(已授权)的微博</span>

length = len(statuses)

print length

#输出了部分信息

for i in range(0,length):

print u'昵称:'+statuses[i]['user']['screen_name']

print u'简介:'+statuses[i]['user']['description']

print u'位置:'+statuses[i]['user']['location']

print u'微博:'+statuses[i]['text']

结果如下(截取部分数据):

以下为我的关注用户的微博:

拿上边代码为例,这里我们获取的信息有:

Python简单易学,入门门槛低,而且可以跨平台使用,一处编写处处运行,因此从开发者的视角来说非常高效。

其稳定性和安全性也在大型实际项目上得到了验证,一些著名的网站或客户端应用都是用Python来实现的,例如 YouTube,豆瓣,BitTorrent 和 Dropbox等。

Python的应用领域

1. Web开发

Python可以快速创建Web应用,这得益于其强大的基础库和丰富的网络框架,例如著名的Django,Flask,Tonardo,Web.py 等。

通过使用这些Web框架,我们开发Web网站会更加安全与便利,在天下武功唯快不破的时代,何乐而不为呢。

2. 游戏开发

Python也能用来开发互动性的游戏。PySoy可以提供3D引擎,而PyGame则可以提供了开发一款游戏的基本功能和库支持。例如 Civilization-IV,Disney’s Toontown Online,Vega Strike 等游戏都是通过Python来开发。

在网络游戏开发中,Python也有很多应用,相比Lua而言,Python 有更高阶的抽象能力,可以用更少的代码描述游戏业务逻辑。

3. 机器学习与人工智能

机器学习和人工智能是当下最热的话题,Python 在人工智能领域内的机器学习、神经网络、深度学习等方面,都是主流的编程语言。原因至少有以下三点:

· 目前世界上优秀的人工智能学习框架,比如 Google 的 TransorFlow(神经网络框架)、FaceBook 的 PyTorch(神经网络框架)以及开源社区的 Karas 神经网络库等,都是用 Python 实现的

· 微软的 CNTK(认知工具包)也完全支持 Python,并且该公司开发的 VS Code,也已经把 Python 作为第一级语言进行支持。

· Python 擅长进行科学计算和数据分析,支持各种数学运算,可以绘制出更高质量的 2D 和 3D 图像。

如今AI 时代的来临,Python 作为 AI 时代头牌语言的位置,已经确定。

4. 科学计算与数据可视化

自1997 年,NASA 就大量使用 Python 进行各种复杂的科学运算,为 Python 积累了丰富的科学运算库。

并且,和其它解释型语言(如 shell、js、PHP)相比,Python 在数据分析、可视化方面有相当完善和优秀的库,例如 NumPy、SciPy、Matplotlib、pandas 等,这可以满足 Python 开发者高效编写科学计算程序。

同时基于Matplotlib,Seaborn,又能方便绘制图形,能让数据可以更直观的表现。

5. 桌面软件

Python可用于桌面应用程序编程。它提供了可用于开发用户界面的库,如Tkinter,wxPython和pyQT等,可用于在多个平台上创建桌面应用程序。

6. 网络爬虫

在爬虫领域,Python非常强大,将网络一切数据作为资源,通过自动化程序进行有针对性的数据采集以及处理。

现在已经有非常成熟的爬虫工具和框架,如Requests,Scrapy, pySpider等。可以利用它们高效的构建网络爬虫,获取需要的数据。

7. 云计算

Python是从事云计算工作必需掌握的一门编程语言,目前很火的云计算框架OpenStack就是由Python开发的,如果想要深入学习并进行二次开发,就需要具备Python的技能。

8. 金融分析与量化交易

Python拥有大量的金融计算库,并且可以提供与C++,Java等语言的接口以实现高效率的分析,成为金融领域快速开发和应用的一种关键语言,由于它是开源的,降低了金融计算的成本,而且还通过广泛的社交网络提供大量的应用实例,极大的缩短了金融量化分析的学习路径。

9. 物联网

Python在嵌入式领域的应用使得Python语言打通了整个物联网开发体系,从设备、网络、平台到分析和应用,整个物联网开发体系都可以采用Python语言来完成功能开发,在5G通信的推动下,未来Python在物联网领域的应用前景也非常值得期待。

10. 自动化运维

Python是一门综合性的语言,能满足绝大部分自动化运维需求,前端和后端都可以做,同时大数据时代的到来和人工智能的快速发展,自动化运维必将替代人工运维。而Python语言因其强大的第三方程序库,如Fabric,Ansible和Saltstack等,在系统运维方面有着非常大的优势。

Python的就业前景

随着Python的技术的流行,Python为人们的工作与生活上带来了很多的便捷,因为Python简单,学起来快,也是不少新手程序员入门的首选语言。新手们比较关心的就是Python的发展前景与方向。本文,就从三个方面,详细的分析Python的发展前景。

1、从自身特性看Python发展

Python自身强大的优势决定其不可限量的发展前景。Python作为一种通用语言,几乎可以用在任何领域和场合,角色几乎是无限的。Python具有简单、易学、免费、开源、可移植、可扩展、可嵌入、面向对象等优点,它的面向对象甚至比java和C#.net更彻底。

它是一种很灵活的语言,能帮你轻松完成编程工作。强大的类库支持,使编写文件处理、正则表达式、网络连接等程序变得相当容易。能运行在多种计算机平台和操作系统中,如unix、windows、MacOS、OS/2等等,并可作为一种原型开发语言,加快大型程序的开发速度。

2、从企业应用来看Python发展

Python被广泛的用在Web开发、运维自动化、测试自动化、数据挖掘等多个行业和领域。一项专业调查显示,75%的受访者将Python视为他们的主要开发语言,反之,其他25%受访者则将其视为辅助开发语言。将Python作为主要开发语言的开发者数量逐年递增,这表明Python正在成为越来越多开发者的开发语言选择。

目前,国内不少大企业都已经使用Python如豆瓣、搜狐、金山、腾讯、盛大、网易、百度、阿里、淘宝、热酷、土豆、新浪、果壳等国外的谷歌、NASA、YouTube、Facebook、工业光魔、红帽等都在应用Python完成各种各样的任务。

3、从市场需求与薪资看Python发展

从最新Python招聘岗位需求来看,Python工程师的岗位需求量巨大,并且岗位需求量还在呈现上涨的趋势。全国Python岗位需求量接近10W个,北京岗位需求量居首位为20890个,占比21.17%上海Python工程师岗位需求量居第二位为12843个,占比13.02%其次是深圳、杭州、广州等一线城市合计占比16.53%,下图为全国主要城市Python工程师岗位需求量:

Python人才需求逐年增加,从市场整体需求来看,Python在招聘市场上的流行程度也是在逐步上升的,工资水平也是水涨船高。据统计Python平均薪资水平在12K,随着经验的提升,薪资也是逐年增长。

目前初级Python工程师薪资待遇就达10-15K,而随着开发年限的增加,Python开发者薪资呈直线上升的变化趋势,工作8年的Python薪资攀升至25K左右。

4、Python岗位有哪些呢?

主要的岗位有这些:

Python全栈开发工程师(10k-20K)

Python运维开发工程师(15k-20K)

Python高级开发工程师(15k-30K)

Python大数据工程师(15K-30K)

Python机器学习工程师(15k-30K)

Python架构师(20k-40k)

学习Python的程序员,除去Python开发工程师、Python人工智能工程师、Python自动化测试外,也能够朝着Python游戏开发工程师、数据分析工程师、Linux运维工程师等方向发展,发展方向较为多元化。

随着Python的流行,带动的是它的普及以及市场需求量,所以现在学习Python是个不错的时机。