为什么从事大数据行业,一定要学习Python?

Python015

为什么从事大数据行业,一定要学习Python?,第1张

需要澄清两点之后才可以比较全面的看这个问题: 1. 百万行级不算大数据量,以目前的互联网应用来看,大数据量的起点是10亿条以上。 2. 处理的具体含义,如果是数据载入和分发,用python是很高效的;如果是求一些常用的统计量和求一些基本算法的结果,python也有现成的高效的 库,c实现的和并行化的;如果是纯粹自己写的算法,没有任何其他可借鉴的,什么库也用不上,用纯python写是自讨苦吃。 python的优势不在于运行效率,而在于开发效率和高可维护性。针对特定的问题挑选合适的工具,本身也是一项技术能力。Python是一个强大的,灵活的,开放的,易于学习的源语言,使用方便,并具有强大的数据操作和分析库。其简单的语法使编程新手很容易学习和掌握,经历过Matlab,,C / C++,java,或Visual Basic,Python提供了一个独特的组合,都能使用编程语言以及使用方便的分析和定量计算

项目类型上,Java更适合大型项目,易于管理和维护;Python3更适合写一些小项目,便于更新迭代。

在大项目上的应用,除开那种密集计算型的项目,我敢说Java世界上最好的语言!一般用户在百万+千万不到的时候,并发变高、内存不够,但是优化一下好像还可以接着用,此时Java的优势就显现出来了。虽然Python可以拓展C语言,但终究比较麻烦。这时jvm的作用就要体现了!找个熟悉jvm的大牛,优化效率就能飙升啊~如果是采用面向对象方式开发软件,Java/C#之类的事更加适合的语言选择。特别是一些大规模且逻辑复杂、处理流程多样化的软件系统,从分析、设计、实现到面向对象贯穿下来,动态类型的语言显然不是最好的选择,这种语言的灵活性在这种情境下带来的更多可能是麻烦。

在性能上,我说Java的性能比Python的性能好应该没有人打我吧,而且又是多线程~并且Java的库又多又是纯字节,你说我有什么理由不爱它?还有Java没有2、3、4啊!!