数据科学之路 的多语言选择

Python021

数据科学之路 的多语言选择,第1张

python 也正是因为 scipy numpy pandas sklearn matplot tf 四个包在数据科学中非常显眼,不过由于GIL的影响,python 和java 为人诟病的就是【慢】,所以这些缺点是我们一直选择去寻找更快的替代方案 ,集中在 c++ golang julia 三种语言 swift 和rust 也稍微找找,java 太沉重了,scala 有spark 支撑 。clojure 语法有点反人类,R 和python 速度大同小异

jupyter 支持的后端语言

https://github.com/jupyter/jupyter/wiki/Jupyter-kernels

c++版

pandas https://github.com/hosseinmoein/DataFrame

numpy https://github.com/QuantStack/xtensor

https://github.com/ndarray/Boost.NumPy

https://github.com/AtsushiSakai/numpycpp

https://github.com/rogersce/cnpy

sklearn https://github.com/davisking/dlib

data science tookit https://github.com/meta-toolkit/meta/

https://meta-toolkit.org/

matplot https://github.com/lava/matplotlib-cpp

golang版

data science https://github.com/cpmech/gosl

matplot https://github.com/zieckey/gochart

scipyhttps://github.com/montanaflynn/stats

sklearn https://github.com/sjwhitworth/golearn

https://github.com/pa-m/sklearn

https://github.com/qingtiandalaoye/GoDataframe

https://github.com/piquette/finance-go

https://github.com/orcaman/financial

numpy

https://github.com/ledao/arrgo

https://piquette.io/projects/finance-go/

tf.go

https://github.com/google/grumpy

julia

https://github.com/JuliaPy/Pandas.jl

https://www.jianshu.com/p/87977f582c27?utm_source=oschina-app

https://github.com/cstjean/ScikitLearn.jl

matplot https://github.com/JuliaPlots/Plots.jl

http://docs.juliaplots.org/latest/

tf.jl

https://github.com/IntelLabs/ParallelAccelerator.jl

https://blog.csdn.net/u014636245/article/details/82216716

https://blog.csdn.net/a_step_further/article/details/79662088

有一个模型转换器

https://github.com/nok/sklearn-porter

https://github.com/7125messi

swift

numpy https://github.com/sonsongithub/numsw

https://github.com/nifty-swift/Nifty

plot https://github.com/i-schuetz/SwiftCharts

https://github.com/apple/coremltools

coreml https://developer.apple.com/documentation/coreml

rust

https://github.com/rust-numpy/rust-numpy

tf https://github.com/tensorflow/rust

sklearn https://github.com/maciejkula/rustlearn

pandas https://github.com/weld-project/weld

matplot https://github.com/SiegeLord/RustGnuplot

https://github.com/ubnt-intrepid/rustplotlib

https://github.com/milliams/plotlib

https://github.com/coder543/dataplotlib

R

pandas dplyr

https://www.dataquest.io/blog/python-vs-r/

http://www.10tiao.com/html/403/201806/2650629741/1.html

http://mathesaurus.sourceforge.net/r-numpy.html

https://github.com/topepo/caret

caret has been used by me with success: http://caret.r-forge.r-project.org/

There is also the MLR package: https://cran.r-project.org/web/packages/mlr/index.html

From the site:

H2O

优就业的Python课程一共设置了5大阶段,主要学习内容如下

第一阶段:Python核心编程——Python语言基本介绍、面向对象编程、Linux操作系统、文件系统与用户管理、进程管理与服务配置、Shell编程与bash,源文件编译、版本控制、MySQL使用、MySQL进阶等。

第二阶段:全栈开发——HTML、CSS、JavaScript、jQuery、 BootStrap、Vue、Web开发基础、数据库操作、FLask配置、Django认识、Models、Templates、Views、Tornado框架进阶、ElasticSearch等。

第三阶段:网络爬虫——爬虫与数据、Scrapy框架、Scrapy框架与信息实时抓取、定时爬取与邮件监控、NoSQL数据库、Scrapy-Redis框架、百万量数据采集等。

第四阶段:人工智能——数据分析、pyechart模块动态可视化、词云、分类算法、聚类算法、回归类算法、关联算法、卷积神经网络、TensorFlow+PaddlePaddle、图像识别等。

第五阶段:就业指导——最后就业指导分为面试就业指导、专业技术指导两方面。

因为优就业Python课程内容会不定期更新,课程时长也会对应有所调整,就目前来看Python的学习时间是在5个月左右。Python课程设置时长是和学习内容紧密相关的,相对而言,课程内容涉及越广、内容越多,学习时间也会长。

第一步:Python开发基础

Python全栈开发与人工智能之Python开发基础知识学习内容包括:Python基础语法、数据类型、字符编码、文件操作、函数、装饰器、迭代器、内置方法、常用模块等。

第二步:Python高级编程和数据库开发

Python全栈开发与人工智能之Python高级编程和数据库开发知识学习内容包括:面向对象开发、Socket网络编程、线程、进程、队列、IO多路模型、Mysql数据库开发等。

第三步:前端开发

Python全栈开发与人工智能之前端开发知识学习内容包括:Html、CSS、JavaScript开发、Jquery&bootstrap开发、前端框架VUE开发等。

第四步:WEB框架开发

Python全栈开发与人工智能之WEB框架开发学习内容包括:Django框架基础、Django框架进阶、BBS+Blog实战项目开发、缓存和队列中间件、Flask框架学习、Tornado框架学习、Restful API等。

第五步:爬虫开发

Python全栈开发与人工智能之爬虫开发学习内容包括:爬虫开发实战。

第六步:全栈项目实战

Python全栈开发与人工智能之全栈项目实战学习内容包括:企业应用工具学习、CRM客户关系管理系统开发、路飞学城在线教育平台开发等。

第七步:数据分析

Python全栈开发与人工智能之数据分析学习内容包括:金融量化分析。

第八步:人工智能

Python全栈开发与人工智能之人工智能学习内容包括:机器学习、数据分析 、图像识别、自然语言翻译等。

第九步:自动化运维&开发

Python全栈开发与人工智能之自动化运维&开发学习内容包括:CMDB资产管理系统开发、IT审计+主机管理系统开发、分布式主机监控系统开发等。

第十步:高并发语言GO开发

Python全栈开发与人工智能之高并发语言GO开发学习内容包括:GO语言基础、数据类型与文件IO操作、函数和面向对象、并发编程等。