如果要开发pc程序,开发的是一款可视化的开发工具,学什么编程语言比较好?

Python014

如果要开发pc程序,开发的是一款可视化的开发工具,学什么编程语言比较好?,第1张

非编程篇/可直接上手的工具

1. Excel

Excel是最容易上手的图表工具,善于处理快速少量的数据。结合数据透视表,VBA语言,可制作高大上的可视化分析和dashboard仪表盘。

单表或单图用Excel制作是不二法则,它能快速地展现结果。但是越到复杂的报表,excel无论在模板制作还是数据计算性能上都稍显不足,任何大型的企业也不会用Excel作为数据分析的主要工具。

2. 可视化 BI(Power BI \Tableau \ 帆软FineBI等等)

也许是Excel也意识到自己在数据分析领域的限制和眼下自助分析的趋势,微软在近几年推出了BI工具Power BI。同可视化工具Tableau和国内帆软的BI工具一样,封装了所有可能分析操作的编程代码,操作上都是以点击和拖拽来实现,几款工具的定位稍有不同。

Power BI

最大的明显是提供了可交互、钻取的仪表板,利用Power Pivot可直接生产数据透视报告,省去了数据透视表。

Tableau

可视化图表较为丰富,堪称一等, 操作更为简单。

帆软FineBI

企业级的BI应用,实用性较强,因2B市场的大热受到关注。千万亿级的数据性能可以得到保证,业务属性较重,能与各类业务挂钩。

对于个人,上手简单,可以腾出更多的时间去学习业务逻辑的分析。

编程篇

对于寻求更高境界数据分析师或数据科学家,如果掌握可视化的编程技巧,就可以利用数据做更多的事情。熟练掌握一些编程技巧,赋予数据分析工作更加灵活的能力,各种类型的数据都能适应。大多数设计新颖、令人惊艳的数据图几乎都可以通过代码或绘图软件来实现。

与任何语言一样,你不可能立刻就开始进行对话。要从基础开始,然后逐步建立自己的学习方式。很可能在你意识到之前,你就已经开始写代码了。关于编程最酷的事情在于,一旦你掌握了一门语言,学习其他语言就会更加容易,因为它们的逻辑思路是共通的。

1. Python语言

Python 语言最大的优点在于善于处理大批量的数据,性能良好不会造成宕机。尤其适合繁杂的计算和分析工作,而且,Python的语法干净易读,可以利用很多模块来创建数据图形比较受IT人员的欢迎。

利用 Python 生成的图表

2. PHP语言

PHP这个语言松散却很有调理,用好了功能很强大。在数据分析领域可以用php做爬虫,爬取和分析百万级别的网页数据,也可与Hadoop结合做大数据量的统计分析。

因为大部分 Web 服务器都事先安装了 PHP 的开源软件,省去了部署之类的工作,可直接上手写。

比如 Sparkline(微线表)库,它能让你在文本中嵌入小字号的微型图表,或者在数字表格中添加视觉元素,就像下面这张图一样:

利用 PHP 图形函数库生成的微线表

一般 PHP会和 MySQL 数据库结合使用,这使它能物尽其用,处理大型的数据集。

3. HTML、JavaScript 和 CSS语言

很多可视化软件都是基于web端的,可视化的开发,这几类语言功不可没。而且随着人们对浏览器工作越来越多的依赖,Web 浏览器的功能也越来越完善,借助 HTML、JavaScript 和 CSS,可直接运行可视化展现的程序。

可交互日历,同时也是用户使用 your.flowingdata 的热度图

不过还是有几点需要注意。由于相关的软件和技术还比较新,在不同浏览器中你的设计可能在显示上会有所差别。在 Internet Explorer 6 这类老旧的浏览器中,有些工具可能无法正常运行。比如一些银行单位仍旧使用着IE,无论是自己使用还是开发的时候都要考虑这样的问题。

4. R语言

R语言是绝大多数统计学家最中意的分析软件,开源免费,图形功能很强大。

谈到R语言的历史,它是专为数据分析而设计的,面向的也是统计学家,数据科学家。但是由于数据分析越来越热门,R语言的使用也不瘦那么多限制了。

R的使用流程很简洁,支持 R 的工具包也有很多,只需把数据载入到 R 里面,写一两行代码就可以创建出数据图形。比如利用 Portfolio 工具包快速创建出如下的板块层级图。

比如热度图

部署简单。Go编译生成的是一个静态可执行文件,除了glibc外没有其他外部依赖。这让部署变得异常方便:目标机器上只需要一个基础的系统和必要的管理、监控工具,完全不需要操心应用所需的各种包、库的依赖关系,大大减轻了维护的负担。这和Python有着巨大的区别。由于历史的原因,Python的部署工具生态相当混乱【比如setuptools,distutils,pip,

buildout的不同适用场合以及兼容性问题】。官方PyPI源又经常出问题,需要搭建私有镜像,而维护这个镜像又要花费不少时间和精力。

并发性好。Goroutine和channel使得编写高并发的服务端软件变得相当容易,很多情况下完全不需要考虑锁机制以及由此带来的各种问题。单个Go应用也能有效的利用多个CPU核,并行执行的性能好。这和Python也是天壤之比。多线程和多进程的服务端程序编写起来并不简单,而且由于全局锁GIL的原因,多线程的Python程序并不能有效利用多核,只能用多进程的方式部署如果用标准库里的multiprocessing包又会对监控和管理造成不少的挑战【我们用的supervisor管理进程,对fork支持不好】。部署Python应用的时候通常是每个CPU核部署一个应用,这会造成不少资源的浪费,比如假设某个Python应用启动后需要占用100MB内存,而服务器有32个CPU核,那么留一个核给系统、运行31个应用副本就要浪费3GB的内存资源。

良好的语言设计。从学术的角度讲Go语言其实非常平庸,不支持许多高级的语言特性但从工程的角度讲,Go的设计是非常优秀的:规范足够简单灵活,有其他语言基础的程序员都能迅速上手。更重要的是Go自带完善的工具链,大大提高了团队协作的一致性。比如gofmt自动排版Go代码,很大程度上杜绝了不同人写的代码排版风格不一致的问题。把编辑器配置成在编辑存档的时候自动运行gofmt,这样在编写代码的时候可以随意摆放位置,存档的时候自动变成正确排版的代码。此外还有gofix,

govet等非常有用的工具。

执行性能好。虽然不如C和Java,但通常比原生Python应用还是高一个数量级的,适合编写一些瓶颈业务。内存占用也非常省。