大数据创业 数据哪里来?

Python018

大数据创业 数据哪里来?,第1张

数据创业:数据哪里来?需要跨过几道坎?

这篇文章考虑了很久也没下笔,一方面想写得干货一些,一方面又想写得引人入胜一些,纠结来纠结去,终于决定还是以一个中立的用户角度去写,尽量写得大众化一些。

2013年5月10日,在淘宝十周年晚会-马云退休演讲中,马云说:这是一个变化的时代。还有人没搞清楚PC,移动互联网来了;还没搞清楚移动互联网,大数据来了。而变化的时代是年轻人的时代。

马云说的这句话很关键,他不仅提到了大数据,而且更是用一句话阐述了互联网从PC时代,进化到移动互联网时代,然后从移动互联网时代进阶到了大数据时代。有几个关键点很重要:PC时代,全球催生了大量的互联网上市企业,包括谷歌、亚马逊、新浪、搜狐、新东方等等;

移动互联网时代,中国创业热潮风生水起,不仅有大量的移动互联网(包括手游)企业赴美上市,更是诞生了无数个创业奇迹。移动互联网不仅为我们的生活带来了便利,更是把创业热潮推向了历史最高峰。

现在问题来了,大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?大数据时代如何创业?大数据创业的门槛又有哪些呢?

先回答第一个问题:大数据时代,创业热潮是不是应该比移动互联网时代更加热闹呢?

据我了解,不是。走在中关村创业大街上,你能收到的100份融资BP里,可能有99份都是APP和O2O项目,但99家里90%以上会重视大数据。

那么大数据时代如何创业呢?请先了解一下大数据的创业门槛。

门槛一:数据

大数据大数据,没有数据怎么玩?那么数据从哪里来呢?

像百度、腾讯和阿里巴巴这样的BAT企业,本身就积累了大量的数据,所以他们玩起大数据来,多半是“闷声发大财”。当然了,也可以说几句BAT企业玩大数据的例子,比如说百度旗下的“百度迁徙”、“百度精算”、“百度舆情”、“百度大数据预测引擎”等等,都是百度的大数据产品应用;阿里巴巴的话,“阿里云”、“支付宝-花呗”、“支付宝-借呗”“芝麻信用”、“蚂蚁金服”等等,都应有了大数据技术。而腾讯方面,“腾讯广点通”、“腾讯云分析”和微信等也都引用了大数据技术。

尔等屌丝没有数据,如何玩呢?

首先,你可以通过第三方购买数据,比如说,数据堂就有很多数据出售和分享;

其次,你可以用爬虫爬回一些数据来存储;

再者,通过给企业、开发者、站长等等授权使用大数据工具来积累数据。这方面的新创企业包括Talkingdata、友盟和DataEye等。

最后,使用免费的政府、企业、和机构开放数据。比如说高德数据的API接口和微博商业数据API接口等等。

总体来说,解决好数据源是大数据创业的必要门槛。关键看你创业的项目是什么。

门槛二:硬件

在北京,我曾经参观过一家大数据初创企业,当时他们还没有拿到融资。我去他们的办公区发现一幕特别心酸的事情。他们的员工挤在一间很小的屋子里办公,而两件较大的屋子都用来安放大数据存储服务器。大数据的存储量是很惊人的,这对机房和硬件设备也提出了新的挑战。

这一点和移动互联网不太一样,你做一个APP,用电脑搞开发,服务器用云服务器就行,按需购买。但是大数据不行,你没法把自家的数据存储在别人的云服务器上,一方面是安全因素,另外一方面也有产权因素。

硬件也是大数据创业的门槛之一,但不是最大 的门槛。顺便补充一句,我曾经参观过的那家大数据新创企业,目前已完成百万美元的A轮融资,现在他们家的办公区特别宽敞,恭喜星图数据。

门槛三:人才

我认为大数据创业的最大门槛在于人才。和做APP不一样,大数据创业你一个人乃至几个人都是没法玩转的。初创企业你就往10-15人这样的团队先招人吧,这样的团队要包括Hadoop工程师、算法工程师,数据建模工程师、架构师、NoSQL工程师、BI工程师等等,全都是技术要求较高、薪资要求也很高的人才。

大数据人才有多贵?在美国,在R、NoSQL和MapReduce方面需求的专业人才薪水达到了每年约11万5千美元,在中国也便宜不到哪里去,没有年薪30万,你很难招到一个大数据人才。

也就是说,技术很牛的大数据人才,他的选择面很宽,要么早就进入BAT企业,要么也是在不错的企业拿着高薪,你要挖这样的人才,除了钱,股票、期权、福利等等,都是必须付出的代价。

2015年-2016年是大数据人才最为匮乏的两年,原因很简单,各大刚刚开通了大数据科目的院校,学生还没毕业;而招聘市场上的大数据人才需求量远远已经供不应求。除了BAT企业,通信企业、电力企业、金融银行行业、医疗行业、工业、游戏行业等等,哪个行业不是都在招大数据人才?创业公司要在这么严峻的人才环境中找到适合自己的大数据技术人才,门槛可不止是钱。

门槛四:技术

说了人才,就要说技术了。大数据技术不是你懂C++或者R语言就够了的,大数据有一整套自己的技术体系,包括统计、编程、JAVA、数据库、Hadoop、Spark、NoSQL、机器学习、自然语言处理、算法、数据可视化等等技术。光是Hadoop需要用到的技术和编程语言就有很多项。

而且市面上的大数据工具每家用的还不一样,用开源软件(如Hadoop、Spark)或者用SAP(SAP HANA)需要的技术也不一样。技术要求较高,而拥有大数据综合技术的人才又较少,这也成为了制约大数据创业的最大问题。

门槛五:钱

其实我不想写钱,但是又必须写钱。大数据行业创业不缺资本,只要你创业项目的商业模式没问题,并且技术能力强,且团队靠谱,无论在中国还是在美国,融个A轮还是没有问题的,资本关注度很热。但是你在拿到融资之前,自己启动的资金就需要一大笔。人才、硬件和技术成本都较高。

这么理解吧,如果说,几个好朋友凑50万花3个月可以做一个APP项目,那么要在大数据行业创业的话,请先准备600-800万再来玩。

门槛六:商业模式

中国互联网上最赚钱的行业是什么?我认为是电子商务和网络游戏。电子商务和网络游戏也是互联网变现最快的行业。而大数据,它的变现能力不如网络游戏和电子商务那般简单直接。在我拜访过的很多企业中,他们手里有钱、有数据、有人才也有技术,但是他们不知道自己手里的数据可以拿来做什么。

也就是说,大数据目前没有最明朗最直接的商业模式。大数据只有和业务场景结合,才能产生价值。

大数据就像石油原油一样,你知道它在哪里,你可以开采它,但是开采出来你还需要冶炼,并且经过减压蒸馏、加氢精制、溶剂精制、溶剂脱蜡等炼制过程,成为成品油后运送到各个加油站,让汽车加满油后产生了动力才实现最终价值。大数据也一样,需要一整套复杂 的过程才能实现商业价值。

那么你可能会问了,大数据交易算不算是商业模式呢?我个人觉得,要看交易的是什么东西?原始的非结构化的数据,后面数据清洗需要太多的工序,数据存储也是很大的成本,这样的交易代价太高。我相信无论是企业用户也好,还是个人用户也好,大家更倾向于购买“拿来就能用”的大数据数据源。

你说京东和腾讯完成首笔大数据交易,我觉得就是一个笑话,京东和腾讯的大数据不早就整合在一起了么?我用微信直接就能在京东购物,数据是互通的,何必交易?

所以说,大数据创业最难的还是在于商业模式的思考,如果你没有找到一条让大数据变现的渠道,那么千万不要忙着拉团队创业。大数据行业创业,光有idea是不够的,跑通整个商业模式才是关键。

以上是小编为大家分享的关于大数据创业 数据哪里来?的相关内容,更多信息可以关注环球青藤分享更多干货

赫罗图(Hertzsprung-Russell diagram,简写为H-R diagram或HRD),宇宙学名词,是指恒星的光谱类型与光度之关系图。是丹麦天文学家赫茨普龙和美国天文学家罗素分别于1911年和1913年各自独立提出的。

赫罗图的纵轴是光度与绝对星等,而横轴则是光谱类型及恒星的表面温度,从左向右递减。恒星的光谱型通常可大致分为 O.B.A.F.G.K.M 七种,其中O型为蓝星B型为蓝白星A型为白星F型为黄白星G型为黄星K型为橙红星M型为红星。

恒星种类繁多,各具特色,它们的性质主要由两个参数决定:一个是恒星的表面温度另一个是恒星的光度,也就是恒星的绝对星等。

郝罗图的横坐标表示恒星的表面温度纵坐标表示恒星的光度和绝对星等。郝罗图的左上方到右下方大致沿着对角线点的分布很密集,成带状,占总数的 90%,天文学家把这条带称为主星序带, 带上的恒星称为主序星。主星序带表示,大多数恒星,表面温度高,光度也大;表面温度降低, 则光度随之减小。

在郝罗图的右上方,有一个恒星比较密集的分区, 这里的星光度很大,但表面温度却不高,呈红色,这表明它们的体积十分巨大,所以叫红巨星。郝罗图中巨星的上面是超巨星。郝罗图的左下方也有一个星比较密集的分区,这里的星表面温度很高,呈蓝白色,光度却很小,这表明它们的体积很小,白矮星。

赫罗图可显示恒星的演化过程,形成恒星的 分子云 是位于图中极右的区域,但随着分子云开始收缩,其温度开始上升,会慢慢移向主序带。恒星临终时会离开主序带,恒星会往右上方移动,这里是 红巨星 及 红超巨星 的区域,都是表面温度低而光度高的恒星。经过红巨星但未发生 超新星爆炸 的恒星会越过主序带移向左下方,这里是表面温度高而光度低的区域,是 白矮星 的所在区域,接着会因为能量的损失,渐渐变暗成为黑矮星。

赫罗图在恒星演化的研究当中十分重要。由于恒星内部能源的不断消耗,恒星要发生演变,光度和温度都要发生变化,这导致在赫罗图上的位置发生变化。天文学家根据赫罗图描绘了恒星从诞生、成长到衰亡的演化路径,并从理论上给出恒星从诞生到主序星、红巨星、变星、新星(超新星)、致密星(白矮星或中子星或黑洞)的演化机制和模型。这是人类认识恒星世界奥秘的一个重大突破。

赫罗图中的恒星不是平均分布的,而是形成一定的序列的,因为光度和表面温度之间存在着内在的关系:如果压力、不透明度和产能率只是温度、密度和化学成分的函数,那么恒星的结构由它的质量和化学成分决定如果化学成分给定,则每一颗恒星质量便对应着一定的光度和温度值。因而只要在某一质量范围内存在着光度和温度的关系,在赫罗图上就会出现相应的序列。同样质量范围内的恒星,在赫罗图上出现在不同的序列,必然是由化学成分不同引起的而化学成分的不同可以是原始化学成分的不同,也可以是恒星处在不同的演化阶段。因此,赫罗图中的一些序列,可以用来研究恒星的形成和演化。

随着时间的推移,恒星的内部结构逐渐演变,并在它的光度和表面温度(简称温度)上表现出来,这样,恒星在赫罗图上的位置便沿一定路径移动,描出"演化过程"。因此,赫罗图不仅能给各类型恒星以特定的位置,而且能显示出它们各自的演化过程,成为研究恒星必不可少的重要手段之一。

电子星图SkyMap Pro的使用方法 对于出学者来说,在广阔无垠的夜空中辨认星星并不是一件非常容易的事情。因此,我们需要星图的帮助与指导。电脑的普及为我们带来了许多好处,而电子星图正是电脑的使用给天文爱好者们带来的福音之一。 作为一款电子星图类的共享软件,SkyMap Pro已在海内外享誉多时。目前的最新版本是10.0,我们可以免费使用的是演示版,由于10.0和9.0的演示版的限制比较多,因而推荐使用的是SkyMap Pro 8.0,这个版本在本站的星星下载栏目中有提供下载。 那么,应该如何利用电子星图来帮助我们认识星星呢?主要的思路有两条: 一、按图索骥,顺藤摸瓜 这跟我们使用纸质星图的出发点一样。在外出观测前,先将所需要的电子星图用打印机打印出来,变成纸质图星,当然如果你拥有一台笔记本电脑的话,直接扛着出发就行了,用不着做从电子版到纸张版的格式转换。到了观测现场,我们打开被换换格式后的电子星图或者是真正意义上的电子星图,对照着图,在天空中一颗一颗地认星星,一直到东方之既白,哈哈,前提当然是你得有足够的精力与耐心哦:) 二、对号入座,跑得了星星跑不了图 在某个星光灿烂的夜晚,你正在街上徐徐散步,突然心血来潮抬眼望天,不巧的是这时候天空中正有一颗陌生的星星正欢快地闪烁着,这引起了你的好奇心,你想知道这颗星星的身世与来历。怎么办呢?没关系,在电子星图里可以查得到。记好当时的星空背景以及这颗星所在的方位。回家后打开电子星图,调整好时间地点,配合你所记下的实测中的星星的位置(方向,高度,与周围星的位置关系等),好了,你所看见的星星是否就已经呈现在你面前了呢?比起普通的纸制星图来,电子星图的一大特点就是实时实地,而且可以显示出行星。 下面我们以SkyMap Pro8.0的演示版(汉化文件)为例,谈一谈这款软件的使用。先来看一看它的界面,如下图所示: 一、基本操作:工具栏、视图设置、搜索功能 SkyMap Pro的基本操作都是通过工具栏来实现的。如上图所示,这些工具栏分布在星图的四周,呈数个一组的按钮状。实际上可以利用鼠标的拖曳功能将这些工具栏自由地拖放在顺手的地方。如果你发现有一组按钮突然消失而找不到了的话,没关系,你可以通过菜单上的“看查——工具栏”选择将它们一一调用出来。 最常用的一组按钮是“视图设置”:。其中字母按钮表示星图所显示的方向:N表示北,E表示东,S表示南,W表示西,Z表示天顶。按可以选择观测地点,按可以选择观测时间,则是查看按钮,可以选择星图中心和大小。大小是指星图所显示的区域范围。这一操作同样可以通过鼠标来实现,用拖曳功能拖出小窗口再松手,则可以将视图放大显示小窗口中的天空区域。将鼠标悬停在某点处单击右键则可以选择以该点为视图中心。 SkyMap Pro还为使用者提供了方便的搜索功能。可以搜索行星、星座、恒星等。在菜单的“搜索”子菜单中可以实现该功能。 二、辅助坐标的选择 一般观测时,我们主要采用地平坐标系和赤道坐标系来对星星定位。关于赤道坐标系和地平坐标系可以参看本站的“赤道坐标系”和“地平坐标系”两文。此外,SkyMap还为我们提供了黄道栅格和银河栅格。在按钮组中,按A可调整地平坐标系的显示,按R可调整赤道坐标系的显示;按E可调整黄道坐标系的显示;按G可调整银河坐标系的显示。这些坐标系有助于我们对把握对星星的定位。在初识星空时,地平坐标系对我们对当时当地星空的认识与熟悉有很大的帮助。 三、认识恒星与星座。 在SkyMap Pro的默认设置中,以带水平线的圆标记双星,以空心圆标记变星。并且当时间设置为入夜以后,或者当区域范围较小,星图放大较多时,星星的颜色可在星图上大致显示出来。在星图中,星星主要有四种色彩:红、黄、白、蓝。将鼠标悬停在某颗星上,单击鼠标右键,可以查看星星的属性。其中有一项是B-V颜色指数,数值越大星星的实际颜色越红,越小则越蓝。属性中比较重要的还有恒星的视星等。注意到以上几项内容可以帮助我们在观测时做得更加专业与细致。 在天体按钮组中,按可以调整星座的显示。 Names选项设置是否显示星座名称。Figures选项设置是否显示星座形状。Boudaries选项设置是否显示星座区域。 四、行星的观测。 如果要观测行星,就先在搜索中找到该行星,然后在星图中找到它的位置,看它在哪个星座,还可查属性看亮度是多少等等。如果要看该行星在数天内的移动情况,可以将鼠标悬停其上,单击右键选择“X星的轨道”,填好间隔天数与计算位置个数,确定以后软件会自动算出行星的运行轨迹并在星图上显示出来。 以某行星为中心,将星图不断放大,到足够的程度软件甚至可以显示出行星上的一些细节。比如金星与水星的盈亏情况,土星木星的卫星位置等。 以上几项操作是SkyMap Pro中比较常用,并且星夜认为比较适合于初学者使用的。SkyMap Pro还有许多其他的功能,有些是正式版本里才提供的,有些则可以在演示版中使用,大家可以在具体的使用中自己去摸索和体会。最后顺便说一下SkyMap Pro的星图数据是可以更新的,需要更详细更精确的星图可以到其网页上寻找所需的数据。但对于初学者来说,即使是演示版所提供的星图,我想应该也是足够的了。大家可以先把基础打得扎实,再求进一步的提高