q1, R2.15.3中runif的原型是runif(n, min = 0, max = 1),对应生成多少个随机数,均匀分布中的a和b;
关于两个max,第一个max=....是指函数runif中对应的max参数,其值是c(length(p) -0.5, max(p));第二个max是一个运算,其优先级高于runif,在runif之前就完成运算。故不矛盾。
总结一下,这两个max一个是参数名称,一个是函数运算。同理,多个max运算也不矛盾,max分别运算,结果分别保存,然后传递给runif函数。
break的总用是跳出最近的循环,也就是如果满足if的条件就跳出repeat;
q2,我的思路是,不保证对,仅做参考。
如果打41局,一定能分出胜负,如果仅考虑先得21分者胜的话;
二项分布x<-rbinom(41, size = 1, prob = 0.5) 模拟了两个人的比赛情况,0表示a输,1表示a赢。
函数func计算谁先得到21分;由于x中只有0,1,故可在21:41的长度区间内,依次用sum和长度判断1先到凑够21个还是0先凑够21个
func <- function(x){for (i in 21:length(x)){
if (sum(x[1:i]) >= 21) return ('a')
if (i - sum(x[1:i]) >= 21) return('b')
}
}
func(x)
funx(x) 计算出谁赢;
在这个基础上,通过重复多次上述过程,代码中500次,可以算出a赢的比例,即概率;
v <- vector(length=500)for (i in 1:500){
x<-rbinom(41, size = 1, prob=0.5)
v[i] <- func(x)
}
length(v[v=='a'])/500
随着重复次数的增加,这个概率最终趋近于0.5,也就是rbinom中的概率;
p.s. lz的题都不错,能否推荐下?
我自从学完R之后,一直也没怎么系统做题,做了几天题也挺有收获,在此也感谢下lz;
第一阶段:初识数据分析这个阶段是你学习数据分析的第一个月。核心的三本书就是:统计学、R IN ACTION、深入浅出数据分析。
第一星期:好好的阅读一下统计学这本教材。按照每天3个小时的时间,一个星期你至少能看完8章。踏踏实实的看完,课后习题不需要做,重点放在理解公式推导以及专业名字定义的理解上。
第二星期:有了统计学基础,R语言学习起来就不会太费劲。《R in action》 是公认的R语言经典教材。跟着书上的代码仔细的敲一笔遍,你不需要全部看完这本书,只需要学会前8章左右就差不多了。 学完后你会对统计学有一个更深的认识~
第三个星期:《深入浅出数据分析》这本书很大头,不是因为它内容多,而是因为它废话和插图多。很有意思的一本入门级别的教材,花一个星期好好的读一下,能学多少是多少。
第四个星期:查漏补缺。经过前三个星期的学习,你一定有不少的疑惑或者遗忘了某些知识。不要着急,这个星期就是用来好好回顾一下你本月所学的东西,不懂的定义再看看,不会的代码再敲敲,不懂的知识再google一下~
对了,再送你一个视频呗。讲的是如何利用EXCEL进行完整的数据分析流程:
初识数据分析-720P.zip_高速下载
第二阶段:升级你的技能
第一个月只是让你对数据分析有一个初步的认识,你已经可以秒杀20%左右的人了(我瞎猜的)
这个月就是要升级你的技能,在对已有的知识基础上做一个升华。本月任务较重,小伙伴需要动脑和动手的地方比较多。
第
一个星期:《数据挖掘导论》这本书绝对是一本良心教材。拿到手从第一章开始阅读,在一个星期之内能看多少就看多少。但是要尽量多看点,因为此书你可能要看
一辈子的~~不要做笔记,因为你做的笔记大部分时间都是在抄书,没啥意思的。数据挖掘可不是记忆的东西,是要靠理解的!
第二个星期:来来
来,python大法学起来。正所谓 life is short, I use python. 不要问那种烂大街的问题:R和PYTHON哪个好。
等你都学了,你就再也不会问这个问题了。
《利用PYTHON进行数据分析》是你学习PYTHON的不二之选,对着书,着重学习numpy,pandas两个包!
对了,也要学会怎么安装PYTHON这也是技术活!
第三个星期:为毛感觉前两个星期啥也没学到?乱七八糟的!
没事,这是正常的,难道你指望两个星期就能学完数据挖掘吗?
在此,你已经有了一定的Python,统计学,数据挖掘基础知识,那么是不是能够讲它们组合起来用一用呢? scikit-learn,你值得拥有。
看不懂没关系,先去看看它们的文档以及那些莫名的专业词语。 然后接着学你的数据挖掘和PYTHON。
第四个星期:重复第三个星期的内容。对了,你是不是应该对R再做点事情呢?
第三阶段:准备一个小小的毕业吧
前两个月会过的很痛苦,很累,很烦躁!不用担心,你终于来到了第三个月,这个月与前两个月完全不一样,因为这个月会更加更加的痛苦!!
在
这个月,我们需要开始学习sql的相关知识。SQL绝对是数据分析师的必备技能,没有之一。作为这个星球上一个通用的语言,它的存在使得我们进行数据处理
时大大的提高了效率。既然SQL学了,那也就学学mysql吧,这是一个存储数据的东西,你说它重不重要呢?
这两个并不难学,稍微花点功夫就能入门了。
本月重点是重复第二个月的工作啊,继续研究统计学、数据挖掘、PYTHON还有那可爱的R语言。怎么研究? 这个还要来问我吗? 书单都在上面了~ 看着书复习就行。 不要忘了那个神技:scikit-learn
对了,如果你想去互联网公司投份简历,记得要把《网页分析》这本书好好的过一遍,相信我,你只要看一遍,就能打败百分之80 的面试官。因为他们压根看不起GA。
你看,三个月入门数据分析师,并不是不可能嘛~~ 我敢说,你这三个月学到的知识已经可以击败一大半的所谓的数据分析师们了~~ Do not ask why, Just do it !!
您好,天池比赛一般使用Python语言,因为Python是一种强大的、易学易用的编程语言,它拥有丰富的第三方库,可以帮助程序员更快更好地完成任务。Python语言拥有简洁的语法,可以让程序员更容易理解代码,并且可以让程序员更快地完成任务。此外,Python语言也可以支持多种编程模型,如面向对象编程、函数式编程等,可以满足不同的编程需求。Python语言还支持多种数据结构,如数组、链表、字典等,可以更好地处理数据。Python语言还支持多种编程框架,如TensorFlow、PyTorch等,可以更好地完成深度学习任务。总之,Python语言是一种强大的、易学易用的编程语言,可以帮助程序员更快更好地完成任务,因此,它是天池比赛的理想语言。