如何处理非正态数据r语言

Python016

如何处理非正态数据r语言,第1张

当作正态处理: 凡中度及以下偏度的数据(包括重尾分布),涉及均值比较或回归系数估计的,样本量超过10个,可以当作正态处理。原因是中心极限定理。 如果实验过程是随机化顺序的,这时候这时候对均值的检验(例如使用t检验或F检验)是随机化检验方法的近似,不需要考虑正态性问题。

2.

变换为正态: 当数据严重偏离正态,或者比较的是方差(即与均值无关),这时中心极限定理帮不上忙,就最好通过数据变换转化为正态分布。 变换一般是幂变换。 分为经验法和Box-cox法(过程能力指数CpK计算时还常用Johnson变换)。 经验法就是求数据的2次方,或1/2次方,或1/4次方,或-1次方,或取Ln。看哪一种变换后近似正态。 Box-cox法是原理相同但更精确、更正式的方法。

3.

针对专门分布的方法: 例如针对相应指数族分布使用广义线性模型。

使用R语言进行时间序列(arima,指数平滑)分析 - 拓端研究室TRL...

2022年11月23日您要分析时间序列数据的第一件事就是将其读入R,并绘制时间序列。您可以使用scanR语言实战之时间序列分析

萌弟

生活就像马尔可夫链,决定未来的只有现在,过去的终将埋葬。

来自专栏R语言实战学习

前面的线性回归探讨的是横截面(cross-sectional)数据。在横截面数据集中,我们是在一个给定的时间点测量变量值。与之相反,纵向(longitudinal)数据则是随着时间的变化反复测量变量值。若持续跟踪某一现象,可能会获得很多了解。 对时序数据的研究包括两个基本问题: 对数据的描述 (这段时间内发生了什么)以及预测(接下来将会发生什么) 。我们可能有如下疑问。

Johnson &Johnson股价在这段时间内有变化吗?

数据会受到季度影响吗?股价是不是存在某种固定的季度变化?

我们可以预测未来的股价吗?如果可以的话,准确率有多高?

描述时序数据和预测未来值的方法有很多,而R软件具备很多其他软件都不具备的精细时序分析工具。

将分析的几个时序数据集,这些数据集在R中都可以找到,它们各有特点,适用的模型也各不相同。

本文首先介绍生成、操作时序数据的方法,对它们进行描述并画图,将它们分解成水平、趋势、季节性和随机(误差)等四个不同部分。在此基础上,我们采用不同的统计模型对其进行预测。将要介绍的方法包括基于加权平均的指数模型,以及基于附近数据点和预测误差间关联的自回归积分移动平均(ARIMA)模型。我们还将介绍模型拟合和预测准确性的评价指标。

本章内容:

在 R 中生成时序对象

时序的平滑化和季节性分解

其实英文字母渊源于拉丁字母,拉丁字母渊源于希腊字母,而希腊字母则是由腓尼基字母演变而来的。

A

如同汉字起源于象形,英文字母表中的每个字母一开始都是描摹某种动物或物体形状的图画,而这些图画最后演变成为符号。但这些符号和原先被描摹之实物的形状几无相似之处。谁也不能肯定这些象形字母原先究竟代表什么。我们的解释只能是学者们基于史料作出的有根据的猜测。一般认为希腊字母乃西方所有字母,包括拉丁字母的始祖。其实希腊人的字母又是从腓尼基人那儿借过来的。约在3000年前,在腓尼基字母表中字母A读如aleph,写起来形似字母V,中间再加一横,代表牛头或牛角,以后希腊人将它倒过来写。对于古代腓尼基人来说,牛意味着财富,吃、穿、耕作都少不了它。这也许就是A被列为第一个字母的缘故吧。

B

和字母A一样,字母B也可以追溯到古代腓尼基。在腓尼基字母表中B读作beth,代表房屋,在希伯来语中B也叫 beth,也含房屋之意。字母B原来形似原始社会的两室房屋,小写字母b是后来从大写字母B衍变出来的。在今约旦河西岸有一犹太教、基督教圣地叫 Bethlehem(伯利恒),该词至今还包含着beth这一成分。B在字母表中之所以排在第二位也许是因为对人类的生存来说,住的重要性仅次于衣食。(参见A)

C

字母C在腓尼基人的文字中叫gimel,代表骆驼。它在字母表中的排列顺序和希腊字母Γ(gamma)相同,实际上其字形是从后者演变而来的。C在罗马数字中表示100。(参见A,G)

D

D在古时是描摹拱门或门的形状而成的象形符号,在古代腓尼基语和希伯来语中叫做daleth,是“门”的意思,相当于希腊字母Δ(delta)。(参见A)

E

E是英文里用得最多的字母。在腓尼基语和希伯来语中E是代表窗的象形符号,叫做he,相当于希腊字母Ε(epsilon)。(参见A)

F

F为英文字母表中的第六个字母,源自腓尼基语的第六个象形字母,该字母形似今日之英文字母Y,代表木栓或木钉(peg),在腓尼基语和希伯来语的名称为waw。中世纪重罪犯(felon)的左颊常被打上F的印记,以示惩戒。(参见A,V)

G

在古代腓尼基语及希伯来语的字母表里,G是描摹骆驼的头和颈之轮廓的象形字母,其名称为gimel。以后希腊人借用了该符号,作Γ(gamma)。其实字母 G与C系源于同一腓尼基字母。原拉丁字母表里本无字母G,含g音和含k音的词都以字母C来表示。公元三世纪以后,古罗马人根据C创造了G,自此C表示k 音,G表示g音。(参见A,C)

H

像其它字母一样,H也可以通过拉丁字母和希腊语的字母表,一直追溯到腓尼基语字母表。在腓尼基语中,和H相应的字母有两条横杠,代表篱笆或栅栏,字母名称叫heth或cheth。(参见A)

I

英文的第九个字母I源自腓尼基语中叫做yod / yodh的象形字母,该字母被认为代表人的手指。最初小写字母i并不带点,i上面的点是11世纪以后抄写员为区分双i连写(如filii)与字母u才开始加上去的。此外,在19世纪以前i和j的书写或印刷形式是可互换的,词典也不将它们作为两个不同的字母来对待。如在Samuel Johnson(1709-1784)所编的《英文词典》中,iambic排在jamb和jangle这两个词的中间。英文的I相当于希腊语的Ι (iota)。

J

字母J是后莎士比亚时代(post-Shakespearean times),约在1630年产生的,和V并称为英文字母表中最年轻的字母。英国国王詹姆斯一世于1611年颁行的《圣经》钦定英译本中就没有J或j字母。正如G是基于C形成的,J是由I衍生而来,即在I上加一尾巴构成。然而,直至19世纪,I、J的书写或印刷形式一直可以互换,并未完全分家。(参见 A,I)

K

字母K的根源也可追溯到古代腓尼基语。在腓尼基语字母表里,K乃象形符号,代表人的手。希伯来语把它叫做 kaph,即“手(掌)”之意。希腊语借用后作Κ(kappa)。古罗马时期,犯诽谤罪者的前额被打上K之印记,K代表kalumnia,即相当于英文 calumny(诽谤)。(参见A)

L

在腓尼基和希伯来字母表中,L叫lamed / lamedh,是表示刺棒(oxgoad)或鞭子的象形符号。希腊语中的相应字母是∧(lambda)。(参见A)

M

如同别的字母,M也可一直追溯到古腓尼基语。腓尼基人勇于探险,以海上贸易著称,航行曾远至西班牙海岸。M在腓尼基字母表里是表示海浪形状的象形符号。希伯来语把它叫做mem,即“水”之意。希腊语的相应字母为Μ(mu)。在中世纪凡犯杀人罪(manslaughter)者左拇指上往往被烙以M之印记。M在罗马数字中表示1000(拉丁语作mille)。(参见A)

N

字母N在埃及象形文字里呈波浪形,在腓尼基语中叫做nun,意为“鱼”,而希腊语的相应字母则为Ν(nu)。(参见A,M)

O

很多语言都有形似O的字母,而且都代表人的眼睛。在一些古老的字母表里有的O当中还加了个点,表示瞳孔。在腓尼基语中O叫cayin,意为“眼睛”,在古英文里O叫oedel,意为“家”。(参见A)

P

英文字母表的第十六个字母P,古代腓尼基人和希伯莱人称为pe,意为“嘴”。希腊语的相应字母为∏(pi)。16世纪有一位名叫Placentius的多明我会修道士(Dominican friar)写了一首题为Pugna Porcorum,由253个六音步诗行组成的诗,诗中每个词的首字母均为p,这恐怕是亘古及今绝无仅有的。(参见A)

Q

字母Q系由腓尼基语和希伯来语的第十九个象形字母演变而来的。Q的形状有点像垂着尾巴的猴子。无怪乎腓尼基语把该字母叫做qoph,意思就是“猴子”。在英文中Q后面几乎总跟着U,而且绝少出现在词尾,除非是外来语。(参见A)

R

英文字母表的第十八个字母R,由腓尼基语和希伯来语的第二十个象形字母演变而来,腓尼基人称之为resh,意为“头”。从古罗马时代起,R一直被称作 dog’s letter或snarling letter,因为R的发音颇似狗的嗥叫声r-r-r-r或gr-r-r-r。英国剧作家、诗人Ben Johnson(1572-1637)1636年在其所著《外国人用英文文法》(English Grammar Made for the Benefit of All Strangers)一书中这样写道:“R is the dog’s letter, and hurrieth in the soundthe tongue striking the inner palate, with a trembling about the teeth.”在莎翁的《罗密欧与朱丽叶》一剧中,朱丽叶的保姆和罗密欧谈及他的姓时说,Romeo和rosemary(迷迭香),一种常与婚礼相联系的花,两者都以字母R开头,并称R为dog-name。(参见A)

S

在腓尼基语和希伯来语中,S叫shin / sin,意为“牙齿”,字母形状颇像今天的W,而现在的字形则是在它进入拉丁语之后逐渐演变成的。希腊语的相应字母为∑(sigma)。(参见A)

T

今日的字母T由腓尼基语的象形字母变化而来。早先的字形恰似如今的字母X,叫做taw,意为“记号”(mark)。基于此符号形成的希腊语相应字母为Τ(tau)。(参见A)

U

字母U由字母V派生而来。在19世纪以前的数百年间,这两个字母就如I和J,一直可以换用,在英文辞书上一直不加区分。例如在16和17世纪出版的图书上, upon常拼作vpon,而have常拼作haue。甚至到了1847年,伦敦Henry Washbourne公司出版的《英文词典》(A Dictionary of the English Language)仍在沿用这一做法。(参见A,V)

V

V乃英文字母表中最年轻的两个字母之一(另一个为J),它于莎士比亚时代以后,约1630年出现。但V同时又是U,W,Y等三个字母的祖先,甚至连F也可以说是从V 派生出来的。V源于约公元前1000年腓尼基字母表中的第六个象形字母,该字母酷似今日之英文字母Y,叫做waw,意为“木栓”或“木钉”。公元前900 年以后,希腊人借用了该字母,并由此衍生出两个字母,一个后来演变为英文字母F,另一个则演变为V和Y。在19世纪以前,V和U这两个字母原来是不分的,可以互换。V在罗马字母里表示5。(参加A,F,U,W,Y)

W

和U,Y一样,W亦由V派生而来,其实W是双V连写而成,本应读作double V。W之所以读作double U是因为在19世纪以前的几个世纪U与V一直不分,可以互换。V既是V又是U的符号,即使发如U也常写成V,如upon往往拼作vpon。法语的字母W就读如double V。(参见A,U,W)

X

英文字母表的第二十四个字母X,相当于希腊字母表的第二十二个字母Χ (chi),其实前者借自后者,后者则源于腓尼基语中一个代表“鱼”,读如samekh的象形字母。X在罗马数字中代表10;在代数学和数学中X通常被用以表示未知数。当代数学从阿拉伯传入欧洲时,阿拉伯语中表示“未知数”的shei一词被移译为xei,于是首字母X就成了未知数的常用代号。关于字母X的由来,还有这样一种说法:X原为表示接吻的象形符号,写如χ,看起来确有点像两张嘴在亲吻。而这种解释可能出自民俗语源。(参见A)

Y

Y可以说是从V派生而来,究其根源则可以追溯到希腊语中被称为毕达哥拉斯字母(the letter of Pythagoras)的Υ(upsilon)。在代数学中,Y常被用以表示第二个未知数。(参见A,V)

Z

Z 在英国英文中读如zed,在美国英文中则读如zee,但在古英文中则读作izzard。Z源自希腊语的第六个字母Ζ(zeta),而希腊语的Ζ又是借自腓尼基语。有人也许会问,Ζ在希腊语中是第六个字母,为什么到了英文却是第二十六个,也就是最后一个字母。其实原先的情况并非一直如此。罗马人从希腊语借用 Ζ时,认为Z不会有什么用处,就把Z去掉了。以后又发现Z还是有用的,但此时Z已丧失原先的地位,因此只好屈居末位了。其实Z在英文中也被许多作家认为是无用的。莎士比亚曾经这样写道:“Thou whoreson Zed! Thou unnecessary letter!”(King Lear,II,ii)