R语言-信度与效度

2023-03-05 03:28:01Python015

R语言-信度与效度,第1张

cronbach’s alpha系数，一般翻译成克隆巴赫alpha系数，效度用探索性因子分析(KMO和Bartlett)。

alpha等于测验题目数/(测验题目数－1) 乘 {1 - 各被试在该题目上的方差的和 / 所有被试总分的方差 }

K即第一个公式的n，代表题目数量。

小sigma方即第一个公式的S方，代表方差。

然后直接调用就可以。

参考文献：

道客巴巴

qq_43157351. R语言与克朗巴哈alpha系数

用R语言实现Cronbach 值的计算

λi表示题目i在潜变量ξ上的负荷, δi是误差项, 误差之间不相关。整个测验分数X=x1+x2+…xp的合成信度如上图 (叶宝娟, 温忠麟, 2011Brown, 2006Yang&Green, 2010)

假设一个单维测验由p个题目组成, 测量了一个因子F, 测验施测后, p个题目的标准化变量为 (i=1, 2, ..., p) ，可以按照以下方式计算。

其中, εi是只和i有关的特殊因子 (也称为误差项) , λi是第i个变量i在因子F上的负荷。假设题目误差不相关, 如果整份测验的分数相加有意义, 则单维测验整份测验X=1+2+...+p的合成信度为：

其中, θi为i的误差方差, (2) 式也可计算多维测验单个维度的合成信度。如果用固定方差法指定因子测量单位, 即var (F) =1, 则上式变为:

因为X i 是标准化变量, 所以Σ θ=p-Σ λ2则 (3) 式变为:

上图这个表达式更易懂一些，也更容易计算。

λ为因子载荷量，p为题目个数。

计算出因子载荷量之后可以通过函数计算ρ

参考文献：

杨强叶宝娟温忠麟(2014). 用SPSS软件计算单维测验的合成信度. 中国临床心理学杂志: 22(03), 496-498

温忠麟(2011). 单维测验合成信度三种区间估计的比较.

一、内在效度(content related validity)：研究者的发现与事实相符合的程度，即研究结果是不是真的在测量事实的真相的能力。

二、内容效度的评估方法：1.专家判断法2.统计分析法(评分者信度\复本信度\折半信度\再测法)3.经验推测法 (实验检验)

提高内部效度的方法：

1．三角检定法：多元的搜集资料方式，包括不同的资料来源(报章、官方文件、会议记录)，访谈不同人员(如教师、行政人员、学者专家)，及采用不同资料的搜集方法(如访谈、观察、非正式讨论)等，来相互验证资料与实施的相符程度。

2．研究对象的核查：和被研究者一起讨论定稿，以确定自己记录的是其所叙的。

3．持续的观察

来自：qiuyaofeng2012. 信度和效度经典例子_第四节个案研究的效度与信度. CSDN

一、构想效度：测验能够测量到理论上的构想或特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构想，其解释的程度如何。

二、构想效度的估计方法：1. 对测验本身的分析（用内容效度来验证构想效度）；2. 测验间的相互比较：相容效度（与已成熟的相同测验间的比较）、区分效度（与近似或应区分测验间的比较）、因素分析法；3. 效标效度的研究证明；4. 实验法和观察法证实

衡量测验有效性的参照标准，指的是可以直接而且独立测量的我们感兴趣的行为。

又称 实证效度 ，反映的是测验对个体的预测在某种情境下的有效性程度(所测情况与实际情况之间的相关)。

根据效标资料是否与测验分数同时获得，又可分为 同时效度 (实际士气高和士气低的人在士气测验中的得分一致性。)和 预测效度 两类。

1.相关法：效度系数、效标效度常用方法。以皮尔逊积差相关系数来表示，反映测验分数与效标测量之间的相关程度。

当测验成绩是连续变量，而效标资料是二分变量时，计算效度系数可用点二列相关公式或二列相关公式；

当测验分数为连续变量，效标资料为等级评定时，可用贾斯朋多系列相关公式计算。

2.区分法：检验 测验分数 能否有效地区分 由效标所定义的团体 。

进行t检验，若差异显著，说明该测验能够有效地区分由效标定义的不同团体(如抑郁 测验得分 的高低可以区分出 真正的 高抑郁组和 真正的 低抑郁组)，

重叠百分比可以通过计算每一组内得分超过（或低于）另一组平均数的人数百分比得出；

另外，还可以计算两组分布的共同区的百分比。重叠量越大，说明两组分数差异越小，即测验的效度越差。

3.命中率法：是当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法。命中率的计算有两种方法，一是计算总命中率，另一种是计算正命中率。

4、预期表法：是一种双向表格，预测分数排在表的左边，效标排在表的顶端。从左下至右上对角线上各百分数字越大，而其它的百分数字越小，表示测验的效标效度越高；反之，数字越分散，则效度越低。

命中率法和预期表法相似。详细可参照戴海琦，张锋<心理与教育测量>第五章：测量效度

一般在研究中用到的效度指标是结构效度，测量题与测量变量之间的对应关系。可以使用探索性因素分析(exploratory factor analysis，EFA)和验证性因子分析(comfirmatory factor analysis，CFA)

计算协方差矩阵/相关系数矩阵。可以利用cov2cor()将协方差转化为相关系数矩阵，也可利用cor2cov()转化回来

· KMO值：如果此值高于0.8，则说明效度高；如果此值介于0.7 0.8之间，则说明效度较好；如果此值介于0.6 0.7，则说明效度可接受，如果此值小于0.6，说明效度不佳

· 巴特球形检验：其对应巴特球形值，对应P值一定需要小于0.05，这样才能说明通过巴特球形检验

· 特征根：此值是判断因子（维度）个数的标准的信息量，由于已经设置好因子（维度）个数，因而此值意义较小可忽略；

· 方差解释率值：代表各维度可解释整体量表的信息量；

· 累积方差解释率值：所有维度可解释整体量表的信息量；

· 因子载荷系数值：分析项与维度之间的相关关系情况；此值非常非常重要，可用于判断分析项与维度的对应关系情况，下述会有说明；

· 共同度值：分析项可以被提取出的信息量情况，比如为0.617，可以理解为该项有61.7%的信息可被最终提取出来。

任何一个行业或一份工作，都不像我们看上去的那个样子。高校里的学生生活在象牙塔中，不仅对外部世界了解很少，对行业或岗位的认知还存在误解。即便是老师，也基本是毕业后便在学校里工作，对于行业的了解并不比学生多。

但是学生在进行择业时所谓的“好”的、“坏”的主观认识常常都不符合客观情况。一方面，以就业为最终目标的在校生应更多地关注行业和职业信息，了解就业市场动向，尤其对自己比较中意的行业要根据岗位要求早做准备；另一方面，与业界人士交流。但这种交流依然需要你自己有辨别的能力，哪些内容是行业的客观情况，哪些是对方的主观评价。每个人的职业价值观不同，对同一份工作的评价可以差异很大。

信用评级机构是金融机构中相对不那么受到学生关注的一个行业，自然有很大一部分原因是因为薪酬。正因为它不被人太多关注，反而引起了我的好奇，我相信不被关注的事物背后，一定有不为人知的一面，所以就来看看你所不了解的信用评级机构吧。

被访者背景：黄女士

前职业：中国建设银行支行

现职业：某知名信用评级机构分公司

职务：评估总监

所学专业：金融学学士国际商务硕士

工作时长：2014-2018，4年

2012年毕业后就进入中国建设银行，从坐柜开始，后来进入后台负责公积金业务。对很多人来说，这份工作还不错，因为没有业绩上的压力，而且工作内容也相对比较简单轻松，但我当时觉得这样的工作没什么意义，学不到太多东西，如果我不主动离开，可能一辈子就看到头了，所以在2014年就辞职了，打算考博士，边复习边找工作。

这个时候投了一些资产管理公司，也投了银行和信用评级机构，因为当时打算攻读博士，所以希望能够找到一个有利于自我成长的工作环境，信用评级机构虽然人员很少，但是都是一些名校的学生，如香港中文、对外经贸等等，而且评级机构与其他金融机构不同的是，你可以了解很多金融机构的全貌，可以接触到银行、企业、券商以及政府，这是我以前在银行工作所达不到的。所以我选择了信用评级机构。

收入确实不高，如果你有各种贷款的压力，可能无法接受这样一份工作，我现在作为部门负责人，也要招聘分析师，他们基本都是已有车、有房的年轻人。公司有不同的部门，每个部门的收入构成不太一样，市场部的收入是与绩效挂钩的，分析师的工资相对比较固定，能满足基本的生活开支。

虽然收入不高，但是有很好的个人成长的机会，简单地说，在我们公司工作3年左右的时间，个人也比较努力的话，完全可以胜任券商等金融机构的工作，我们一年要对几十家企业进行评估，每评估一家，就相当于进行了全面的调查了解，这是很宝贵的经验。所以身边的同事其实也是把这份工作作为一个发展的平台。

比如2年前来我们部门的一位90后的男生，其实从当时应届毕业生的素质来看，他都是很优秀的了，即便这样，当时他进入券商或者进入某公司的总部还是比较难的。最后，他留在我们公司工作，一边攻读硕士学位，一边积累工作经验，现在他硕士即将毕业了，也被调入总公司开始工作。当然，这和他本人非常清晰的职业规划是分不开的。

另外，就是能够接受短时间内的收入不高，也有很多学生一听到薪酬待遇就被吓跑了。我们希望每个人都能在公司找到自己所寻求的东西，如果没有，就不要留下来了。否则也是浪费个人和公司的时间和成本。

其他的部门我不敢保证，但是评估部门是这样的，因为分析师的工作对专业知识的要求很高，所以如果你愿意自我学习或者进修，在完成本职工作的情况下，公司是鼓励的。

我们这个团队也会给自己制定学习计划，比如我们今年就计划大家一起学习R语言，所以同事之间是一种互帮互助的良性关系，即便有些同事离职了，我们也会保持很好的关系，而且大家都发展的越来越好。

写作能力。在进行招聘的时候，我们会先安排一个面试，面试没有问题后，会安排一个笔试，就是撰写一个分析报告，给一个星期的准备时间，这要求应聘者有学术规范的文笔，决不能口语化，一定要有逻辑性和财务分析能力。所以写作能力不高，笔试这一关就很难过。

另外，每年要写几十份的分析报告，虽然每个机构的调研我们都是一个团队在做，但是每一次都要有一个人来主要负责撰写分析报告，其他人负责审核，我们要审核很多次才会最终定稿。如果出现明显的错误，这个责任也是很重大的。

每年都有同事跳槽到券商投行部、国企和银行的风险控制部门，因为这些部门对于员工风险管控相关的工作经验十分看重，且此类人才缺口较大；还有一些同事考上了公务员，例如银监局、人民银行等部门，因为他们不仅在信用评级机构积累了丰富的案例，在规范性文章的写作方面也具有过硬的能力，而这些能力是可以迁移的。当然了，能力有了，就希望有更高的收入了。

在项目期间，我们要去企业或者机构进行调研，对企业的方方面面都要了解，比如总体的策略方针，管理层素质，生产和销售状况，财务状况，未来的投资取向，资金流向等；对企业的每个部门要单独走访，为了保证信息的客观性我们也要进行生产现场的调查工作，以实现信息的交叉验证，最终对企业的经营风险和信用风险做出客观的评价，这种评价是综合性的。按照规定，一个企业的评估必须在15个工作日内完成，但是可以多个项目同时进行。在做了二三十个项目后，就会比较轻松了。

分支机构就三个部门左右，综合财务部门、市场部、评级部。综合财务部门人员相对比较固定；市场部要求有一定的资源和金融行业从业经验，市场部男性较多；评级部就都是分析师。总部层面可能会更复杂一些。

国家没有统一的认定，公司内部会有评价标准，具体分为助理分析师、中级分析师和高级分析师，这些评估标准主要按照专业能力、项目经验以及获得的资质来评定。另外，有些评级机构有资本市场评估的资格，进行资本市场评估的分析师需要在相关部门（例如，银行间市场交易商协会）备案。

本科及以上学历，经济学、管理学相关专业，懂得基本的财务知识。如果通过了CPA考试则更有优势。

自我学习的能力，虽然都是撰写分析报告，但是从每个项目中可以学习到不同的东西，自我学习能力就决定了你能否快速找到不同项目中企业的不同，从而更快地找到评估的重点，在行业分析方面，能够快速地进行思维以及评估方法的转换，同时注重总结，否则就不会有太大的提高。

还有就是刚才提到的写作能力和沟通能力。写作能力的提高可以多读一些分析报告，看别人是如何使用规范性语言的；虽然分析师要会写，但是去企业调研的时候，需要和企业负责人进行访谈，而对高管的访谈是项目调研很重要的内容，所以沟通能力也很重要。

相对比较自由的氛围吧，在这个公司工作期间，组建了自己的家庭，有了自己的小孩儿，而且现在还在攻读博士学位。

行业的发展吧，在我进入这个行业之前，我以为信用评级行业会快速地发展起来，但是我们国家的这个行业政策依赖性太强了，没有明确的概念和规划，因此这个行业未来所起到的作用也不是很明确。当然，员工的流动性就比较大，所以如果你入职5年，公司都会给你颁发功勋奖。

我觉得这份工作适合那些目前对工资没有太高要求，但是对个人成长的渴望比较多的学生，比如你的目标是想进入券商工作，但是你现在的能力和资源是满足不了的，那么可以先积累自己的实力，信用评级机构就是很好的平台，可以培养出相关的能力。

以上就是此次职业访谈的所有内容，如果你还有对保险行业或审计岗位感兴趣的问题，欢迎后台留言，我会尽量帮忙解答。

（以上内容已获得被访谈者本人的同意发布）

最后，我必须提醒的是，职业访谈所针对的是即将进入该行业的绝大多数人想要了解的内容所进行的访谈，但对于个别人，不具备太大的参考价值，金融机构多数为结果导向、注重资源整合，因此如果你拥有很好的资源或具备整合资源的能力，那么你在一家金融机构中的成长和发展路径和别人可以不一样的，我不是说你就不用努力了，你同样需要思考你未来的发展方向，当然对自己也应该有更高的要求。

一般地， TOPSIS综合评价法主要包含两个步骤：计算权重和计算相对接近度。如需详细了解 TOPSIS综合评价法的原理和方法，请自行百度，网上有许多非常详尽的原理说明和案例讲解。

根据熵权法确定各个指标的权重；计算各指标信息熵，指标的信息熵越小，则该指标表达信息的不确定性小，在综合评价中对决策的帮助更大，即应该有较大的权重。熵权法是一种客观的赋予权重的方法，它通过各个指标所提供的信息不确定性来确定各指标的权重

根据权重加权规范化指标属性矩阵后，确定正理想方案Amax和负理想方案 Amin，计算各备选方案与Amax 、Amin的距离，以评估与正负理想方案的接近程度，根据相对接近度确定优先次序。其中计算距离一般使用欧式距离。

按照惯例，导入需要使用的包 data.table 、 plyr 。然后载入使用的数据，我们简单看一下案例数据情况。

其中的字段target即为目标字段，我们需要对其含有的8个方案（A~H）进行综合评价排序，选择其中的最优方案。该数据集中的指标均为正向指标。正向指标表示指标的数值越高越好，负向指标则表示指标的数值越低越好，这决定了该指标在进行权重计算时的处理方式。

计算权重的第一步是计算各个指标的熵值，由于我们用到的指标均是正向指标，所以选择自定义函数 entropy_positive 即可。如果指标既存在正向指标又存在负向指标，则可分开进行计算。自定义函数情况如下：

调用函数并完成权重的计算，x1~x8的权重依次为：11.10%、6.61%、28.19%、7.08%、11.88%、8.11%、11.94%、15.09%，计算过程如下：

在将指标向量规范化后，利用熵值法得到的权重计算得到加权标准化矩阵，然后提取正理想方案和负理想方案并计算出各个方案距离正负理想方案的距离，最终根据计算得到距离比值进行排序。具体计算过程如下：

至此，我们就完成了用 TOPSIS综合评价法进行多对象多指标的最优对象选择，输出的结果如下，显然在这八个方案中，方案A为最优方案。

测验指标工作权重因子

# 上一篇：js电话号码验证的正则表达式？

# 下一篇：怎样修理电脑显示器