科学劝退 绩点怎么算的( 二 )


“多元”回归分析对应传统常用的单变量“一元”回归分析 。面对复杂性强的问题多元回归能够同时考虑更多自变量与因变量的关系,而合适因素的叠加往往能解释因变量变化的更多细节 。例如,想预测面包价格的波动,光参考面粉的价格不够有效,但是如果再加上鸡蛋牛奶的价格与烹饪师傅的工资,预测模型就能覆盖到由于这些附加因素引起的价格波动 。
在这里,论文作者使用的Logistic回归,是一种适用于离散因变量的回归分析手段 。它适合用于分析医学上的生存-死亡、赛马比赛种的赢-输等等 。在这里,“完成博士学位”和“未完成博士学位”就是离散的因变量 。因为毕业“概率”是一个在0到1之间波动的小数字,所以在这个回归分析模型中,需要将“概率”1对1转化成“胜率”(Odd)胜率是说一件事情成功的机率比上这件事情失败的概率,这个指标的值从0到正无穷,从而帮助衡量自变量的影响,后文中我们评价某个指标的效益,计算的都是指标对胜率的影响大小 。



科学劝退 绩点怎么算的

文章插图
图1:线性回归和逻辑斯蒂回归的区别 | 图片出处:Data Camp
为了分析的有效性,研究人员们分别对全部样本以及依据性别,国别,分组后的数据进行了同样的回归分析以观察组别之间是否存在差异 。四个组分别是美国女性(U.S. female)、美国男性(U.S. male)、仅美国(U.S. only)和全部学生(and all students).
读完博士的概率,与什么有关? 他们的研究结果表明,本科平均成绩(UGPA)和研究生项目质量是所有模型中唯二具有普遍显著性的参数,研究生入学考试定量部分仅在四组中的两个分组具有显著性(全部参数数值以及显著性水平见文章后部附表1) 。感兴趣的读者可以拉到文后去读一读统计结果中的OR值(Odd Ratio),它用来衡量每一单位自变量的变化对博士毕业“胜率(Odd)”的倍数影响,比如在所有结果中OR值比较可观的项——美国女性组中的本科平均成绩的OR值为2.5,就可以解释成GPA每提升一分,这名学生的胜率就要乘以2.5 。
与公众所认为的不同的是,排名越高的博士项目的完成概率反而更高,而不是因为其高难度而降低毕业可能性 。但是在录取之前,研究生项目并不是一个学生携带的确定指标,所以在学生入学前能够普遍预测毕业可能性高低的显著指标只有本科平均成绩 。
一直以来在博士生录取中占比很大的美国研究生入学考试(GRE)在这项研究中确没有表现出与毕业可能性极强的相关性,其中定量分析部分在四个分组中的两个中存在显著性(P < 0.05)而在另外两个模型中不存在 。我们可以从GRE考试所能衡量的和不能衡量的功能出发理解它较低的解释度:一天一次的考试只代表一小部分学生的技能,而不是一个人的综合能力,尤其是考虑到这些考试不是用来衡量研究潜力的 。本科GPA囊括了四年时间内综合能力的评价,因此具备了更高的解释性 。
在各个分组中,仅美国组和美国男性组的统计结果十分相似,这符合直觉,因为仅美国组样本中80%的学生是男性 。
正如我们之前说的,所有指标中除了本科平均成绩(UGPA)、博士项目排名与部分GRE成绩以外的指标都不具有相关性,这也就证明在这个研究的背景下,性别,公民身份,人种都不会影响博士的毕业率 。



科学劝退 绩点怎么算的

文章插图
图2:仅美国(US-Only)组的多元逻辑回结果


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: