基于多元线性回归的大学英语四级成绩分析
为了帮助大学生做好英语四级备考准备,提高考试通过率。文章采集了某大学土建学院14级大学生以往成绩,包括高考英语成绩、分班英语成绩、期末英语成绩以及平时英语成绩。剔除了相关性不大的平时英语成绩,利用SPSS软件建立了预测四级成绩多元线性回归数学模型,采用该方法的成绩预测值与实际值符合较好。该方法可以用来对四级成绩预测,具有一定的实用性。
标签:多元线性回归;英语四级;相关性;SPSS
Abstract: In order to help college students prepare for CET-4 and improve the passing rate, this paper collects the past scores ofstudents of Grade 2014 in a university civil engineering college, including the scores of college entrance examination grades, class-division test grades, final English exam grades and regular English grades. The multivariate linear regression model was established using SPSS software, and the result predicted by this method was in good agreement with the actual value. This method can be used to predict the results of CET-4, and it has certain practicability.
Keywords: multivariate linear regression; CET-4; correlation; SPSS
1 概述
大学英语四级考试(CET-4),是由国家教育部高等教育司主持的全国性教学考试。在应届毕业生求职的硬条件里,英语四级是相当重要的一项,许多企业将其当作招聘的硬性门槛,目前各大高校也愈发重视学生四级过级情况。如何才能顺利通过大学英语四级呢?哪些因素与英语四级过级率有着千丝万缕的联系呢?因此,本文以桂林理工大学土木与建筑工程学院某一年在校大学生高考英语成绩、英语平時成绩等数据为基础,来分析各因素与CET-4的相关性,并建立CET-4成绩预测的数学模型,来进行科学的预测。通过模型分析,让学生更清楚地了解自己的学习状况,有利于学生的学习状态的调整,并能广泛调动学生的学习积极性。这对于提高学生自身素质和竞争力,提升就业质量,促进校园内热爱学习的良好风气的形成有一定的理论意义和实用价值。
2 多元线性回归
利用数学工具解决实际问题的重要手段之一便是数学建模,数学建模的方法多种多样,多
元线性回归是分析多因素模型中常用的一种,该方法较为简单方便,其预测效果可通过回归拟合程度与线性相关程度体现。但在回归分析中,如何从众多的因素中选取合适的影响因子,对模型的分析结果也有一定影响。
2.1 多元线性回归模型的建立
多元线性回归分析预测方法是指通过两个或两个以上自变量和因变量的相关分析建立预测模型。当自变量和因变量之间存在线性关系时,称为多元线性回归分析。
多元线性回归模型是解决一个变量往往受到多个变量的影响,并且自变量与因变量之间为线性关系的实际问题。设y为应变量,x1,x2,x3…xk为自变量,多元线性回归方程为:
式中,b0为常数项,b1,b2,…bk分别为x1,x2,x3…xk的自变量偏回归系数。
利用多元线性回归模型需满足下列条件:
自变量与因变量呈现密切的线性相关,且自变量对因变量有显著影响回归模型包含的自变量之间有一定的互斥性;所要估计的回归系数的个数不能超过样本容量。
注册会计师可以考几年?
2.2 模型的求解
目前列出四个与英语成绩相关的主要指标:高考英语成绩、分级成绩、平时成绩以及期末卷面成绩,利用Excel画出该四个影响因素与英语四级考试成绩的散点分布图,如图1~图4所示。
由图1看出,高考英语成绩与英语四级成绩基本成线性关系,关系点也基本分布在线性关系曲线附近,由于存在其它因素的影响,有些关系点离线性关系曲线较远,但是基本呈线性关系,说明高考英语成绩可以作为影响英语四级成绩的一个因素。
由图2可以看出,分班成绩是同学们刚刚步入大学考的英语成绩,是评价同学们过完暑假后的英语水平。分班成绩与英语四级考试成绩的线性关系比高考成绩与英语四级考试成绩的线性关系要好,其关系点很大部分都分布在线性曲线附近,但同样也存在着个别关系点离线性关系曲线较远的现象。分班成绩与英语四级考试成绩的线性关系良好,说明分班成绩可以作为影响英语四级考试成绩的一个因素。
由图3可以看出,大学英语课程的平时成绩与英语四级平时成绩并不呈现出线性关系,说明
平时成绩对英语四级考试成绩的影响并不大,可以剔除平时成绩作为英语四级考试成绩的影响因素。
由图4可以看出,期末卷面成绩与英语四级考试成绩的线性关系相对来说是最好的,关系点几乎都分布在关系曲线的附近,说明期末卷面成绩可以作为英语四级考试成绩的一个影响因素。
教资面试报名从以上四个散点分布图可以看出,平时成绩与英语四级考试成绩线性相关程度不高,英语平时成绩可以被剔除,不加入多元线性回归中分析;四级考试成绩分别与英语高考成绩、分班成绩以及期末卷面成绩都呈现出良好的线性关系利用SPSS软件对收集到的数据进行回归分析处理,得到处理后的数据。从表1中可以得出,模型拟合度为68.5%,拟合度R值调整后R2的值都比较高,说明回归过程所选用的预测变量在很大程度上能够解释响应变量,因此可以用该模型来预测因变量为英语四级考试成绩。
从表2可以得出模型的F统计量的观察值为73.851,概率p值为0.000,在显著性0.05的情况下,p<0.05,说明该模型非常显著可信。从表3可以得出,高考成绩、分级成绩以及期末卷面成绩的偏相关系数分别为1.064,1.463,3.060,三个影响因素中,期末卷面成绩的偏
相关系数最大,也说明期末卷面成绩对英语四级考试成绩影响最大,其次是分班成绩、最后是高考成绩。其中三个影响因素概率P值趋于0且都小于0.05,因此,可以再次说明英语四级成绩与高考成绩、分班成績以及期末卷面成绩的线性相关程度很高。2022年贵州省考公务员报名时间
通过分析得出预测英语四级成绩多元线性回归方程为
3 结束语
通过上述模型计算,将预测数据与实际成绩进行对比,得到四级考试成绩与预测值散点分布,如图5所示,四级考试成绩实际值与预测值符合的很好。
3.1 模型的优缺点
运用回归分析可以准确地分析高考英语成绩、分班英语成绩与期末英语成绩之间的相关程度,筛选主要因素来进行多元线性回归,其拟合程度效果良好,预测的结果也较为精确。
英语四级成绩影响因素多种多样,本文仅筛选出4项指标作为主要影响因素,该因素可以从学校教务及招生考试处得到,如因各校统计的输入数据不同也可根据自己的需求自行选择。其预测得到成绩仅供参考。
法律资格考试准考证打印3.2 展望
本文筛选了与四级英语成绩相关的因素,排除了平时英语成绩,建立了包含高考英语成绩、分级英语成绩以及期末卷面英语成绩等因素的多元线性回归模型来对四级英语成绩进行预测,预测成绩与实际成绩较为符合。该预测模型方法简单,方便考英语四级考生更清楚了解自己目前的英语水平,好为英语四级的到来调整学习情况做好准备。也能够组织学生备考英语四级,能让学生更有效率的学习英语。可以提高学生对英语学习情况的认知,也为让各高校更好的塑造英语四级学习氛围提供一个工具,具有一定的实用性。
参考文献:
[1]宋来中,覃太贵.建模常用方法与实验[M].北京:科学出版社,2015.
[2]张荣艳,高杉,高云飞.SPSS软件应用[M].北京:清华大学出版社,2015.
[3]赵光,王栓宏,孙珩.大学英语四级考试成绩预测模型构建与实证分析[J].中国西部科技,2015(04).
2021考研国家分数线一览表
江西省人事考试网三支一扶[4]辜向东.大学英语四、六级考试对中国大学英语教学的反拨效应实证研究[J].重庆大学学报(社会科学版),2007(04).
[5]孙毅,刘仁云,王松,等.基于多元线性回归模型的考试成绩评价与预测[J].吉林大学学报(信息科学版),2013(04).
[6]杨丛道,高铭.浅谈英语专业四级考试对教学的反拨作用[J].吉林省教育学院学报(下旬),2012(04).