您当前的位置:首页 >  应用文书 >  应用文书分类 > 内容

用K均值法对自考考生流失的研究

材料写作网    时间: 2020-12-05 18:02:28     阅读:

摘要:高等教育自学考试(自考)是我国高等教育的一种重要形式,考生流失是自考的一种普遍现象。流失原因分析对自考管理方法的改革有着重要的意义。文章尝试采用聚类分析中K-Means方法对北京市自考考生流失的多重因素进行分析,揭示出自考考生流失的一些规律。

关键词:数据挖掘;K-均值;高等教育自学考试;考生流失;聚类

引言

数据挖掘(Data Mining)指的是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘与知识发现技术是计算机领域一个非常有活力的研究课题,其研究成果已广泛应用于金融、医疗保健、零售、制造业、工程与科学等行业。考生流失是自考的一种普遍现象,分析流失原因对自考管理方法的改革有着重要意义。一些研究人员采用分类统计等研究方法,从公共课成绩入手分析流失的规律,对该问题进行了基础性的研究。本文采用数据挖掘中的聚类分析方法寻找高等教育自学考试考生各种属性和考生流失之间的联系,希望能为相关机构提供浓缩的数据归纳结果和有效的建议,更好地服务于教育机构,服务于考生。

1、流失定义与流失考生数据提取

自学考试的考试时间完全可以由考生自己选择,学制没有明确的期限,考生流失既不需要到相关部门认定,也不保证以后不会再来参加考试。也就是说不再参加考试的考生在学籍中不会有记载,而且过了很长时间(2、3年)后也许会重新参加考试。因此研究自学考试考生流失就必须对流失考生加以明确定义。

首先定义两个概念:'跨度“和'暂停期“。'跨度“定义为考生参加第一门课程考试与参加最后一门课程考试的时间间隔(单位为月);'暂停期“定义为考生两门课程考试间隔的最大时间(单位为月)。

图1、图2分别是北京市12658名自考已毕业的考生'跨度“和'暂停期“的统计数据,其中专科8859人,他们中99.5%以上的毕业生跨度为66个月,94.1%以上的毕业生的暂停期为24个月;本科3799人,他们中99.3%以上的毕业生跨度为66个月,95.0%以上的毕业生的暂停期为24个月。因此在研究中定义66个月和24个月作为'跨度“和'暂停期“的流失阈值A和B。

自考考生流失的定义:跨度大于等于A(66个月)且最后一门课程考试距当前最近一次考试时间大于等于B(24个月)的考生即为流失考生。

根据上述定义,从还未毕业的18050名考生中筛选出12545名流失考生。总流失率为69.5%。其中专科流...

== 试读已结束,如需继续阅读敬请充值会员 ==
本站文章均为原创投稿,仅供下载参考,付费用户可查看完整且有格式内容!
(费用标准:38元/2月,98元/2年,微信支付秒开通!)
升级为会员即可查阅全文 。如需要查阅全文,请 免费注册登录会员
《用K均值法对自考考生流失的研究.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

相关热搜

《用K均值法对自考考生流失的研究.doc》

VIP请直接点击按钮下载本文的Word文档下载到电脑,请使用最新版的WORD和WPS软件打开,如发现文档不全可以联系客服申请处理。

文档下载
VIP免费下载文档

浏览记录