基于教育大数据的数字化学习行为分析研究

时间:2022-06-19 03:15:12 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
基于教育大数据的数字化学习行为分析研

作者:杨定中

来源:《教育教学论坛》 2017年第22



一、前言在大数据的时代背景下,我们逐步开展了智慧校园的建设。MOOC在线教育对以往的教学模式进行了极大的革新,使更多的优质资源在网络技术支持下得以共享,推动了我国全教育事业的发展,并在很大程度上使教育更公平化,使信息孤岛问题得以有效的消除。在MOOC网络平台之中,其课程学习是免费开放的,在世界各地的学习者通过互联网均能够对平台自由访问。现如今,MOOC平台拥有一千多万的用户,其对学习者提供更为全面、正规的课程教育。MOOC在线教育的最大特征就是拥有十分庞大的学习者群体。在传统的教育测评工作中,我们以假定:学习者群体所具有的学习动机大致是一样的;学习者的心智发育以及知识构成也较为相近;并且参与学习的人数相对要少得多。所采用的测评方式相对来说较为单一,且相对简单。而以上假定在MOOC网络平台中,则出现了相对大的改变,不同的学习者所具有的学习动机以及自身的知识构成具有较大的差异性。在学习者参与人数众多的MOOC平台之中,传统的测评方式无法适应新的教育模式,不能取得良好的测评效果。随着教育信息技术的水平的不断提高,在线学习平台资源的开放与共享越来越来深入,数字化的学习已经融入到教育的全过程,学习者在MOOC网络平台中发生的全部学习行为,通过多种信息数据的方式而记录至数据库中。因此,要对MOOC网络平台中学习者进行有效的测评,无法完全借鉴以往的测试方法。因而,需要基于大数据条件下,对学习者的学习行为以及学习效果进行分析与测评。本文以某学校在MOOC网络平台中所开设的6门网络课程进行学习这行为的数据收集与分析,旨在为课程教学中进一步改善教学效果提供一定的参考依据。

二、学习者的类型分析掌握不同的学习者与MOOC平台发生的交互学习行为具有较为重要的作用。所以,我们对学习者的数字化学习行为进行分析,能够找到不同学习者的学习目标、学习动机以及学习状态等具有较高价值的数据信息,以此作为个性化课程教育的改进以及测评学习者学习效果的重要依据。不过,学习者所具有的动机不能直接的测量到,唯有依照一定的评估总结,对某些行为具有的假定构想间接的进行感知。在长期研究中发现,对于单个的学习者进行目标、学习内容、证书对学习者的激励价值大小、外部环境、个人状态以及本能推动等评测是相对较为困难的,而以上情况均反映在学习者的学习行为差异方面。按照不同学习者所具有的动机进行群体的划分,单纯依据学习者的行为数据,无法进行相对精确的类别划分。而且,所划分的种类较多且繁杂。所以,应对此进行一定的简化处理。表1中的数据是针对某高校在MOOC平台中所开设的6门课程相关数据信息进行收集与统计。此6门课程分别为:人群与网络课程(P)、艺术史课程(A)、大学化学课程(C)、生物信息学课程(B)、数据结构与算法分析课程(D)、计算机概论课程(I)。每一门课程所涉及的教学内容以及相关要求均有所差异。

2中的数据是不同的课记录在总分之中的项目,在这些记录总分之中的项目中,小测验以及期末测试是所有课程均含有的。依据传统的所采用的评价方式,是依照不同学生的成绩,而把其划分成“好、中、差”这三个等级。在MOOC平台中,仅仅通过学习成绩来对学习者的学习效果进行评价,明显较为片面。在MOOC平台中,存在着多类别的学习行为,在此选择“观看视频”以及“提交测验”这两个非常广泛而且也最为基础的学习行为,来对学习者的学习行为进行分析。由于我们将参与学习者总共划分成“好、中、差”三个不同的等级。所以,在此就要求具有两个相应的阈值。本文将其做了一定的简化处理,仅仅考虑学习者“观看视频”以及“提交测验”的行为。在属于“差”类等级之中的学习者中,其出现上述学习行为的次数极少,有些学习者的记录甚至为零值,此类学生被纳入到“打酱油者”之中。而在属于“中”类等级之中的学习者中,其观看视频的次数以及提交测验的次数在整个群体之中属于中等水平,我们


能够将这些学习者看成是未完整的对课程进行学习。而在“中”等学习者之中,有个别学习者是偶尔的对课程内容进行学习,也有部分学者在很长一段时间之内未进行课程的学习。所以,在此把这部分学习者再细致划分成“虎头蛇尾者”以及“始终摇摆者”。而在属于“好”类等级之中的学习者中,他们的学习行为记录非常多。不过,这其中部分人未取得相应的证书,说明此部分学习者其目标并非是为了获取证书。所以,把此类学习者进行更细致的划分,分别归类为“坚定完成者”以及“只为学习者”。这两类学习者之间的主要区别,是看是否参加了期末的测验。在对不同的学习者种类划分之后,要对不同分类的阈进行确定。首先,定义不同的两个阈值分别为c1c2,定义学习者观看课程视频的记录次数l,定义学习者提交测验的记录次数q,学习者首次发生观看视频或者提交测验与最后发生观看视频或者提交测验的时间间隔数为t。那么,可得某一学习者的记录密度值p为(p+q/t。定义θ是“中”类等集中,全部学习者记录密度所拥有的平均值大小。那么,在对学习者类别划分时有下列五种类型:(1若是l+p≤c1,那此学习者被定义为“打酱油者”。(2)若是c1<l+q≤c2,并且p≥θ,那么,学习者被定义为“虎头蛇尾者”。(3)若是c1 <l+q≤c2,并且p<θ,那么,此学习者被定义为“摇摆不定者”。(4)若是l+qc2,且此学习者参加了期末测验,那么,学习者被定义为“坚定完成者”。(5)若是l+qc2,且学习者没有参加期末测验,那么,学习者被定义为“只为学习者”。三、学习者参与行为的分析1.与时间相关的行为分析。在采集的数据中显示,一般在课程还未开始之前的几个月之内,已经有人进行了课程的注册。和之前的课程学习方式有所差异,通过MOOC平台进行课程学习,在课程开始前以及课程开始之后,依旧有非常多的学习者进行课程的注册学习。我们通过分析人群与网络课程,来探讨关于学习者时间相关行为的问题。从统计数据中可知:约有36%左右的学习者,在课程开始之前就已经进行了注册。而且,在课程完全结束之后,依旧有大约2%左右的人注册该课程。在各个时期之内的注册学习者,所表现的学习行为具有一定的差异性。而对于学习者的退课情况分析显示,多个课程在开课的第一周与第二周表现出了学习者人数大量减少的态势,在课程进入到第三周之后,学习者的人数才开始逐步地平稳。并且,在最后的测验周,学习者的人数会有所增加。我们想要的情况是全部的学习者均在开课前或者开课时注册,而在测验结束后退出。不过,现实情况却并非如此。同时,大约有1/3左右的学习者,在课程开始之前就已经注册,并且在课程已经完全结束后,依旧出现有关学习记录信息。这部分学习者,并非是仅仅为了关注所取得的测验成绩,

进一步分析是由于前期未能仔细的对课程进行学习,而当结束之后,又重新的对课程进行学习。

2.与成绩相关的行为分析。在以往的课程学习中,多是通过考试成绩来对学习者进行学习效果的评价。而在MOOC网络平台中,不同的学习者拥有不同的知识结构、学习动机以及学习技巧。不过,所取得的成绩和学习者能否获取相应的证书紧密相连。在本文所分析的6门课程中,通过统计数据可以得出,不同的课程虽然在成绩分布方面存在差异。但存在很大的相似性。在此,依然以人群与网络课程为例来进行说明。该课程的注册学习者为10807人。其中,有9677人的成绩显示为零分,大约占据了全部学习者人数的90%左右。有862个学习者所取得的成绩是比零分大,但无法获取到证书,此类学习者占全部学习者数量的比例约为8%。而有149个学习者获取到了相应的证书,此类学习者占全部学习者数量的比例约为1%。四、学习效果预测分析对于MOOC网络平台来说,提升课程的通过率是MOOC网络平台效用极为重要的体现。在此,针对不同的学习者所具有的学习行为,对其成绩进行预测。1.问题的描述以及数据集。针对此次学习效果的预测,期望可以在整个阶段,能够对不同学习者的学习状况,进行实时的预测与分析,预测能否可以获取到相关的证书。以统计数据来看,6门课程都在课程开始之后的第一周以及第二周的时期内,发生学习者人数较大的波动起伏。然后,在第三周时,学习者的人数才慢慢地趋于平稳。此次课程的课时时间持续13周左右。而在此假定现在仅仅获取到了学习者在前五周、前六周以及前七周的学习行为数据信息。同时,将数据信息中非学习者的相关行为数据去除。表3中的数据代表的是此次实验所采用的样本量统计。我们将每一课程所拥有的学习者数量设定为n,所有的学习者均拥有p个特征值。那么,X={X1,…,Xp}∈Rn×p,预测值则表示为:Y=fX ∈Rn,y∈{0,1}。上式中,y=0代表的是没有获取到证书而y=1代表的是已经获取到证书。2.实验方法。对不同的课程,把所收集的数据依据3∶1∶1的分配方式随机地抽取出训练集、验证集以及测试集。当进行实验时,用训练集进行参数的训练,而采用验


证集来进行参数的优化与选择,最后采用测试集来对不同的指标加以计算。3.实验结果分析。通过实验,最终得出该方法具有非常高的准确率。所以,采用此方法,我们能够依照不同学习者的学习行为,来确定出可以获取到证书的学习者,也能够准确地找到一些极有可能获取到证书,不过却未获取到证书的学习者。通过MOOC在线平台这种学习模式,每个学习者都可以感觉到自己在接受教师的单独个性化学习辅导,可以从一起学习的同伴那里获得指导以及指导他人,同时感受学与教的快乐。从而提升学习者学习效果,使该学习者最终也获取到证书。所以,采用此种学习行为分析方法,除了能够对不同课程的学习者所具有的学习情况进行实时的监测,同时也能够针对不同学习者的预测情况,而制定相应的措施,以改善课程的整体通过率,从而提升学习者的学习效果。

五、结语通过对教育大数据的分析,可以更加利于课程内容的不断完善与合理化,并针对不同学习者的学习行为,而采用最为有效的教学方式,使学习者的学习动机更加强烈,以提升学习者的学习效果。


本文来源:https://www.wddqw.com/doc/00beccc40608763231126edb6f1aff00bed57042.html