Recommendations for K12 Math Exercises Based on Formula Features Extraction and Neural Cognitive Diagnosis
这是一篇关于教育大数据,知识建模,认知诊断,试题推荐的论文, 主要内容为随着线上教育的普及,海量的K12教育资源作为信息被共享到在线教育平台,越来越多的中小学生可以享受到互联网大数据的红利,在个性化教育与自适应教育中得到更好的发展。在智能教育领域,面向学生的个性化试题推荐一直是重要的研究课题,试题推荐技术帮助学生避免题海战术,通过针对薄弱知识点的定向学习来快速高效提升知识能力。在这种时代背景下,中小学生对于在线学习平台上的K12教育试题推荐需求日益迫切。数学作为一切学科的基础,不仅在K12教育中一直占据重要地位,更以其鲜明的体系结构、明确的章节知识划分、客观标准的题型与答案,成为众多线上教育系统青睐的学科资源。因此,本论文以针对K12数学学科的试题推荐技术为切入点展开研究工作,调研对比了传统方案,提出部分现存问题,并基于此提出创新性算法方案设计。目前主流的试题推荐方法模拟传统的基于协同过滤的商品推荐系统,将学生看作顾客,试题看作商品,通过模型对试题打分来进行推荐。然而将协同过滤运用到智能教育领域时,仅考虑了学生或试题间的共性特征,而忽略了学生和试题本身的个性特征,推荐结果可解释性较差。教育心理学中的认知诊断理论能够很好的解决这一问题,它通过试题Q矩阵与学生答题日志,诊断出学生的知识掌握情况,并基于此展开针对性试题推荐,使得推荐结果可解释性更强,推荐效果也更加精准。然而传统的认知诊断模型中的学生-试题交互函数往往由专家人工定义,主观性较强且方法低效,难以准确描述出二者复杂的交互逻辑。此外,传统认知诊断模型的计算规模往往与知识数量成指数关系,导致在处理大规模知识属性集(K12数学学科知识点为千量级)时性能较差。由于学生答题日志的有限性和稀疏性,即难以要求学生答题情况覆盖大部分知识点,易导致认知诊断模型训练效果不佳,对学生知识掌握情况的推断缺乏足够依据,继而造成推荐效果不准的情况。此外,学科知识点之间往往具有紧密的关联结构,如果将这些关联结构运用到推荐过程中,有望进一步增强推荐效果。认知诊断过程中用到的Q矩阵往往由专家人工标注,这一过程耗时耗力,将Q矩阵标注工作自动化是提升推荐系统性能的一个优化点。最后,数学等理工学科试题文本往往包含大量公式,这些公式中隐藏的知识点极易在知识抽取过程中被忽略。由于中文词汇不具有明显边界,一些知识点为多个词语的组合词,如何从组合词中选取最具代表性的知识概念点也是值得研究的问题。本论文针对将传统的试题推荐技术运用到K12数学领域时出现的问题,依次在三个环节提出创新性算法,分别是试题知识建模环节、学生建模环节,和基于这二者工作成果的试题推荐环节。它们有效解决了各自模块的性能瓶颈与可行性问题,提升了最终推荐结果的可解释性和准确性。本论文贡献的这三种方法可以被简略描述如下:1.试题建模:基于公式特征提取的知识抽取方法(BiLSTM+CRF+FFE)本论文第二章主要解决试题建模问题,提出的第一种方法名为基于公式特征提取的知识抽取方法。试题建模第一步往往通过词嵌入技术将题干转化可计算的序列,第二步通过关键词生成技术获取题目中的知识,如概率统计、序列标注、深度学习等方法。传统的知识抽取方案在应用到K12数学教育领域时存在数学公式知识点遗漏、组合候选词难以选取的问题。为此,本文提出的知识建模算法主要由三层处理层构成。第一层为Word2Vec+BiLSTM+CRF神经网络层,用于有效学习试题文本上下文信息并抽取出关键词汇,Word2Vec用于词嵌入,BiLSTM由前向LSTM和后向LSTM组成,用来更好的捕获试题的双向语义,CRF用于对最终的分类做约束,确保标签合法。第二层为公式特征抽取层,通过对LaTex公式组合范式的理解,分两路分别提取数学公式中的显式特征和隐式特征,从而实现对公式知识点的深度抽取。第三层为后处理层,通过进一步调整组合词汇的综合得分,来提升知识抽取的准确性。这套方案能够自动高效地标注出试题中的知识点,从而得到试题Q矩阵,为后续学生建模提供重要依据。在实验阶段,本文选取2018-2020各地区中考数学真题(无图客观题)作为实验数据,保证了试题知识点经过专家标注、知识点均匀分布、试题难度拉开梯度、以及题型的典型性,通过对比实验验证了公式特征抽取层和后处理层对知识抽取效果的提升。2.学生建模:基于DINA假设的神经认知诊断方法(NeuralDINA)本论文第三章主要解决学生建模问题,提出的第二种方法名为基于DINA假设的神经认知诊断方法。在这一环节,本文以教育心理学领域的认知诊断理论为基础进行研究。认知诊断主要通过学生的答题记录和试题Q矩阵来推断学生的认知状况,诊断结果可以被用作教育资源推荐、学生表现预测、小组分组等后续教育应用中。传统的认知诊断模型往往由专家主观设计的交互函数来模拟学生因子与试题因子之间的交互关系,难以准确捕捉二者复杂的交互逻辑;此外,面向K12数学领域的知识数目量级较大(2000+),由于传统的诊断模型在通过MLE算法进行参数估计时,计算规模与知识数目成指数关系,可行性较低。因此,本文提出的认知诊断方法利用神经网络,直接从答题数据和Q矩阵中学习学生与试题间的交互关系,而非人工设计交互函数,并将学生因子作为模型参数进行训练,训练结束后即得到诊断结果。模型的输入为学生因子与试题因子,通过三层网络结构,输出该学生在试题上的预测得分。网络第一层基于DINA假设,引入了猜测参数和失误参数,模型后两层为全连接层。使用神经网络来训练认知诊断模型能够更加智能高效地学习出学生-试题交互函数,同时也避免了因知识属性较多造成的计算规模指数爆炸问题,大大提升模型训练效率与可行性。在实验阶段,首先通过AVG与STD统计信息验证了数据集中学生知识状态的稳定性,接下来通过模型调参确立了最佳训练参数,并将认知诊断效果评估问题转化为分类问题,用分类问题常用指标(Flscore、AUC等)来评估该方法与传统认知诊断模型的性能差异,验证了 NeuralDINA模型的有效性与优越性。3.基于神经认知诊断与知识层级约束的试题推荐方法(NeuralDINA+KHC)本论文第四章为解决试题推荐问题,提出的第三种方法名为基于神经认知诊断与知识层级约束的试题推荐方法。传统的协同过滤推荐算法具有新用户冷启动和数据稀疏的问题,应用到教育资源推荐领域可解释性较差,即无法向学生说明推荐某一试题的原因,且推荐的试题不一定对学生的知识掌握水平提升有帮助。基于认知诊断的推荐则具有较好的解释性,能够针对学生的薄弱知识点做出针对性推荐。然而学生由于答题日志有限,也难以保证诊断结果的准确性和全面覆盖性。通过稀疏日志矩阵训练出来的模型预测某试题得分较低,可能是该试题考查的知识点未被日志覆盖导致,而并非学生真的未掌握。因此,本文提出一种的试题推荐方法以第三章中训练得到的学生诊断模型为基础,预测试题得分,再通过知识属性层级约束和试题难度控制,对分数做进一步优化调整,最后引入错题库,从中随机挑选部分试题加入待推荐试题集,生成一套构成丰富、针对性强、可解释性强的试题卷。学生做题情况得到反馈后,动态更新神经认知诊断模型与错题库,以便更加准确地分析学习者的知识掌握情况,继而在学习者知识状态变化后,依然能实现后续推荐。在实验阶段,知识层级由知识图谱构建而成,通过对近2200条K12数学公理的数据挖掘,提取出2000+个数学知识实体与2700条实体间关系,并从中抽象出6种实体关系类型(包含、等价、对立、相似、属性、前驱)和3种属性层级结构(前驱知识、后继知识、等价知识)。对于推荐部分,通过五种推荐方法的对比,验证了本推荐方法的有效性、优越性、与可解释性。综上所述,本研究主要贡献在于,针对K12数学教育领域,提出了一套具备可行性与创新性的个性化试题推荐方案,分别在试题知识建模、学生建模、试题推荐这三个环节提出创新性方法设计,有效解决了推荐流程中遇到的一些细节问题,对于智慧教育的发展具备一定的研究意义。
基于个人阅读习惯特征的个性化推荐系统研究
这是一篇关于教育大数据,推荐系统,Spark,用户画像,SVD的论文, 主要内容为随着大数据时代,特别是“互联网+”的到来,信息过滤成为人们必须面对的问题。对于用户不明确或难以表达的需求,推荐系统通过分析用户动态和静态数据,更加主动、智能地过滤信息,从而向用户展示他们潜在需求的东西。这一特性使得推荐系统在教育教学领域有着重要的作用。本文从推荐系统入手,深入探讨大数据处理技术,分析列举了一系列推荐算法及应用。尝试从阅读行为数据入手,构建学生的高阶阅读行为,作为教学辅助。本文依托Spark大数据平台,设计了一套集数据存储,数据清洗,个性化推荐的大数据推荐系统,并详细阐述了其主要功能的实现方法。本文构建了学生行为特征的多层次模型并生成学生的学习行为画像,在这基础上测试了高阶学习行为的加入对基于近邻的协同过滤算法有一定的提升,因此尝试将学生阅读行为的一些特征相似性融合到了隐语意模型中,提出了BSSVD++(Behaviour Combined SVD++)算法,并在现有的数据集上分别进行横向、纵向比较,获得了较好的模型和参数。研究结果表明本文提出的这种基于个人阅读习惯特征的个性化推荐系统能够合理有效地利用学生的阅读行为数据,较为精准的定位学生的阅读习惯和阅读风格,实现个性化的推荐,具有重大的现实意义。
基于个人阅读习惯特征的个性化推荐系统研究
这是一篇关于教育大数据,推荐系统,Spark,用户画像,SVD的论文, 主要内容为随着大数据时代,特别是“互联网+”的到来,信息过滤成为人们必须面对的问题。对于用户不明确或难以表达的需求,推荐系统通过分析用户动态和静态数据,更加主动、智能地过滤信息,从而向用户展示他们潜在需求的东西。这一特性使得推荐系统在教育教学领域有着重要的作用。本文从推荐系统入手,深入探讨大数据处理技术,分析列举了一系列推荐算法及应用。尝试从阅读行为数据入手,构建学生的高阶阅读行为,作为教学辅助。本文依托Spark大数据平台,设计了一套集数据存储,数据清洗,个性化推荐的大数据推荐系统,并详细阐述了其主要功能的实现方法。本文构建了学生行为特征的多层次模型并生成学生的学习行为画像,在这基础上测试了高阶学习行为的加入对基于近邻的协同过滤算法有一定的提升,因此尝试将学生阅读行为的一些特征相似性融合到了隐语意模型中,提出了BSSVD++(Behaviour Combined SVD++)算法,并在现有的数据集上分别进行横向、纵向比较,获得了较好的模型和参数。研究结果表明本文提出的这种基于个人阅读习惯特征的个性化推荐系统能够合理有效地利用学生的阅读行为数据,较为精准的定位学生的阅读习惯和阅读风格,实现个性化的推荐,具有重大的现实意义。
大数据环境下智慧课堂教学模式的设计与应用
这是一篇关于智慧教育,智慧课堂模式,教育大数据,大数据环境,模糊综合评价法的论文, 主要内容为随着时代的变迁,在大数据、云计算、网络技术、移动互联网等高新技术的引领下,教育逐渐挣脱了传统教学模式的束缚,也解除了传统教学模式在空间和时间上的禁锢,打开了智慧思维模式的天窗。借着国家“信息化发展战略”和“教育信息化十年发展规划(2011-2020年)”的春风,教育人士对教育信息化的探索和实践一直走在路上,智慧教育也迎风而来,新技术和新模式的引进不仅给智慧课堂的出现提供了支持,也促进教学模式的创新改革,优化并提升了教学效果,为教育带来了更多的发展机遇。本研究基于当前学者对教育大数据与智慧课堂模式的理论基础与实践应用研究,通过前期对文献的查阅与分析、调研智慧课堂模式的普及情况以及实际观察已有的智慧课堂模式,结合智慧课堂的教学特征,构建出基于大数据环境下的智慧课堂模式,详细阐述了课前、课中、课后三步走的环节,并结合小学数学课本特点及学生学习特征设计出在大数据环境下应用智慧课堂教学模式的五年级《平行四边形面积》教学案例,实施课前、课中、课后三环节的智慧课堂教学活动,指导智慧课堂教学实践。对于应用此模式的教学案例实践效果验证方面,笔者采用了问卷法和访谈法对教师和学生开展了调查,分别从基本信息、智慧课堂应用情况及效果、智慧课堂满意度等方面对教师展开了调查,也侧重调查了学生对课堂的满意度以及能力提升的认可度,另外笔者采用模糊综合评价法对此模式的综合效果进行了评价与分析,根据专家和教师的建议设计出各项指标,其中包括智慧环境、课堂反应、教师满意度、教学效果4项一级指标以及对应的16项二级指标,按照模糊综合评价步骤和对应的计算方法得出最终的评判结果,进而得出此模式的综合效果,采用此方法也是本研究中的创新之处。在本研究中笔者提出了大数据环境下智慧课堂教学模式,为各中小学校提供了可借鉴的智慧课堂教学参考模式,在探究该教学模式的过程中,查阅了丰富的智慧教育与智慧课堂相关理论与实践,从而撰写出相关内容,为该模式的运用与推广奠定了理论和实践基础。本研究对教育信息化的发展也起到了一定的推动作用,也为其他学校推广智慧教育提供了可借鉴的理论依据与实践教学案例。
Recommendations for K12 Math Exercises Based on Formula Features Extraction and Neural Cognitive Diagnosis
这是一篇关于教育大数据,知识建模,认知诊断,试题推荐的论文, 主要内容为随着线上教育的普及,海量的K12教育资源作为信息被共享到在线教育平台,越来越多的中小学生可以享受到互联网大数据的红利,在个性化教育与自适应教育中得到更好的发展。在智能教育领域,面向学生的个性化试题推荐一直是重要的研究课题,试题推荐技术帮助学生避免题海战术,通过针对薄弱知识点的定向学习来快速高效提升知识能力。在这种时代背景下,中小学生对于在线学习平台上的K12教育试题推荐需求日益迫切。数学作为一切学科的基础,不仅在K12教育中一直占据重要地位,更以其鲜明的体系结构、明确的章节知识划分、客观标准的题型与答案,成为众多线上教育系统青睐的学科资源。因此,本论文以针对K12数学学科的试题推荐技术为切入点展开研究工作,调研对比了传统方案,提出部分现存问题,并基于此提出创新性算法方案设计。目前主流的试题推荐方法模拟传统的基于协同过滤的商品推荐系统,将学生看作顾客,试题看作商品,通过模型对试题打分来进行推荐。然而将协同过滤运用到智能教育领域时,仅考虑了学生或试题间的共性特征,而忽略了学生和试题本身的个性特征,推荐结果可解释性较差。教育心理学中的认知诊断理论能够很好的解决这一问题,它通过试题Q矩阵与学生答题日志,诊断出学生的知识掌握情况,并基于此展开针对性试题推荐,使得推荐结果可解释性更强,推荐效果也更加精准。然而传统的认知诊断模型中的学生-试题交互函数往往由专家人工定义,主观性较强且方法低效,难以准确描述出二者复杂的交互逻辑。此外,传统认知诊断模型的计算规模往往与知识数量成指数关系,导致在处理大规模知识属性集(K12数学学科知识点为千量级)时性能较差。由于学生答题日志的有限性和稀疏性,即难以要求学生答题情况覆盖大部分知识点,易导致认知诊断模型训练效果不佳,对学生知识掌握情况的推断缺乏足够依据,继而造成推荐效果不准的情况。此外,学科知识点之间往往具有紧密的关联结构,如果将这些关联结构运用到推荐过程中,有望进一步增强推荐效果。认知诊断过程中用到的Q矩阵往往由专家人工标注,这一过程耗时耗力,将Q矩阵标注工作自动化是提升推荐系统性能的一个优化点。最后,数学等理工学科试题文本往往包含大量公式,这些公式中隐藏的知识点极易在知识抽取过程中被忽略。由于中文词汇不具有明显边界,一些知识点为多个词语的组合词,如何从组合词中选取最具代表性的知识概念点也是值得研究的问题。本论文针对将传统的试题推荐技术运用到K12数学领域时出现的问题,依次在三个环节提出创新性算法,分别是试题知识建模环节、学生建模环节,和基于这二者工作成果的试题推荐环节。它们有效解决了各自模块的性能瓶颈与可行性问题,提升了最终推荐结果的可解释性和准确性。本论文贡献的这三种方法可以被简略描述如下:1.试题建模:基于公式特征提取的知识抽取方法(BiLSTM+CRF+FFE)本论文第二章主要解决试题建模问题,提出的第一种方法名为基于公式特征提取的知识抽取方法。试题建模第一步往往通过词嵌入技术将题干转化可计算的序列,第二步通过关键词生成技术获取题目中的知识,如概率统计、序列标注、深度学习等方法。传统的知识抽取方案在应用到K12数学教育领域时存在数学公式知识点遗漏、组合候选词难以选取的问题。为此,本文提出的知识建模算法主要由三层处理层构成。第一层为Word2Vec+BiLSTM+CRF神经网络层,用于有效学习试题文本上下文信息并抽取出关键词汇,Word2Vec用于词嵌入,BiLSTM由前向LSTM和后向LSTM组成,用来更好的捕获试题的双向语义,CRF用于对最终的分类做约束,确保标签合法。第二层为公式特征抽取层,通过对LaTex公式组合范式的理解,分两路分别提取数学公式中的显式特征和隐式特征,从而实现对公式知识点的深度抽取。第三层为后处理层,通过进一步调整组合词汇的综合得分,来提升知识抽取的准确性。这套方案能够自动高效地标注出试题中的知识点,从而得到试题Q矩阵,为后续学生建模提供重要依据。在实验阶段,本文选取2018-2020各地区中考数学真题(无图客观题)作为实验数据,保证了试题知识点经过专家标注、知识点均匀分布、试题难度拉开梯度、以及题型的典型性,通过对比实验验证了公式特征抽取层和后处理层对知识抽取效果的提升。2.学生建模:基于DINA假设的神经认知诊断方法(NeuralDINA)本论文第三章主要解决学生建模问题,提出的第二种方法名为基于DINA假设的神经认知诊断方法。在这一环节,本文以教育心理学领域的认知诊断理论为基础进行研究。认知诊断主要通过学生的答题记录和试题Q矩阵来推断学生的认知状况,诊断结果可以被用作教育资源推荐、学生表现预测、小组分组等后续教育应用中。传统的认知诊断模型往往由专家主观设计的交互函数来模拟学生因子与试题因子之间的交互关系,难以准确捕捉二者复杂的交互逻辑;此外,面向K12数学领域的知识数目量级较大(2000+),由于传统的诊断模型在通过MLE算法进行参数估计时,计算规模与知识数目成指数关系,可行性较低。因此,本文提出的认知诊断方法利用神经网络,直接从答题数据和Q矩阵中学习学生与试题间的交互关系,而非人工设计交互函数,并将学生因子作为模型参数进行训练,训练结束后即得到诊断结果。模型的输入为学生因子与试题因子,通过三层网络结构,输出该学生在试题上的预测得分。网络第一层基于DINA假设,引入了猜测参数和失误参数,模型后两层为全连接层。使用神经网络来训练认知诊断模型能够更加智能高效地学习出学生-试题交互函数,同时也避免了因知识属性较多造成的计算规模指数爆炸问题,大大提升模型训练效率与可行性。在实验阶段,首先通过AVG与STD统计信息验证了数据集中学生知识状态的稳定性,接下来通过模型调参确立了最佳训练参数,并将认知诊断效果评估问题转化为分类问题,用分类问题常用指标(Flscore、AUC等)来评估该方法与传统认知诊断模型的性能差异,验证了 NeuralDINA模型的有效性与优越性。3.基于神经认知诊断与知识层级约束的试题推荐方法(NeuralDINA+KHC)本论文第四章为解决试题推荐问题,提出的第三种方法名为基于神经认知诊断与知识层级约束的试题推荐方法。传统的协同过滤推荐算法具有新用户冷启动和数据稀疏的问题,应用到教育资源推荐领域可解释性较差,即无法向学生说明推荐某一试题的原因,且推荐的试题不一定对学生的知识掌握水平提升有帮助。基于认知诊断的推荐则具有较好的解释性,能够针对学生的薄弱知识点做出针对性推荐。然而学生由于答题日志有限,也难以保证诊断结果的准确性和全面覆盖性。通过稀疏日志矩阵训练出来的模型预测某试题得分较低,可能是该试题考查的知识点未被日志覆盖导致,而并非学生真的未掌握。因此,本文提出一种的试题推荐方法以第三章中训练得到的学生诊断模型为基础,预测试题得分,再通过知识属性层级约束和试题难度控制,对分数做进一步优化调整,最后引入错题库,从中随机挑选部分试题加入待推荐试题集,生成一套构成丰富、针对性强、可解释性强的试题卷。学生做题情况得到反馈后,动态更新神经认知诊断模型与错题库,以便更加准确地分析学习者的知识掌握情况,继而在学习者知识状态变化后,依然能实现后续推荐。在实验阶段,知识层级由知识图谱构建而成,通过对近2200条K12数学公理的数据挖掘,提取出2000+个数学知识实体与2700条实体间关系,并从中抽象出6种实体关系类型(包含、等价、对立、相似、属性、前驱)和3种属性层级结构(前驱知识、后继知识、等价知识)。对于推荐部分,通过五种推荐方法的对比,验证了本推荐方法的有效性、优越性、与可解释性。综上所述,本研究主要贡献在于,针对K12数学教育领域,提出了一套具备可行性与创新性的个性化试题推荐方案,分别在试题知识建模、学生建模、试题推荐这三个环节提出创新性方法设计,有效解决了推荐流程中遇到的一些细节问题,对于智慧教育的发展具备一定的研究意义。
基于混合云环境的智慧班牌系统设计与实现
这是一篇关于智慧班牌,混合云,教育云,走班制教学管理,教育大数据的论文, 主要内容为近几年,云技术、大数据、物联网等新技术迅猛发展,学校的信息化建设从单个应用系统逐步向云服务应用过渡。如今,云技术已经发展到一个相对成熟的阶段,学校、老师、学生也需要一个强有力的云服务,结合教育大数据来实现教育资源的优化配置,让学校精准管、老师智慧教学、学生创意学习。教育部出台的《国家中长期教育改革和发展规划纲要(2010-2020年)》中明确要求,有条件的地区和学校要推进走班教学管理制度改革,而智慧班牌系统的建设方案已成为当前解决走班制教学管理难题的最佳方式。在此背景下,结合镇江市教育局建成的教育云平台的基础环境,且根据《江苏省中小学智慧校园建设指导意见(试行)》的建设要求,智慧班牌系统在镇江地区落地需要根据地区特色进行定制化开发,运用云计算和大数据等新技术逐步完善和推广,最终形成教育大数据的采集平台,实现教育大数据沉淀增效的价值。本文以江苏省镇江中学作为智慧班牌系统建设的示范学校,对智慧班牌系统进行需求分析,研究了镇江市教育云平台使用的技术标准和开发接口规范,结合阿里云、腾讯云等云服务的特点,设计并实现了基于混合云环境的智慧班牌系统。主要工作包括以下几个方面:(1)通过与学校管理者、老师等主要用户沟通调研,除了走班制管理的需求,还了解学校日常管理、老师教学、学生自主学习等需求。通过学校信息化管理员对学校现有信息系统进行了解,主要包括一卡通系统、门禁系统、图书馆系统等第三方系统,与智慧班牌系统对接进行分析研究。(2)基于混合云环境,研究镇江市教育云平台和公共云服务平台的技术架构,参考Hadoop大数据框架,利用Hadoop大数据生态系统的HDFS、Yarn、MapReduce、Zookeeper、Hbase和Spark等众多组件完成了智慧班牌系统架构设计和功能设计。(3)应用开发采用J2EE技术构架,将功能分成表示层、业务逻辑层和数据层三层,其中表示层的界面显示部分都采用标准的HTML,JS语法兼容不同类型的浏览器。(4)在项目开发过程中,利用MyEclipse集成环境开发J2EE的应用,利用SVN进行配置管理,利用Microsoft Project进行项目进度管理,利用各种测试用例进行单元测试、耦合测试和集成测试,尽量减少系统漏洞。(5)目前,智慧班牌系统已经在镇江市教育云平台上完成部署,在江苏省镇江中学落地实施,在校内实现了与一卡通系统的对接,同时在公共云上实现了与阿里云上的极课学业评测系统的对接,并实现与微家校互联互通,将学校、班级和学生相关信息个性化推送给对应的家长。系统上线至今运行良好。
基于个人阅读习惯特征的个性化推荐系统研究
这是一篇关于教育大数据,推荐系统,Spark,用户画像,SVD的论文, 主要内容为随着大数据时代,特别是“互联网+”的到来,信息过滤成为人们必须面对的问题。对于用户不明确或难以表达的需求,推荐系统通过分析用户动态和静态数据,更加主动、智能地过滤信息,从而向用户展示他们潜在需求的东西。这一特性使得推荐系统在教育教学领域有着重要的作用。本文从推荐系统入手,深入探讨大数据处理技术,分析列举了一系列推荐算法及应用。尝试从阅读行为数据入手,构建学生的高阶阅读行为,作为教学辅助。本文依托Spark大数据平台,设计了一套集数据存储,数据清洗,个性化推荐的大数据推荐系统,并详细阐述了其主要功能的实现方法。本文构建了学生行为特征的多层次模型并生成学生的学习行为画像,在这基础上测试了高阶学习行为的加入对基于近邻的协同过滤算法有一定的提升,因此尝试将学生阅读行为的一些特征相似性融合到了隐语意模型中,提出了BSSVD++(Behaviour Combined SVD++)算法,并在现有的数据集上分别进行横向、纵向比较,获得了较好的模型和参数。研究结果表明本文提出的这种基于个人阅读习惯特征的个性化推荐系统能够合理有效地利用学生的阅读行为数据,较为精准的定位学生的阅读习惯和阅读风格,实现个性化的推荐,具有重大的现实意义。
Recommendations for K12 Math Exercises Based on Formula Features Extraction and Neural Cognitive Diagnosis
这是一篇关于教育大数据,知识建模,认知诊断,试题推荐的论文, 主要内容为随着线上教育的普及,海量的K12教育资源作为信息被共享到在线教育平台,越来越多的中小学生可以享受到互联网大数据的红利,在个性化教育与自适应教育中得到更好的发展。在智能教育领域,面向学生的个性化试题推荐一直是重要的研究课题,试题推荐技术帮助学生避免题海战术,通过针对薄弱知识点的定向学习来快速高效提升知识能力。在这种时代背景下,中小学生对于在线学习平台上的K12教育试题推荐需求日益迫切。数学作为一切学科的基础,不仅在K12教育中一直占据重要地位,更以其鲜明的体系结构、明确的章节知识划分、客观标准的题型与答案,成为众多线上教育系统青睐的学科资源。因此,本论文以针对K12数学学科的试题推荐技术为切入点展开研究工作,调研对比了传统方案,提出部分现存问题,并基于此提出创新性算法方案设计。目前主流的试题推荐方法模拟传统的基于协同过滤的商品推荐系统,将学生看作顾客,试题看作商品,通过模型对试题打分来进行推荐。然而将协同过滤运用到智能教育领域时,仅考虑了学生或试题间的共性特征,而忽略了学生和试题本身的个性特征,推荐结果可解释性较差。教育心理学中的认知诊断理论能够很好的解决这一问题,它通过试题Q矩阵与学生答题日志,诊断出学生的知识掌握情况,并基于此展开针对性试题推荐,使得推荐结果可解释性更强,推荐效果也更加精准。然而传统的认知诊断模型中的学生-试题交互函数往往由专家人工定义,主观性较强且方法低效,难以准确描述出二者复杂的交互逻辑。此外,传统认知诊断模型的计算规模往往与知识数量成指数关系,导致在处理大规模知识属性集(K12数学学科知识点为千量级)时性能较差。由于学生答题日志的有限性和稀疏性,即难以要求学生答题情况覆盖大部分知识点,易导致认知诊断模型训练效果不佳,对学生知识掌握情况的推断缺乏足够依据,继而造成推荐效果不准的情况。此外,学科知识点之间往往具有紧密的关联结构,如果将这些关联结构运用到推荐过程中,有望进一步增强推荐效果。认知诊断过程中用到的Q矩阵往往由专家人工标注,这一过程耗时耗力,将Q矩阵标注工作自动化是提升推荐系统性能的一个优化点。最后,数学等理工学科试题文本往往包含大量公式,这些公式中隐藏的知识点极易在知识抽取过程中被忽略。由于中文词汇不具有明显边界,一些知识点为多个词语的组合词,如何从组合词中选取最具代表性的知识概念点也是值得研究的问题。本论文针对将传统的试题推荐技术运用到K12数学领域时出现的问题,依次在三个环节提出创新性算法,分别是试题知识建模环节、学生建模环节,和基于这二者工作成果的试题推荐环节。它们有效解决了各自模块的性能瓶颈与可行性问题,提升了最终推荐结果的可解释性和准确性。本论文贡献的这三种方法可以被简略描述如下:1.试题建模:基于公式特征提取的知识抽取方法(BiLSTM+CRF+FFE)本论文第二章主要解决试题建模问题,提出的第一种方法名为基于公式特征提取的知识抽取方法。试题建模第一步往往通过词嵌入技术将题干转化可计算的序列,第二步通过关键词生成技术获取题目中的知识,如概率统计、序列标注、深度学习等方法。传统的知识抽取方案在应用到K12数学教育领域时存在数学公式知识点遗漏、组合候选词难以选取的问题。为此,本文提出的知识建模算法主要由三层处理层构成。第一层为Word2Vec+BiLSTM+CRF神经网络层,用于有效学习试题文本上下文信息并抽取出关键词汇,Word2Vec用于词嵌入,BiLSTM由前向LSTM和后向LSTM组成,用来更好的捕获试题的双向语义,CRF用于对最终的分类做约束,确保标签合法。第二层为公式特征抽取层,通过对LaTex公式组合范式的理解,分两路分别提取数学公式中的显式特征和隐式特征,从而实现对公式知识点的深度抽取。第三层为后处理层,通过进一步调整组合词汇的综合得分,来提升知识抽取的准确性。这套方案能够自动高效地标注出试题中的知识点,从而得到试题Q矩阵,为后续学生建模提供重要依据。在实验阶段,本文选取2018-2020各地区中考数学真题(无图客观题)作为实验数据,保证了试题知识点经过专家标注、知识点均匀分布、试题难度拉开梯度、以及题型的典型性,通过对比实验验证了公式特征抽取层和后处理层对知识抽取效果的提升。2.学生建模:基于DINA假设的神经认知诊断方法(NeuralDINA)本论文第三章主要解决学生建模问题,提出的第二种方法名为基于DINA假设的神经认知诊断方法。在这一环节,本文以教育心理学领域的认知诊断理论为基础进行研究。认知诊断主要通过学生的答题记录和试题Q矩阵来推断学生的认知状况,诊断结果可以被用作教育资源推荐、学生表现预测、小组分组等后续教育应用中。传统的认知诊断模型往往由专家主观设计的交互函数来模拟学生因子与试题因子之间的交互关系,难以准确捕捉二者复杂的交互逻辑;此外,面向K12数学领域的知识数目量级较大(2000+),由于传统的诊断模型在通过MLE算法进行参数估计时,计算规模与知识数目成指数关系,可行性较低。因此,本文提出的认知诊断方法利用神经网络,直接从答题数据和Q矩阵中学习学生与试题间的交互关系,而非人工设计交互函数,并将学生因子作为模型参数进行训练,训练结束后即得到诊断结果。模型的输入为学生因子与试题因子,通过三层网络结构,输出该学生在试题上的预测得分。网络第一层基于DINA假设,引入了猜测参数和失误参数,模型后两层为全连接层。使用神经网络来训练认知诊断模型能够更加智能高效地学习出学生-试题交互函数,同时也避免了因知识属性较多造成的计算规模指数爆炸问题,大大提升模型训练效率与可行性。在实验阶段,首先通过AVG与STD统计信息验证了数据集中学生知识状态的稳定性,接下来通过模型调参确立了最佳训练参数,并将认知诊断效果评估问题转化为分类问题,用分类问题常用指标(Flscore、AUC等)来评估该方法与传统认知诊断模型的性能差异,验证了 NeuralDINA模型的有效性与优越性。3.基于神经认知诊断与知识层级约束的试题推荐方法(NeuralDINA+KHC)本论文第四章为解决试题推荐问题,提出的第三种方法名为基于神经认知诊断与知识层级约束的试题推荐方法。传统的协同过滤推荐算法具有新用户冷启动和数据稀疏的问题,应用到教育资源推荐领域可解释性较差,即无法向学生说明推荐某一试题的原因,且推荐的试题不一定对学生的知识掌握水平提升有帮助。基于认知诊断的推荐则具有较好的解释性,能够针对学生的薄弱知识点做出针对性推荐。然而学生由于答题日志有限,也难以保证诊断结果的准确性和全面覆盖性。通过稀疏日志矩阵训练出来的模型预测某试题得分较低,可能是该试题考查的知识点未被日志覆盖导致,而并非学生真的未掌握。因此,本文提出一种的试题推荐方法以第三章中训练得到的学生诊断模型为基础,预测试题得分,再通过知识属性层级约束和试题难度控制,对分数做进一步优化调整,最后引入错题库,从中随机挑选部分试题加入待推荐试题集,生成一套构成丰富、针对性强、可解释性强的试题卷。学生做题情况得到反馈后,动态更新神经认知诊断模型与错题库,以便更加准确地分析学习者的知识掌握情况,继而在学习者知识状态变化后,依然能实现后续推荐。在实验阶段,知识层级由知识图谱构建而成,通过对近2200条K12数学公理的数据挖掘,提取出2000+个数学知识实体与2700条实体间关系,并从中抽象出6种实体关系类型(包含、等价、对立、相似、属性、前驱)和3种属性层级结构(前驱知识、后继知识、等价知识)。对于推荐部分,通过五种推荐方法的对比,验证了本推荐方法的有效性、优越性、与可解释性。综上所述,本研究主要贡献在于,针对K12数学教育领域,提出了一套具备可行性与创新性的个性化试题推荐方案,分别在试题知识建模、学生建模、试题推荐这三个环节提出创新性方法设计,有效解决了推荐流程中遇到的一些细节问题,对于智慧教育的发展具备一定的研究意义。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工厂 ,原文地址:https://bishedaima.com/lunwen/53948.html