ICD
一种归纳范式:面向个性化学习者模型的可识别性和可解释性
动机:目前模型都没有解决重要的可识别性问题和可解释过拟合问题,本文提出一种可识别的认知诊断框架ID-CDF
可识别:两学生作答一致,能力应该也一致,反过来,两个学生能力不相同,他们作答数据分布也不同
可解释性过拟合:有研究增强CDM可解释性,例如单调相互作用函数[7]、参数约束[20\33]、作者发现了训练可解释性高测试可解释性低的可解释性过拟合,这是由技能-反应范式导致的(PR)
PR范式:DINA,NCDM
- 随机初始化可训练的学生能力和题目参数
- 将上述参数以及Q矩阵带入CDM中预测反应数据
- CDM 通过参数优化对学习者特征和问题参数进行传导式诊断
- 问题:只优化训练数据中的观测相应,无法捕捉整体的反应数据分布和知识状态的单调性
PRP 范式:
-
设计一个诊断模块,将反应数据编码为学生特征和问题参数
- 利用可识别性条件和单调性条件同时消除诊断优化中的随机性,从数据中捕获一般的单调性
-
使用预测模块重构响应数据
技术框架和细节
一般的符号定义
学生数量
练习题目数量
知识点数量
作答响应
完整响应数据组
学生认知状态和问题特征。
定义1:CD问题:给定响应组和Q矩阵,基于对学生表现预测过程建模挖掘学生的能力theta
定义2:CD的可识别性:
给定诊断结果集合
给定响应函数集合
为能力为 的学生 响应数据分布
为特征为 的题目 响应数据分布
学生的可识别性记作
题目可识别性记作
定义 3:CD 的可解释性
目前大多数论文都将 CD 的可解释性用单调性假设来说明了
表示任意学生 和题目 都有作答单调
ID-CDF 框架
- 对不可识别性问题,提出可识别性条件,限制响应数据和诊断结果的关系
- 对可解释性过拟合问题,提出单调性条件,捕获整体响应分数之间的单调性
请判断两句话的相似度 范例: Sent 1: 句子 1
Sent 2: 句子 2 Similarity: 0.9
现在请判断: Sent 1: “小红打小明。“
Sent 2: “小明打小红。”