ICD

一种归纳范式:面向个性化学习者模型的可识别性和可解释性

动机:目前模型都没有解决重要的可识别性问题和可解释过拟合问题,本文提出一种可识别的认知诊断框架ID-CDF

可识别:两学生作答一致,能力应该也一致,反过来,两个学生能力不相同,他们作答数据分布也不同

可解释性过拟合:有研究增强CDM可解释性,例如单调相互作用函数[7]、参数约束[20\33]、作者发现了训练可解释性高测试可解释性低的可解释性过拟合,这是由技能-反应范式导致的(PR)

PR范式:DINA,NCDM

  • 随机初始化可训练的学生能力和题目参数
  • 将上述参数以及Q矩阵带入CDM中预测反应数据
  • CDM 通过参数优化对学习者特征和问题参数进行传导式诊断
  • 问题:只优化训练数据中的观测相应,无法捕捉整体的反应数据分布和知识状态的单调性

PRP 范式:

  • 设计一个诊断模块,将反应数据编码为学生特征和问题参数

    • 利用可识别性条件和单调性条件同时消除诊断优化中的随机性,从数据中捕获一般的单调性
  • 使用预测模块重构响应数据

技术框架和细节

一般的符号定义

学生数量

练习题目数量

知识点数量

作答响应

完整响应数据组

学生认知状态和问题特征

定义1:CD问题:给定响应组和Q矩阵,基于对学生表现预测过程建模挖掘学生的能力theta

定义2:CD的可识别性:

给定诊断结果集合

给定响应函数集合

为能力为 的学生 响应数据分布

为特征为 的题目 响应数据分布

学生的可识别性记作

题目可识别性记作

定义 3:CD 的可解释性

目前大多数论文都将 CD 的可解释性用单调性假设来说明了

表示任意学生 和题目 都有作答单调

ID-CDF 框架

  • 对不可识别性问题,提出可识别性条件,限制响应数据和诊断结果的关系
  • 对可解释性过拟合问题,提出单调性条件,捕获整体响应分数之间的单调性

请判断两句话的相似度 范例: Sent 1: 句子 1
Sent 2: 句子 2 Similarity: 0.9

现在请判断: Sent 1: “小红打小明。“
Sent 2: “小明打小红。”