• 本文研究问题:
    • 冷启动:检索解决,检索中hash
    • 数据增强:蒸馏辅助
  • 新问题:
    • 问题方向
      • OOB
        • 新学生 inductive: 新框架
        • 新题目:通用模型
      • 冷启动:推荐系统
      • 公平:数据
      • 序关系:查查
    • 框架问题
      • 将Transductive 转化成 inductive (trans id 表示学生,没有新学生的表示)
    • 数据问题:
      • 数据集
        • Assist 09 数据:题目维度 17671 维,拟合难度大
        • 新数据:Ednet、junyi
      • 数据增强
        • IDCDF 的掩码问题:
        • 小数据掩码好,信息密集,掩码能防止过拟合
        • 大数据掩码差,信息稀疏,掩码更难拟合
        • 信息密度判断——>进行掩码
      • 数据特征提取、融合、转化等:
        • 题目、学生、知识点——图
      • 表示分布:
        • 分布,条件分布和原分布的关系
        • 【技术路线】:更细化的蒸馏
    • 指标
      • DOA可解释性指标(表示但是单调性),实验补上
      • 可识别 DOC
      • 构造可区分指标

本论文复盘:

  • 数据部分:
    • 新数据、统计特征,
      • 本次 math 12、assist 09、17,新增 FrcSub、EdNet-1、junyi
      • 题目数、学生数、知识点数、logs 数量
      • 平均做题数及其方差、稀疏性 log / stu_num*item_num、平均正确率、Q 矩阵密度
    • 数据理解
      • Math 1&2: 信息稠密,可用于检验解决过拟合的算法
      • Assist 17: 比较均衡,数据量较大,可用于检验比较深的模型
      • Assist 09: 稀疏,考虑进一步数据挖掘算法(可补充图信息)
  • 实验部分
    • 明确所有算法的所有参数:所有可能的调参情况列好,然后再实验填写。
    • Pycharm 跑多个算法的时候会出现多个项目(如 test,test(1), test(2))就把名称写在调参表里
    • 补充新数据、新算法
  • 论文部分:
    • 英文转中文后统计字数:
      • 摘要:500-600
      • 引言:1200-1400
      • 相关工作 (3 part,如深度哈希、认知诊断、对比学习): 1200 左右
        • 注:此处参考文献较集中,可扩展:40-50 篇
        • 为了文章流畅性,可调到倒数第二章(结论之前)
      • 问题阐述: 1500-2000
      • 算法:2000
      • 实验:2500
        • 大实验、消融、可视化
      • 结论 500 以内
    • 摘要、结论最后写
    • 翻译润色
      • 全文的用词要一致
    • 公式用大模型转公式
    • 表格转 latex:https://www.tablesgenerator.com/
    • 写作 Deadline 一周内
  • 图部分

ZXVHJGI^&$*(&)