- 本文研究问题:
- 冷启动:检索解决,检索中hash
- 数据增强:蒸馏辅助
- 新问题:
- 问题方向
- OOB
- 新学生 inductive: 新框架
- 新题目:通用模型
- 冷启动:推荐系统
- 公平:数据
- 序关系:查查
- OOB
- 框架问题
- 将Transductive 转化成 inductive (trans id 表示学生,没有新学生的表示)
- 数据问题:
- 数据集
- Assist 09 数据:题目维度 17671 维,拟合难度大
- 新数据:Ednet、junyi
- 数据增强
- IDCDF 的掩码问题:
- 小数据掩码好,信息密集,掩码能防止过拟合
- 大数据掩码差,信息稀疏,掩码更难拟合
- 信息密度判断——>进行掩码
- 数据特征提取、融合、转化等:
- 题目、学生、知识点——图
- 表示分布:
- 分布,条件分布和原分布的关系
- 【技术路线】:更细化的蒸馏
- 数据集
- 指标
- DOA可解释性指标(表示但是单调性),实验补上
- 可识别 DOC
- 构造可区分指标
- 问题方向
本论文复盘:
- 数据部分:
- 新数据、统计特征,
- 本次 math 12、assist 09、17,新增 FrcSub、EdNet-1、junyi
- 题目数、学生数、知识点数、logs 数量
- 平均做题数及其方差、稀疏性 log / stu_num*item_num、平均正确率、Q 矩阵密度
- 数据理解
- Math 1&2: 信息稠密,可用于检验解决过拟合的算法
- Assist 17: 比较均衡,数据量较大,可用于检验比较深的模型
- Assist 09: 稀疏,考虑进一步数据挖掘算法(可补充图信息)
- 新数据、统计特征,
- 实验部分
- 明确所有算法的所有参数:所有可能的调参情况列好,然后再实验填写。
- Pycharm 跑多个算法的时候会出现多个项目(如 test,test(1), test(2))就把名称写在调参表里
- 补充新数据、新算法
- 论文部分:
- 英文转中文后统计字数:
- 摘要:500-600
- 引言:1200-1400
- 相关工作 (3 part,如深度哈希、认知诊断、对比学习): 1200 左右
- 注:此处参考文献较集中,可扩展:40-50 篇
- 为了文章流畅性,可调到倒数第二章(结论之前)
- 问题阐述: 1500-2000
- 算法:2000
- 实验:2500
- 大实验、消融、可视化
- 结论 500 以内
- 摘要、结论最后写
- 翻译润色
- 全文的用词要一致
- 公式用大模型转公式
- 表格转 latex:https://www.tablesgenerator.com/
- 写作 Deadline 一周内
- 英文转中文后统计字数:
- 图部分
- 整体
- PPT 做小图
- 框架图 Visio
- 图标网站:iconfont-阿里巴巴矢量图标库
- 可改颜色、大小、格式(建议 SVG)
- 配色:
- 整体
ZXVHJGI^&$*(&)