- 是否删除离线评测?
- 论文第三章很杂乱,需要优化;处理一下DOC里的TODO
- 需要做一个小而美的消融实验,对于 LLM 选择实验
- 需要能够局部重抽提取结果,就意味着需要携带整体的简要上下文和局部详细上下文
- 只做单个文档的问答,并且在回答中渲染引用证据。
- 转用 Deepseek 官方的API,所以实验一需要提及deepseek的能力和性价比。并且deepseek官方api支持json结构化输出,而百炼平台没有。(论文初稿可以对比)
- 定位项能否细化,比如细化到表格的每一项,而不仅仅是整个表格
- 实验优先使用 PDF 文档,模拟真实常见场景。
- 结构化提取功能稳定后才接 FAISS向量索引和RAG做轻量知识库问答。
- 写毕设论文初稿
- 用 Codex 辅助画图、PPTX生成