Skip to content

Latest commit

 

History

History
14 lines (12 loc) · 867 Bytes

File metadata and controls

14 lines (12 loc) · 867 Bytes
  • 是否删除离线评测?
  • 论文第三章很杂乱,需要优化;处理一下DOC里的TODO
  • 需要做一个小而美的消融实验,对于 LLM 选择实验
  • 需要能够局部重抽提取结果,就意味着需要携带整体的简要上下文和局部详细上下文
  • 只做单个文档的问答,并且在回答中渲染引用证据。
  • 转用 Deepseek 官方的API,所以实验一需要提及deepseek的能力和性价比。并且deepseek官方api支持json结构化输出,而百炼平台没有。(论文初稿可以对比)

其他

  • 定位项能否细化,比如细化到表格的每一项,而不仅仅是整个表格
  • 实验优先使用 PDF 文档,模拟真实常见场景。
  • 结构化提取功能稳定后才接 FAISS向量索引和RAG做轻量知识库问答。
  • 写毕设论文初稿
  • 用 Codex 辅助画图、PPTX生成