Skip to content

todo: 收口 Gemini image/video 媒体输出提取链路 #8

@youyao666

Description

@youyao666

背景:PR #7 已完成多模态输入链路与抓包分析工具接入,但 image/video 媒体输出提取链路仍不稳定。

目标:将 image/video 从 wrb.fr payload 到最终 chat 输出的链路收口并稳定化。

TODO

  • 稳定解析 wrb.fr payload 中 image/video 媒体节点(覆盖不同响应形态)
  • 补齐媒体提取去重策略(URL / data URI / mime+base64)
  • 明确 /v1/chat/completions 媒体输出规范(markdown/url/base64)
  • 补齐流式场景下媒体终态处理与回归测试
  • 增加 2~3 组真实抓包样本作为回归基线

验收标准

  1. 非流式请求可稳定提取并输出图片/视频
  2. 流式请求可在终态稳定输出媒体内容
  3. 至少 2 组真实抓包样本回归通过
  4. 输出格式策略(markdown/url/base64)有明确约定

关联:PR #7

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions