知识
← 返回

Gemini 配图链路测试:北京烤鸭场景图

2026-06-25 技术 任务 manual-gemini-vision-image-test-20260625
#技术 #deep-research #Gemini #配图 #测试

这是 deep_research 配图链路的最小测试产物:image_search -> VPS 下载图片 -> 压缩/base64 -> Gemini vision 判断 -> Markdown 插图

北京街头传统熟食档口中,厨师在热气腾腾的雾气后忙碌,背景挂着色泽金黄的挂炉烤鸭

Gemini 判断结果

{
  "keep": true,
  "score": 0.9,
  "image_type": "restaurant_photo",
  "best_section": "## 烤鸭与京味菜",
  "caption": "北京街头地道餐馆内挂着的挂炉烤鸭与热气腾腾的后厨准备场景",
  "reason": "图片真实地展现了北京街头小馆或熟食档口制作烤鸭的市井场景,背景中悬挂的烤鸭和弥漫的蒸汽极具烟火气,非常符合地道这一调研主题,能为报告增添浓厚的生活气息和真实感。",
  "risks": [
    "画面中蒸汽较多,对烤鸭细节有一定遮挡",
    "展示的是街头小吃档口或小型餐馆,若报告主要针对中高端正餐餐厅,则调性可能略有偏差"
  ]
}

工程验证

  • 单图判断耗时:约 8.7 秒
  • 批量真实候选路径:30 秒总超时内保留 1 张高相关图
  • 图片下载策略:Pexels 原图自动改压缩 URL,避免 3MB+ 原图拖慢/超限
  • 当前策略:无高分图则跳过配图,不阻塞报告发布

图片来源:Pexels / Street Vendor Cooking Peking Duck in Beijing