GPT Image 2 在「四个物体」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GPT Image 2
- 用例名称:四个物体
- 测试类型:图像生成
- 评测维度:数量控制
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
在白色背景上,画四个不同颜色的气球,分别是红色、黄色、蓝色和绿色,每个气球都有细长的绳子垂下,气球漂浮在空中,相互之间有一定间隔。
任务要求
AI 模型需要满足以下要求:
- 图像中必须恰好包含4个气球,不多不少,每个气球形态完整且清晰可辨
- 四个气球的颜色须与以下对应关系严格一致:红色1个、黄色1个、蓝色1个、绿色1个,四种颜色各出现且仅出现一次,不得串色或重复
- 四个气球均呈漂浮状态(位于画面中上部),气球之间保持明显间隔,不得发生重叠或遮挡
- 每个气球底部须有一根细长绳子垂下,共计4根绳子,绳子清晰可见
- 背景须为纯白色,不得出现渐变、纹理或其他场景元素
评测结果
综合得分
该模型在此用例的得分为:98.33 分(满分 100 分),已通过
基础难度评测结果
- 得分:98.33 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张几乎完美完成提示词要求的图像。模型准确生成了4个气球,颜色绑定精准无误(红、黄、蓝、绿各一),每个气球都配有细长绳子,背景纯白干净。空间布局合理,气球间隔清晰,漂浮感自然。唯一可挑剔的细节是黄色气球位置略低,但这不影响核心要求的达成。整体质量优秀,展现了模型在多物体生成和属性绑定方面的强大能力。
进阶难度评测结果
- 得分:89.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度很高的AI生成图像,在数量控制和空间构图上表现优秀。木质阶梯展示架的4层结构设计巧妙,每种水果各占一层且清晰可见,背景虚化的市场环境烘托得当。然而存在一个明显的属性绑定问题:葡萄的颜色偏向红紫色而非提示词要求的「紫葡萄」典型深紫色,这导致attribute_binding维度扣分较多。其他三种水果的颜色属性绑定准确,整体质量处于良好水平,但因葡萄颜色偏差未能达到优秀档次
困难难度评测结果
- 得分:74.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在氛围营造和光色设计上表现出色,四种光色差异明显、地面倒影效果良好、深夜城市天际线氛围到位。然而在核心任务「四个物体的准确生成与排列」上存在明显不足:四盏路灯排列缺乏线性秩序感,石灯笼与LED灯柱位置过于接近;复古铁艺灯与维多利亚煤气灯风格区分度不足;场景为滨水广场而非街道。综合来看,模型在氛围渲染方面能力较强,但在精确执行「多物体有序排列」和「风格精准区分」的指令上仍有明显差距。
相关链接
您可以通过以下链接查看更多相关内容: