GPT Image 2 在「三坑少女咖啡馆群像生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GPT Image 2
  • 用例名称:三坑少女咖啡馆群像生成
  • 测试类型:图像生成
  • 评测维度:潮流服饰

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成三位东方少女坐在咖啡馆露台喝下午茶的场景。 人物要求: - 第一位少女穿汉服 - 第二位少女穿Lolita洋装 - 第三位少女穿JK制服 - 三人围坐在同一张桌子旁

任务要求

AI 模型需要满足以下要求:

  1. 画面中有三位东方少女
  2. 三人分别穿着汉服、Lolita洋装、JK制服,服饰类型可明确区分
  3. 场景为咖啡馆露台,桌上有下午茶道具
  4. 三人围坐在同一张桌子旁,构图完整清晰

评测结果

综合得分

该模型在此用例的得分为:86.9 分(满分 100 分),已通过

基础难度评测结果

  • 得分:86.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度极高的AI生成图像,几乎完美实现了提示词的所有要求。三种服饰类型不仅可明确识别,且在细节呈现上达到专业摄影水准——汉服的飘逸感、Lolita的甜美风格、JK制服的学院气质均准确传达;咖啡馆露台场景完整且氛围浓郁,下午茶道具摆放考究;三人围坐构图自然流畅,画面清晰度高。唯一可挑剔的微小瑕疵是右侧少女裙摆局部细节在强光下略有柔化,但这不影响整体评价。该图像展现了模型在多服饰类型识别、场景构建、人物互动等综合能力上的优秀表现。 【GEMINI】这是一张在视觉表现力上尚可,但在关键提示词细节执行上存在严谨性问题的作品。模型虽然识别了三种服饰的标签,却未能处理好三种异质文化服饰在同一空间下的细节区分,导致服饰特征相互渗透。构图上的拥挤和空间逻辑的缺失是主要失分项,未能体现出“三友围坐”的和谐氛围,更多是人物的生硬堆叠。 【KIMI】整体而言,图像较好地完成了提示词要求,服饰识别准确性高,场景完整性较好,画面构图合理,清晰度较高。但在光影处理和部分细节识别上还有提升空间。

进阶难度评测结果

  • 得分:79.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在场景营造和人物互动方面表现优秀,三位少女的眼神交流与肢体动作自然生动,咖啡馆露台场景完整且氛围到位。然而,核心问题集中在服饰材质表现上:汉服的丝绸质感、Lolita的蕾丝细节、JK制服的涤纶哑光特征均未能准确呈现,三种材质的视觉区分度不足,这是提示词的核心考察点却成为最大短板。整体完成度约为75%,属于「基本完成要求但存在明显瑕疵」的水平。 【GEMINI】这是一张典型的‘各美其美、互不干扰’的AI生成图。虽然模型识别出了三种服饰的标签,但在核心的‘材质对比’和‘人物社交互动’这两个高阶要求上表现乏力。材质处理停留于表面,未能通过光影深度的差异来区分丝绸与涤纶;人物关系则完全处于离散状态,未能完成复杂的社交场景叙事。建议加强对材质高光逻辑和人物视线约束的处理。 【KIMI】这张AI生成的图像总体表现较好,基本完成了提示词的要求。三位少女的服饰类型和材质差异在视觉上有一定的区分,人物互动自然,场景完整。但在丝绸和涤纶材质的表现上还有提升空间,光影关系也需进一步优化。

困难难度评测结果

  • 得分:82.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度很高的AI生成图像,几乎完美地实现了提示词的核心要求。三种服饰类型准确且材质特征明显,侧逆光的物理逻辑表现优秀,人物互动自然生动,整体画面质量达到专业水平。唯一明显的不足是Lolita洋装蕾丝镂空处的透光效果不够突出,但这一瑕疵并未严重影响整体表现。综合来看,该图像在服饰材质区分、光影物理逻辑和人物关系表达三个核心考察点上均达到了高水平,展现了模型在复杂场景综合处理上的强大能力。 【GEMINI】这是一张在氛围营造上合格,但在物理逻辑和细节执行上存在明显短板的作品。模型在处理单一材质时表现尚可,但无法在同一画面中维持全局统一的物理光影逻辑(特别是阴影一致性)。最关键的互动要求(眼神对视)与特定材质要求(蕾丝透光)均未达成,属于典型的‘形似神散’,无法通过严格的视觉设计评审。 【KIMI】这张AI生成的图像总体上较好地完成了提示词要求,人物互动关系和整体画面质量表现尤为出色。但在服饰材质的表现上,尤其是丝绸和涤纶的材质特征,仍有提升空间。光影效果总体物理合理,但在细节处理上可以更加精细。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...