GPT Image 2 在「三坑少女咖啡馆群像生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GPT Image 2
用例名称：三坑少女咖啡馆群像生成
测试类型：图像生成
评测维度：潮流服饰

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成三位东方少女坐在咖啡馆露台喝下午茶的场景。人物要求： - 第一位少女穿汉服 - 第二位少女穿Lolita洋装 - 第三位少女穿JK制服 - 三人围坐在同一张桌子旁

任务要求

AI 模型需要满足以下要求：

画面中有三位东方少女
三人分别穿着汉服、Lolita洋装、JK制服，服饰类型可明确区分
场景为咖啡馆露台，桌上有下午茶道具
三人围坐在同一张桌子旁，构图完整清晰

评测结果

综合得分

该模型在此用例的得分为：86.9 分（满分 100 分），已通过

基础难度评测结果

得分：86.9 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张完成度极高的AI生成图像，几乎完美实现了提示词的所有要求。三种服饰类型不仅可明确识别，且在细节呈现上达到专业摄影水准——汉服的飘逸感、Lolita的甜美风格、JK制服的学院气质均准确传达；咖啡馆露台场景完整且氛围浓郁，下午茶道具摆放考究；三人围坐构图自然流畅，画面清晰度高。唯一可挑剔的微小瑕疵是右侧少女裙摆局部细节在强光下略有柔化，但这不影响整体评价。该图像展现了模型在多服饰类型识别、场景构建、人物互动等综合能力上的优秀表现。【GEMINI】这是一张在视觉表现力上尚可，但在关键提示词细节执行上存在严谨性问题的作品。模型虽然识别了三种服饰的标签，却未能处理好三种异质文化服饰在同一空间下的细节区分，导致服饰特征相互渗透。构图上的拥挤和空间逻辑的缺失是主要失分项，未能体现出“三友围坐”的和谐氛围，更多是人物的生硬堆叠。【KIMI】整体而言，图像较好地完成了提示词要求，服饰识别准确性高，场景完整性较好，画面构图合理，清晰度较高。但在光影处理和部分细节识别上还有提升空间。

进阶难度评测结果

得分：79.2 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像在场景营造和人物互动方面表现优秀，三位少女的眼神交流与肢体动作自然生动，咖啡馆露台场景完整且氛围到位。然而，核心问题集中在服饰材质表现上：汉服的丝绸质感、Lolita的蕾丝细节、JK制服的涤纶哑光特征均未能准确呈现，三种材质的视觉区分度不足，这是提示词的核心考察点却成为最大短板。整体完成度约为75%，属于「基本完成要求但存在明显瑕疵」的水平。【GEMINI】这是一张典型的‘各美其美、互不干扰’的AI生成图。虽然模型识别出了三种服饰的标签，但在核心的‘材质对比’和‘人物社交互动’这两个高阶要求上表现乏力。材质处理停留于表面，未能通过光影深度的差异来区分丝绸与涤纶；人物关系则完全处于离散状态，未能完成复杂的社交场景叙事。建议加强对材质高光逻辑和人物视线约束的处理。【KIMI】这张AI生成的图像总体表现较好，基本完成了提示词的要求。三位少女的服饰类型和材质差异在视觉上有一定的区分，人物互动自然，场景完整。但在丝绸和涤纶材质的表现上还有提升空间，光影关系也需进一步优化。

困难难度评测结果

得分：82.8 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张完成度很高的AI生成图像，几乎完美地实现了提示词的核心要求。三种服饰类型准确且材质特征明显，侧逆光的物理逻辑表现优秀，人物互动自然生动，整体画面质量达到专业水平。唯一明显的不足是Lolita洋装蕾丝镂空处的透光效果不够突出，但这一瑕疵并未严重影响整体表现。综合来看，该图像在服饰材质区分、光影物理逻辑和人物关系表达三个核心考察点上均达到了高水平，展现了模型在复杂场景综合处理上的强大能力。【GEMINI】这是一张在氛围营造上合格，但在物理逻辑和细节执行上存在明显短板的作品。模型在处理单一材质时表现尚可，但无法在同一画面中维持全局统一的物理光影逻辑（特别是阴影一致性）。最关键的互动要求（眼神对视）与特定材质要求（蕾丝透光）均未达成，属于典型的‘形似神散’，无法通过严格的视觉设计评审。【KIMI】这张AI生成的图像总体上较好地完成了提示词要求，人物互动关系和整体画面质量表现尤为出色。但在服饰材质的表现上，尤其是丝绸和涤纶的材质特征，仍有提升空间。光影效果总体物理合理，但在细节处理上可以更加精细。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题