GPT Image 2 在「互动动作」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GPT Image 2
  • 用例名称:互动动作
  • 测试类型:图像生成
  • 评测维度:动作表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:一位母亲正在教小女儿骑自行车,母亲双手扶着车座后面,身体前倾,正在小跑着推动自行车。小女儿双手握住车把,双脚踩在踏板上,身体略显紧张但充满期待。画面要体现出母亲推动的动作和女儿学习平衡的姿态。

任务要求

AI 模型需要满足以下要求:

  1. 母亲双手扶住自行车车座后方(非车架、非车把),手部接触位置清晰可辨
  2. 母亲身体明显前倾,重心向前,呈现出推动自行车前行的动态姿势
  3. 小女儿双手握住车把,手部与车把存在明确的接触关系
  4. 小女儿双脚踩在踏板上,脚与踏板接触合理,无明显悬空
  5. 母亲位于自行车正后方,女儿坐于车座上,两人空间位置关系符合骑车教学场景
  6. 画面整体传达出母亲推行中的动势与女儿学习平衡时的紧张期待感,体现教学互动关系

评测结果

综合得分

该模型在此用例的得分为:72.5 分(满分 100 分),已通过

基础难度评测结果

  • 得分:72.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像基本还原了母亲教女儿骑车的教学场景,动态感和情感表达较为到位,但在核心动作准确性上存在明显缺陷:母亲左手扶持位置偏离提示词要求(应扶车座后方,实际扶在车架中部),这一错误直接影响了关键动作的完成度和互动逻辑的合理性。女儿部分表现良好,整体画面具有一定叙事性,但因核心动作偏差导致未能完全满足提示词要求。 【GEMINI】这是一张在视觉氛围上合格但在细节逻辑上存在多处硬伤的图像。模型虽然理解了‘教学骑车’的大场景,但在处理复杂的肢体接触(手扶车座)和精细动作(脚踩踏板)时出现了典型的AI构图崩坏。特别是未严格执行‘双手扶车座’这一核心指令,且物理穿模问题严重,无法满足高质量视觉叙事的要求。 【KIMI】整体而言,这张AI生成的图像较好地完成了提示词要求,人物动作和互动接触逻辑都表现不错,但在动态感和教学叙事方面还有提升空间。

进阶难度评测结果

  • 得分:84.25 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在主体完整性和解剖学准确性方面表现优秀,成功生成了三位舞者的复杂互动场景且人体结构合理。中间舞者的动作还原堪称完美。然而,左侧舞者的手臂方向与提示词要求完全相反(向后而非向前),这是最严重的失误,直接导致动作准确性维度大幅扣分,并连带影响了视觉连线的流畅度。此外,画面整体动感略显不足,未能充分传达现代舞瞬间抓拍的爆发力。综合来看,这是一张完成度较高但存在关键细节偏差的作品,若修正左侧舞者手臂方向,分数可提升至90分以上。

困难难度评测结果

  • 得分:76.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像在场景氛围营造和环境细节方面表现较好,成功呈现了拥挤地铁站的真实感,旁观者群体的反应动作也具有叙事层次。然而,图像在最核心的要求上存在明显失误:男士并未处于「跨越车门」的关键瞬间,而是仍在站台侧奔跑冲向车门;地铁门未呈现关闭状态;且整张图像缺乏任何运动模糊等动感视觉处理,使画面偏向静态定格而非动态瞬间。这些核心叙事要素的缺失使图像与提示词的精确要求存在较大差距,属于「部分完成要求」的水平。 【GEMINI】这是一张在视觉冲击力上合格、但在物理逻辑与深度互动上存在明显短板的图像。模型在处理单一主体的动态美学时表现优秀,但在处理‘人与环境’、‘人与人’的复杂空间交互时,未能准确执行提示词中的逻辑指令,尤其是门缝跨越的物理真实性不足,导致画面经不起摄影专业视角的推敲。 【KIMI】整体而言,图像较好地完成了提示词要求,但在动态姿势的紧张感表现、乘客动作的自然性以及运动模糊效果上还有提升空间。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...