GPT Image 2 在「互动动作」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GPT Image 2
- 用例名称:互动动作
- 测试类型:图像生成
- 评测维度:动作表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一位母亲正在教小女儿骑自行车,母亲双手扶着车座后面,身体前倾,正在小跑着推动自行车。小女儿双手握住车把,双脚踩在踏板上,身体略显紧张但充满期待。画面要体现出母亲推动的动作和女儿学习平衡的姿态。
任务要求
AI 模型需要满足以下要求:
- 母亲双手扶住自行车车座后方(非车架、非车把),手部接触位置清晰可辨
- 母亲身体明显前倾,重心向前,呈现出推动自行车前行的动态姿势
- 小女儿双手握住车把,手部与车把存在明确的接触关系
- 小女儿双脚踩在踏板上,脚与踏板接触合理,无明显悬空
- 母亲位于自行车正后方,女儿坐于车座上,两人空间位置关系符合骑车教学场景
- 画面整体传达出母亲推行中的动势与女儿学习平衡时的紧张期待感,体现教学互动关系
评测结果
综合得分
该模型在此用例的得分为:72.5 分(满分 100 分),已通过
基础难度评测结果
- 得分:72.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像基本还原了母亲教女儿骑车的教学场景,动态感和情感表达较为到位,但在核心动作准确性上存在明显缺陷:母亲左手扶持位置偏离提示词要求(应扶车座后方,实际扶在车架中部),这一错误直接影响了关键动作的完成度和互动逻辑的合理性。女儿部分表现良好,整体画面具有一定叙事性,但因核心动作偏差导致未能完全满足提示词要求。 【GEMINI】这是一张在视觉氛围上合格但在细节逻辑上存在多处硬伤的图像。模型虽然理解了‘教学骑车’的大场景,但在处理复杂的肢体接触(手扶车座)和精细动作(脚踩踏板)时出现了典型的AI构图崩坏。特别是未严格执行‘双手扶车座’这一核心指令,且物理穿模问题严重,无法满足高质量视觉叙事的要求。 【KIMI】整体而言,这张AI生成的图像较好地完成了提示词要求,人物动作和互动接触逻辑都表现不错,但在动态感和教学叙事方面还有提升空间。
进阶难度评测结果
- 得分:84.25 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在主体完整性和解剖学准确性方面表现优秀,成功生成了三位舞者的复杂互动场景且人体结构合理。中间舞者的动作还原堪称完美。然而,左侧舞者的手臂方向与提示词要求完全相反(向后而非向前),这是最严重的失误,直接导致动作准确性维度大幅扣分,并连带影响了视觉连线的流畅度。此外,画面整体动感略显不足,未能充分传达现代舞瞬间抓拍的爆发力。综合来看,这是一张完成度较高但存在关键细节偏差的作品,若修正左侧舞者手臂方向,分数可提升至90分以上。
困难难度评测结果
- 得分:76.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像在场景氛围营造和环境细节方面表现较好,成功呈现了拥挤地铁站的真实感,旁观者群体的反应动作也具有叙事层次。然而,图像在最核心的要求上存在明显失误:男士并未处于「跨越车门」的关键瞬间,而是仍在站台侧奔跑冲向车门;地铁门未呈现关闭状态;且整张图像缺乏任何运动模糊等动感视觉处理,使画面偏向静态定格而非动态瞬间。这些核心叙事要素的缺失使图像与提示词的精确要求存在较大差距,属于「部分完成要求」的水平。 【GEMINI】这是一张在视觉冲击力上合格、但在物理逻辑与深度互动上存在明显短板的图像。模型在处理单一主体的动态美学时表现优秀,但在处理‘人与环境’、‘人与人’的复杂空间交互时,未能准确执行提示词中的逻辑指令,尤其是门缝跨越的物理真实性不足,导致画面经不起摄影专业视角的推敲。 【KIMI】整体而言,图像较好地完成了提示词要求,但在动态姿势的紧张感表现、乘客动作的自然性以及运动模糊效果上还有提升空间。
相关链接
您可以通过以下链接查看更多相关内容: