GPT Image 2 在「互动动作」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GPT Image 2
用例名称：互动动作
测试类型：图像生成
评测维度：动作表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：一位母亲正在教小女儿骑自行车，母亲双手扶着车座后面，身体前倾，正在小跑着推动自行车。小女儿双手握住车把，双脚踩在踏板上，身体略显紧张但充满期待。画面要体现出母亲推动的动作和女儿学习平衡的姿态。

任务要求

AI 模型需要满足以下要求：

母亲双手扶住自行车车座后方（非车架、非车把），手部接触位置清晰可辨
母亲身体明显前倾，重心向前，呈现出推动自行车前行的动态姿势
小女儿双手握住车把，手部与车把存在明确的接触关系
小女儿双脚踩在踏板上，脚与踏板接触合理，无明显悬空
母亲位于自行车正后方，女儿坐于车座上，两人空间位置关系符合骑车教学场景
画面整体传达出母亲推行中的动势与女儿学习平衡时的紧张期待感，体现教学互动关系

评测结果

综合得分

该模型在此用例的得分为：72.5 分（满分 100 分），已通过

基础难度评测结果

得分：72.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】图像基本还原了母亲教女儿骑车的教学场景，动态感和情感表达较为到位，但在核心动作准确性上存在明显缺陷：母亲左手扶持位置偏离提示词要求（应扶车座后方，实际扶在车架中部），这一错误直接影响了关键动作的完成度和互动逻辑的合理性。女儿部分表现良好，整体画面具有一定叙事性，但因核心动作偏差导致未能完全满足提示词要求。【GEMINI】这是一张在视觉氛围上合格但在细节逻辑上存在多处硬伤的图像。模型虽然理解了‘教学骑车’的大场景，但在处理复杂的肢体接触（手扶车座）和精细动作（脚踩踏板）时出现了典型的AI构图崩坏。特别是未严格执行‘双手扶车座’这一核心指令，且物理穿模问题严重，无法满足高质量视觉叙事的要求。【KIMI】整体而言，这张AI生成的图像较好地完成了提示词要求，人物动作和互动接触逻辑都表现不错，但在动态感和教学叙事方面还有提升空间。

进阶难度评测结果

得分：84.25 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在主体完整性和解剖学准确性方面表现优秀，成功生成了三位舞者的复杂互动场景且人体结构合理。中间舞者的动作还原堪称完美。然而，左侧舞者的手臂方向与提示词要求完全相反（向后而非向前），这是最严重的失误，直接导致动作准确性维度大幅扣分，并连带影响了视觉连线的流畅度。此外，画面整体动感略显不足，未能充分传达现代舞瞬间抓拍的爆发力。综合来看，这是一张完成度较高但存在关键细节偏差的作品，若修正左侧舞者手臂方向，分数可提升至90分以上。

困难难度评测结果

得分：76.1 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张AI生成图像在场景氛围营造和环境细节方面表现较好，成功呈现了拥挤地铁站的真实感，旁观者群体的反应动作也具有叙事层次。然而，图像在最核心的要求上存在明显失误：男士并未处于「跨越车门」的关键瞬间，而是仍在站台侧奔跑冲向车门；地铁门未呈现关闭状态；且整张图像缺乏任何运动模糊等动感视觉处理，使画面偏向静态定格而非动态瞬间。这些核心叙事要素的缺失使图像与提示词的精确要求存在较大差距，属于「部分完成要求」的水平。【GEMINI】这是一张在视觉冲击力上合格、但在物理逻辑与深度互动上存在明显短板的图像。模型在处理单一主体的动态美学时表现优秀，但在处理‘人与环境’、‘人与人’的复杂空间交互时，未能准确执行提示词中的逻辑指令，尤其是门缝跨越的物理真实性不足，导致画面经不起摄影专业视角的推敲。【KIMI】整体而言，图像较好地完成了提示词要求，但在动态姿势的紧张感表现、乘客动作的自然性以及运动模糊效果上还有提升空间。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题