Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「日常动作」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
- 用例名称:日常动作
- 测试类型:图像生成
- 评测维度:动作表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一个小女孩在公园里跳绳,双脚离地,绳子在头顶上方形成弧线,马尾辫随着跳跃动作在空中飞扬,穿着运动服和运动鞋,阳光明媚的下午。
任务要求
AI 模型需要满足以下要求:
- 小女孩双脚完全离地,呈现清晰的跳跃腾空瞬间,膝关节与踝关节角度符合跳绳起跳动作的解剖学逻辑。
- 跳绳绳子在小女孩头顶上方形成完整弧线,弧线走向与双手握绳位置透视一致,体现甩绳的惯性与速度感。
- 马尾辫因跳跃动作产生明显飞扬效果,飘动方向与跳跃动态相符,发丝层次自然。
- 小女孩穿着可辨认的运动服(上衣+下装)及运动鞋,服装细节清晰且符合运动场景。
- 背景呈现公园环境元素(如草地、树木等),整体光线明亮温暖,符合阳光明媚的下午氛围,人物与背景光影融合自然。
评测结果
综合得分
该模型在此用例的得分为:89.4 分(满分 100 分),已通过
基础难度评测结果
- 得分:89.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一个阳光明媚的午后,一名约八九岁的亚洲小女孩正在公园的草坪上欢快地跳绳。她穿着一件蓝绿相间的运动短袖、灰色运动短裤和一双亮橘色的运动鞋,扎着高马尾,头发随着跳跃动作在空中飞扬,脸上洋溢着灿烂的笑容。背景是郁郁葱葱的树木和散步的行人,光影柔和,充满活力。 然而,这张 AI 生成的图片存在几处明显的逻辑和解剖学缺陷:首先,跳绳的绳索结构异常,绳子并没有穿过小女孩的脚底,而是诡异地消失在她的腿部后方,且绳索在空中的弧度与手柄的连接处并不自然。其次,小女孩的双手抓握姿势生硬,手指轮廓模糊且数量异常。最明显的错误在于她的右脚,运动鞋的鞋头方向与腿部的扭转角度完全不符合人体构造,呈现出一种扭曲的状态。此外,背景中的行人身体比例也略显失真。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度极高的 AI 生成图像,几乎完美地实现了提示词的所有要求。小女孩跳绳动作的解剖学准确性、跳绳与马尾辫的动态物理真实性、以及公园场景的语义一致性均表现优秀。画面捕捉到了跳绳运动中双脚离地的腾空瞬间,绳子弧线流畅,马尾辫飞扬自然,服装细节清晰,公园环境元素丰富,光影氛围温暖明亮。唯一的微小瑕疵在于绳子弧线和肢体姿态略显完美对称,真实场景中可能会有更多微妙的不对称变化,但这并不影响整体的高质量表现。总体而言,这张图像在动作捕捉、物理真实性和场景呈现方面均达到了专业水准。 【GEMINI】这是一张高质量的 AI 生成图像,完美捕捉了运动瞬间。人物动态、环境光影和服装细节都达到了专业摄影水准。唯一的明显瑕疵在于跳绳器材的物理连接逻辑,这在精细观察下会暴露 AI 生成的痕迹。整体视觉冲击力和主题表达非常出色。 【KIMI】这张AI生成的图像在小女孩跳绳动作的人体解剖学准确性、跳绳绳子和马尾辫的物理真实性以及画面整体语义一致性方面都表现得非常出色,基本完成了提示词的要求。小女孩的跳跃姿态自然流畅,跳绳绳子的弧线和马尾辫的飞扬效果增强了画面的动态感。背景环境元素丰富,整体氛围明亮温暖,符合阳光明媚的下午。唯一可以改进的地方是光影融合还可以更自然一些。总体来说,这是一张高质量的AI生成图像。
进阶难度评测结果
- 得分:83.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个现代办公大楼的大堂,一名身穿深蓝色西装、手提棕色公文包的商务男士正神色慌张地冲向电梯。他身体前倾,领带随风飘起,右手正急促地按下电梯按钮。背景中有几位身着正装的同事,正露出惊讶和张开嘴巴的夸张表情。画面色调偏冷,以灰色的大理石地面和玻璃幕墙为主,营造出一种忙碌且紧张的职场氛围。 然而,画面中存在多处明显的 AI 生成缺陷:最显著的是奔跑男士的左腿,其大腿部分异常缺失,小腿像是直接从臀部下方长出,导致人体结构严重畸形;他按电梯的右手手指显得模糊且比例失调。背景中左侧惊讶的女士,其右手握持手机的姿势非常生硬,手指融合在一起。此外,电梯门上的文字“LOBBY - B1”虽然清晰,但电梯内部的透视关系与外部空间略显不协调,整体呈现出一种超现实的混乱感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像整体质量较高,人物动态感强烈,旁观者反应生动,现代化大厅环境完整。然而,图像未能实现提示词中最核心的语义要求——「一只脚跨进电梯门、另一只脚在外面」的卡门瞬间,以及「电梯门即将关闭」的状态。图中呈现的是人物在电梯门外奔跑并伸手按按钮的场景,而非跨越关闭中电梯门的瞬间。这一核心语义偏差使得scene_composition_consistency维度得分较低,但其他维度表现优秀,整体仍属于「基本完成要求但存在关键瑕疵」的水平。 【GEMINI】这是一张高质量的 AI 生成图像,精准捕捉了提示词中的‘卡门’瞬间。画面叙事性极强,物理动态逻辑基本合理。主要的失分项在于 AI 常见的肢体末端(手指)处理问题,以及极端动作下的关节透视微调。整体而言,非常成功地完成了测试任务。 【KIMI】图像整体表现良好,人物动作和场景构图符合提示词要求,动态物理真实性略有不足,但不影响整体质量。
困难难度评测结果
- 得分:84.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一个充满活力的室外街头篮球场场景。画面中心,一名身穿蓝色、橙色相间球衣的非裔男子正高高跃起,准备进行单手扣篮。他肌肉线条分明,神情专注。球场背景是典型的城市住宅楼,四周铁丝网外围满了欢呼喝彩的观众,气氛热烈。阳光从侧面照射,光影对比强烈。 然而,画面中存在多处明显的 AI 生成缺陷:最显著的是扣篮者的右手,手指数量异常且扭曲,与篮球的接触方式不符合物理逻辑。左侧身穿黑色 23 号球衣的防守者,其举起的左手手指也呈现出混乱的重叠状。背景中的观众面部特征模糊或扭曲,部分人的肢体动作生硬且比例失调。此外,篮板的透视结构略显单薄,与篮筐的连接处缺乏真实的金属质感。尽管色彩鲜艳、动感十足,但这些细节处的逻辑错误揭示了其 AI 生成的本质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度较高的街头篮球扣篮场景图像,在人体解剖准确性、场景叙事一致性方面表现优秀,双腿剪刀状分开的动态张力、汗水反光效果、背景人物神态等细节到位。但存在两处明显不足:一是主体球员躯干未呈现360度转身扣篮所需的旋转扭转状态,更像是直线起跳的单手扣篮;二是篮球架完全未呈现提示词要求的弹性形变。这两处缺失导致图像未能完全满足提示词的核心要求,尤其是「360度转身扣篮」这一关键动作特征的缺失较为明显 【GEMINI】这是一张视觉冲击力极强的作品,在动作构图和氛围营造上达到了极高水准。主体球员的‘剪刀腿’和‘躯干扭转’完全符合专业摄影审美。然而,在微观物理特性(汗水反光、器材形变)上略显欠缺,且手部细节存在轻微的AI瑕疵,未能完全达成‘完美物理真实’的要求。 【KIMI】图像整体表现优秀,符合提示词要求,动作和物理真实性表现突出,但背景球员的视线焦点略有偏差。
相关链接
您可以通过以下链接查看更多相关内容: