Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「简单动作」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
- 用例名称:简单动作
- 测试类型:图像生成
- 评测维度:动作表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一个小男孩正在客厅里跳跃,双脚离地,双臂向上高举,脸上露出兴奋的表情。他穿着蓝色T恤和短裤,背景是简洁的白色墙壁和木地板。
任务要求
AI 模型需要满足以下要求:
- 画面中必须呈现一名小男孩(单一人物),双脚同时明显离地,脚底与地面之间有可见间距,清晰表现跳跃瞬间的腾空状态
- 双臂须向上高举,手臂抬起高度至少达到肩部以上,整体姿势与跳跃动作协调一致,符合自然跳跃时的肢体运动规律
- 面部须呈现兴奋、喜悦的表情(如张嘴大笑、眼睛睁大等),表情与跳跃动作的活力感相匹配
- 人体结构须完整正确:四肢数量正确,各关节(肘、膝、踝)弯曲方向符合生理学逻辑,无多余肢体、断肢或明显比例失调
- 人物须穿着蓝色T恤和短裤,服装颜色与描述一致,无明显颜色偏差
- 背景须为简洁的室内环境,包含白色(或浅色)墙壁与木质地板,背景元素简洁,不干扰主体人物的视觉呈现
评测结果
综合得分
该模型在此用例的得分为:91.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:91.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度极高的AI生成图像,几乎完美地实现了提示词的所有核心要求。跳跃动作的准确性、人体结构的合理性、服装颜色的一致性均表现出色,面部表情生动传神,整体画面自然真实。唯一可改进之处在于背景环境略显丰富,若能进一步简化背景元素(减少家具装饰),将更贴合「简洁」的要求。综合来看,这是一张高质量的生成作品,成功捕捉了儿童跳跃瞬间的活力与喜悦 【GEMINI】图像在动作还原和视觉风格上表现卓越,完美捕捉了‘兴奋跳跃’的瞬间。背景简洁,色彩准确。然而,AI在处理末端肢体(脚趾和手指)时出现了典型的解剖学错误,这在写实风格下较为刺眼,影响了整体的严谨性。 【KIMI】图像整体表现优秀,人物的跳跃动作、人体结构和服装颜色都符合提示词要求,背景环境简洁,不干扰主体人物的视觉呈现。光影效果略显不足,但不影响整体质量。
进阶难度评测结果
- 得分:82.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一位芭蕾舞女演员在宏伟剧院舞台上翩翩起舞的瞬间。画面中心,舞者身着精致的粉红色蕾丝芭蕾舞裙,正单脚脚尖伫立在木质地板上,双臂向两侧优雅舒展,另一条腿向斜上方抬起,姿态轻盈优美。背景是深邃且略显模糊的观众席,暖黄色的舞台灯光从上方和侧面打下,为舞者镀上了一层柔和的光晕,营造出梦幻的表演氛围。然而,画面中存在明显的 AI 生成缺陷:舞者的右手手指线条混乱,呈现出不自然的扭曲和多余的关节;左脚足尖鞋与地面的接触点透视异常,阴影处理略显生硬;此外,背景中远处的观众面部细节缺失,呈现出扭曲的色块。尽管如此,整体构图平衡,色彩温润,捕捉到了舞蹈艺术的动感与张力。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像整体质量较高,成功呈现了芭蕾舞者在舞台上表演的场景,服装、场景、人体结构等方面表现优秀。然而,图像在最核心的动作要求上存在明显偏差:提示词明确要求右腿「向后高高抬起与地面平行」(约90度),但图中右腿仅抬起约45-60度,这使得动作更接近低位阿拉贝斯克而非标准高位阿拉贝斯克。这一偏差是影响整体评分的主要因素。场景细节和人体结构方面表现出色,若腿部高度能达到要求,整体评分将显著提升。 【GEMINI】这是一张高质量的AI生成图像,成功完成了较为复杂的芭蕾舞专业动作描述。在动作标准度和场景氛围感上表现优异。唯一的遗憾在于手部细节和足尖支撑点的微观结构处理上,这也是目前AI生成人体时常见的瑕疵点。 【KIMI】图像整体表现优秀,舞者的动作标准,人体结构正确,舞台环境和服装细节也表现良好。
困难难度评测结果
- 得分:83.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个充满活力的户外街头篮球比赛场景。画面中央,一名身穿红色 8 号球衣和黑色短裤的非裔球员正高高跃起准备扣篮,他肌肉线条分明,单手托球,姿态极具爆发力。两名身穿蓝色球衣的防守球员正举手试图封盖。背景是充满生活气息的城市建筑和铁丝网围栏,大批观众围在场边,有的在欢呼,有的正举着手机拍摄。阳光从侧后方射入,为球员轮廓镀上了一层金边,营造出热烈的黄昏氛围。 然而,画面中存在多处明显的 AI 生成缺陷:首先,最显眼的是防守球员的手部,左侧蓝衣球员举起的右手手指数量异常且扭曲;其次,扣篮球员的左手手指显得过长且关节僵硬;背景中的观众面部特征模糊或扭曲,部分人的肢体与躯干连接不自然;此外,篮筐的结构与篮网的透视关系也略显生硬,右下角拍摄者的手部和手机比例也存在透视异常。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张整体质量较高的街头篮球扣篮场景图像,成功捕捉了街头篮球的动态张力和现场氛围。图像在人体结构准确性、运动细节呈现(汗水高光)、现场氛围营造(观众举手机拍照)等方面表现出色,空间层次清晰,光影效果真实统一。然而存在一个关键性问题:左手未接触篮筐边缘,与提示词明确要求的「左手扶着篮筐边缘」不符,这是扣篮动作描述中的核心细节,直接影响了动作准确性维度的得分。除此之外,图像在其他方面基本完成了提示词的要求,特别是在氛围营造和细节真实感方面表现优异 【GEMINI】这是一幅视觉冲击力极强的AI生成作品,在动作设计和氛围营造上达到了专业摄影水准。主要球员的扣篮姿态完全符合运动生理学和题目要求。然而,AI在处理复杂手部交互(抓筐)和背景人物肢体细节时仍出现了典型错误,尤其是防守者的多指畸形是明显的扣分项。 【KIMI】图像整体表现优秀,准确还原了提示词中的扣篮动作和场景氛围,人物肢体结构合理,空间关系略有误差但不影响整体效果。
相关链接
您可以通过以下链接查看更多相关内容: