Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「表演动作」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
  • 用例名称:表演动作
  • 测试类型:图像生成
  • 评测维度:动作表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一位芭蕾舞演员正在舞台中央表演阿拉贝斯克动作,单腿站立,另一条腿向后高高抬起,双臂优雅地展开,身穿白色芭蕾舞裙,聚光灯照射下的剪影效果。

任务要求

AI 模型需要满足以下要求:

  1. 芭蕾舞演员必须呈现标准阿拉贝斯克动作姿态:支撑腿垂直站立,另一条腿向后伸展抬起(角度明显,理想状态接近水平)
  2. 人体结构须符合解剖学逻辑:肢体比例正常,无关节扭曲、肢体粘连、手指数量异常或其他畸形问题
  3. 双臂向两侧或前后舒展,呈现芭蕾舞典型的优雅弧线姿势,与后腿方向形成协调的身体延伸感
  4. 演员身穿白色芭蕾舞裙,裙摆蓬松轮廓在剪影效果下仍需清晰可辨
  5. 画面呈现聚光灯照射下的剪影效果:人物与背景形成明显明暗对比,光源方向一致,光影逻辑统一
  6. 演员位于舞台中央位置,舞台环境(如地板、侧幕、灯光氛围等)可识别,整体构图以人物为视觉中心

评测结果

综合得分

该模型在此用例的得分为:88.7 分(满分 100 分),已通过

基础难度评测结果

  • 得分:88.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一张极具戏剧感的黑白摄影作品。画面中央,一位芭蕾舞者正处于舞台聚光灯的中心,她单脚伫立,另一条腿向斜上方高高抬起,双臂舒展,呈现出优美的舞姿。一束强烈的白色顶光从上方垂直打下,形成一个明亮的圆锥形光影区域,将舞者从漆黑的背景中勾勒出来。舞者穿着轻盈的白色芭蕾舞裙,裙摆在光线下呈现出半透明的质感,空气中隐约可见细小的尘埃颗粒。 在 AI 生成的细节方面,存在一些明显的解剖学异常:舞者抬起的那条腿(右腿)与身体连接处的透视显得有些生硬,且右脚脚尖的形状略显模糊,不够自然。此外,舞者左手的手指线条略显杂乱,缺乏清晰的指节结构。尽管如此,整幅画面的构图平衡,光影对比强烈,成功营造出了一种静谧而神圣的舞台氛围。

图中展示了一张极具戏剧感的黑白摄影作品。画面中央,一位芭蕾舞者正处于舞台聚光灯的中心,她单脚伫立,另一条腿向斜上方高高抬起,双臂舒展,呈现出优美的舞姿。一束强烈的白色顶光从上方垂直打下,形成一个明亮的圆锥形光影区域,将舞者从漆黑的背景中勾勒出来。舞者穿着轻盈的白色芭蕾舞裙,裙摆在光线下呈现出半透明的质感,空气中隐约可见细小的尘埃颗粒。

在 AI 生成的细节方面,存在一些明显的解剖学异常:舞者抬起的那条腿(右腿)与身体连接处的透视显得有些生硬,且右脚脚尖的形状略显模糊,不够自然。此外,舞者左手的手指线条略显杂乱,缺乏清晰的指节结构。尽管如此,整幅画面的构图平衡,光影对比强烈,成功营造出了一种静谧而神圣的舞台氛围。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的芭蕾舞演员表演图像,几乎完美地满足了提示词的所有要求。阿拉贝斯克动作姿态标准、人体结构自然、白色芭蕾舞裙清晰可辨、聚光灯剪影效果强烈、舞台氛围完整。黑白影调的艺术处理赋予了图像经典的舞台美感,整体构图以人物为视觉中心,光影逻辑统一。仅存在演员位置略偏右及身体细节稍显清晰(非纯剪影)等轻微不足,不影响整体的高完成度。 【GEMINI】这是一张视觉冲击力极强的作品,在光影氛围和构图上达到了专业摄影水准。然而,作为测试表演艺术的模型表现,它在最核心的人体微观结构(手指、关节)上未能通过严苛的审查。动作的宏观美感掩盖了微观的解剖缺陷,建议优化手部细节生成。 【KIMI】整体而言,这张图像完美地呈现了芭蕾舞演员的阿拉贝斯克动作姿态,肢体比例正常,符合解剖学逻辑。白色芭蕾舞裙的轮廓在剪影效果下清晰可辨,光影效果真实且内部一致。演员位于舞台中央位置,整体构图合理,但舞台环境细节(如地板、侧幕等)可以更加丰富一些。

进阶难度评测结果

  • 得分:90.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个京剧表演的舞台场景。画面中央,一名身着大红色刺绣戏服的武生正处于高难度的倒立空翻动作中,他的身体完全倒置,双腿朝天,红色的水袖随动作在空中划出动感的弧线。右侧站着一位身穿粉色戏服、头戴精致头饰的旦角,她双手举起,面露惊讶的表情。背景是一扇精美的木质屏风,上面绘有山水和祥龙图案,前方摆放着铺有红色刺绣桌布的条案。 画面中存在明显的 AI 生成缺陷:最显著的是中央武生的面部,五官严重扭曲变形,鼻子和嘴巴的位置混乱,看起来不像人类面孔;他的手部也存在异常,与水袖的连接处结构模糊。右侧旦角的手指线条生硬且比例失调。此外,屏风上的龙纹细节略显杂乱,武生倒立时的身体重心与服装褶皱的重力感不完全符合物理常识。整体色彩浓郁,极具戏剧张力,但细节处仍有明显的合成痕迹。

图中展示了一个京剧表演的舞台场景。画面中央,一名身着大红色刺绣戏服的武生正处于高难度的倒立空翻动作中,他的身体完全倒置,双腿朝天,红色的水袖随动作在空中划出动感的弧线。右侧站着一位身穿粉色戏服、头戴精致头饰的旦角,她双手举起,面露惊讶的表情。背景是一扇精美的木质屏风,上面绘有山水和祥龙图案,前方摆放着铺有红色刺绣桌布的条案。

画面中存在明显的 AI 生成缺陷:最显著的是中央武生的面部,五官严重扭曲变形,鼻子和嘴巴的位置混乱,看起来不像人类面孔;他的手部也存在异常,与水袖的连接处结构模糊。右侧旦角的手指线条生硬且比例失调。此外,屏风上的龙纹细节略显杂乱,武生倒立时的身体重心与服装褶皱的重力感不完全符合物理常识。整体色彩浓郁,极具戏剧张力,但细节处仍有明显的合成痕迹。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度很高的京剧表演场景图像,准确呈现了提示词要求的所有核心元素。武生演员的倒立翻腾动作标准且人体结构完整,红色水袖在空中飞舞形成流畅弧线,展现出高难度技巧的专业性。花旦演员的惊讶表情和手势刻画细腻,与武生动作形成明确的空间互动关系,戏剧性张力十足。两位演员的服装准确体现各自行当特征,传统戏台背景精美完整,整体视觉风格与京剧文化氛围高度一致。画面构图采用对角线布局,动感效果强烈。存在的小瑕疵包括倒立姿势的腿部角度可以更垂直,以及前景道具桌的装饰风格略显现代化,但这些不影响整体的高完成度表现。 【GEMINI】这是一张质量极高的 AI 生成图像,完美捕捉了京剧表演的瞬间。模型不仅准确理解了‘翻腾’、‘倒立’、‘水袖’等物理特征,还成功传达了中国戏曲特有的‘精气神’。在人体结构和文化细节上表现出色,仅在极微小的手指结构处存在 AI 常见的轻微模糊,瑕不掩瑜。 【KIMI】整体画面生动,动作准确,服装和背景细节丰富,符合京剧表演的艺术风格

困难难度评测结果

  • 得分:81.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个充满活力的欧洲风格城市广场,在夕阳的金色余晖下,三名男子正在进行高难度的杂技表演。画面中心一名赤裸上身的男子正稳健地倒立在石板地上,他的双脚向上托举着第二名横卧的男子,而第三名男子则在更高处完成惊险的后空翻动作。周围站着五位观众,他们神情惊讶,有的张大嘴巴,有的在鼓掌欢呼。背景是古朴的砖石建筑和教堂,长长的投影增加了画面的立体感。 然而,画面中存在多处明显的 AI 生成缺陷:最显著的是杂技动作违反了物理常识,中间男子的腿部与上方男子的身体连接处结构混乱,看起来像是直接从腰部生长出来的;最上方翻转男子的左手呈现出扭曲的多指状态。此外,右侧观众的手部线条模糊且比例失调,背景中远处的行人身体轮廓也显得支离破碎,这些细节揭示了图像的非真实性。

图中展现了一个充满活力的欧洲风格城市广场,在夕阳的金色余晖下,三名男子正在进行高难度的杂技表演。画面中心一名赤裸上身的男子正稳健地倒立在石板地上,他的双脚向上托举着第二名横卧的男子,而第三名男子则在更高处完成惊险的后空翻动作。周围站着五位观众,他们神情惊讶,有的张大嘴巴,有的在鼓掌欢呼。背景是古朴的砖石建筑和教堂,长长的投影增加了画面的立体感。

然而,画面中存在多处明显的 AI 生成缺陷:最显著的是杂技动作违反了物理常识,中间男子的腿部与上方男子的身体连接处结构混乱,看起来像是直接从腰部生长出来的;最上方翻转男子的左手呈现出扭曲的多指状态。此外,右侧观众的手部线条模糊且比例失调,背景中远处的行人身体轮廓也显得支离破碎,这些细节揭示了图像的非真实性。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像整体质量较高,成功呈现了街头杂技叠罗汉表演的核心场景。底层演员倒立、中层演员踩踏平衡、顶层演员空中飞跃的三层结构清晰可辨,观众围观反应生动自然。夕阳逆光效果和欧式广场背景是本图最突出的亮点,光影氛围极具感染力。主要不足在于中层演员的支撑方式(双脚踩踏而非单手支撑)和顶层演员的动作形态(横向飞跃而非典型后空翻)与提示词描述存在偏差,但整体仍是一幅高质量、富有张力的杂技表演场景图像。 【GEMINI】这是一张在构图和氛围感上非常出色的AI生成图像,成功捕捉了街头杂技的张力和傍晚的暖意。然而,在细节严谨性上存在明显不足,特别是关键的人体解剖结构(多指、肢体连接异常)和全局光影逻辑的统一性,这些属于写实类摄影风格图像的致命伤。建议优化手部和关节处的采样精度,并加强光影的方向性约束。 【KIMI】图像质量高,符合提示词要求,细节丰富,人物动作准确,场景真实可信。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...