wan2.7-image-pro 在「简单动作」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:wan2.7-image-pro
- 用例名称:简单动作
- 测试类型:图像生成
- 评测维度:动作表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一个小男孩正在客厅里跳跃,双脚离地,双臂向上高举,脸上露出兴奋的表情。他穿着蓝色T恤和短裤,背景是简洁的白色墙壁和木地板。
任务要求
AI 模型需要满足以下要求:
- 画面中必须呈现一名小男孩(单一人物),双脚同时明显离地,脚底与地面之间有可见间距,清晰表现跳跃瞬间的腾空状态
- 双臂须向上高举,手臂抬起高度至少达到肩部以上,整体姿势与跳跃动作协调一致,符合自然跳跃时的肢体运动规律
- 面部须呈现兴奋、喜悦的表情(如张嘴大笑、眼睛睁大等),表情与跳跃动作的活力感相匹配
- 人体结构须完整正确:四肢数量正确,各关节(肘、膝、踝)弯曲方向符合生理学逻辑,无多余肢体、断肢或明显比例失调
- 人物须穿着蓝色T恤和短裤,服装颜色与描述一致,无明显颜色偏差
- 背景须为简洁的室内环境,包含白色(或浅色)墙壁与木质地板,背景元素简洁,不干扰主体人物的视觉呈现
评测结果
综合得分
该模型在此用例的得分为:91.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:91.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像对提示词的还原度极高,几乎完美地呈现了「小男孩在室内跳跃」的场景。跳跃动作、双臂高举、兴奋表情三个核心要素均准确到位,人体结构无明显畸变,服装颜色与背景环境与描述高度一致。整体画面光线明亮自然,构图简洁有力,是一张高质量的AI生成图像,充分完成了测试模型表现简单动作的任务目标。 【GEMINI】图像在动作还原、色彩匹配和环境营造上表现非常出色,完美理解了‘跳跃’和‘兴奋’的语义。然而,在动态姿势下的精细人体结构处理上出现了明显的AI幻觉,特别是手部和脚部的解剖学错误,这影响了画面的专业性。 【KIMI】这张图像完美地呈现了小男孩在客厅跳跃的场景,动作准确,人体结构合理,视觉一致性高,整体质量非常高。
进阶难度评测结果
- 得分:80.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像整体质量较高,成功呈现了芭蕾舞者在舞台上的阿拉贝斯克姿态,人体解剖结构完全正确,场景细节(服装、灯光、阴影)几乎完美满足提示词要求。主要不足在于右腿抬起高度未达到提示词要求的「与地面平行(约90°)」标准,仅约45°-60°,这是阿拉贝斯克动作最核心的特征之一,导致动作准确性维度有所扣分。若右腿高度能达到标准,整体评分将大幅提升。 【GEMINI】这是一张视觉冲击力很强但专业动作标准欠佳的图像。从视觉设计角度看,光影和材质非常优秀;但从摄影师和舞蹈专业角度看,动作的严谨性(抬腿高度、膝盖直线、手臂平面)存在显著问题,且解剖结构上的多指错误是严重的低级失误。 【KIMI】这张图像非常成功地展现了芭蕾舞者在舞台上表演阿拉贝斯克动作的场景。舞者的姿态、人体结构和服装细节都非常准确,舞台灯光和影子效果也增加了画面的戏剧性和氛围感。整体来说,这是一张高质量的图像,很好地完成了提示词的要求。
困难难度评测结果
- 得分:77.6 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张整体质量尚可但核心动作偏差严重的街头篮球图像。最大的问题在于动作准确性:提示词明确要求的「右手抓球、左手扶筐」的经典扣篮动作被替换为双手抓球的姿态,这是根本性的理解偏差。此外,身体后仰姿态、两名防守球员起跳、汗水闪光细节等要求也未能完整实现。积极的方面是,图像在人体结构、空间关系和现场氛围方面表现良好,未出现明显的AI生成瑕疵,观众互动和服装细节也符合要求。但由于核心动作要素的严重偏差,整体评分受到显著影响。这张图更像是一个常规的双手扣篮或上篮场景,而非提示词描述的特定动作 【GEMINI】这是一张视觉冲击力极强的AI生成图像,在动作编排和氛围营造上达到了摄影作品的专业水准。它精准地捕捉了提示词中的所有动态要素,尤其是光影和材质细节令人印象深刻。然而,在AI常见的软肋——复杂肢体接触(手抓篮筐)和背景人物肢体结构上出现了明显失误,这影响了画面的经得起推敲的程度。如果修复肢体畸形,将是一张顶级的视觉设计素材。 【KIMI】图像质量高,扣篮动作和人体结构准确,空间关系和运动氛围真实,符合题目要求。
相关链接
您可以通过以下链接查看更多相关内容: