GPT Image 2 在「微表情心理状态捕捉」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GPT Image 2
  • 用例名称:微表情心理状态捕捉
  • 测试类型:图像生成
  • 评测维度:人物生成

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一位中年女性在咖啡厅独自坐着,脸上流露出淡淡的忧郁,眼神望向窗外,嘴角微微下垂,整体表情自然真实

任务要求

AI 模型需要满足以下要求:

  1. 人物面部五官比例符合中年女性特征,双眼对称,无明显畸形或多余器官
  2. 眼神方向明确朝向画面中窗外的位置,呈现凝视远方或轻微散焦的失神状态,而非直视镜头
  3. 嘴角呈现轻微下垂弧度(幅度克制,非夸张悲伤),口轮匝肌与颧肌状态与忧郁情绪相符
  4. 眉毛内侧轻微下压或眉间有细微收拢,眼轮匝肌无异常紧绷,眉眼区域整体传达"淡淡忧郁"而非强烈悲伤
  5. 整体表情自然克制,无过度夸张的悲伤表情,无AI常见的"假笑"或"僵硬面具感",皮肤质感真实
  6. 人物坐姿符合独自在咖啡厅就座的自然状态,手部姿态合理(如置于桌面、握杯或自然垂放),手指数量与关节形态正确
  7. 背景应可辨识为咖啡厅室内环境,且存在窗户或窗外光线来源,背景不过度杂乱以免干扰对人物表情的判读

评测结果

综合得分

该模型在此用例的得分为:79.33 分(满分 100 分),已通过

基础难度评测结果

  • 得分:79.33 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在解剖结构与场景合理性方面表现优秀,人物整体自然度较高,但在核心任务——「淡淡忧郁」这一微妙情绪的精准传达上存在明显不足。嘴角未呈现下垂弧度、眉眼区域缺乏忧郁情绪的细微肌肉张力、眼神散焦感不足,导致最终呈现的表情更接近「平静沉思」而非提示词要求的「淡淡忧郁」。这暴露了AI模型在处理复杂心理状态的微表情刻画时仍存在精度瓶颈,尤其在负向情绪的克制表达上容易滑向中性化处理。整体完成度约70%,基本框架正确但情绪核心偏离。

进阶难度评测结果

  • 得分:69.33 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在场景构建和基础情绪传达上完成了部分要求,面试等候室的环境氛围真实可信,人物着装和基础紧张表情有一定说服力。然而,提示词的核心难点——「复合微表情」与「细微身体语言」——均未能精准实现:额头汗水的完全缺失、手指轻敲动态的缺失、以及三种情绪层次不分明,是三个关键失分点。面部微细节的质感处理偏向AI典型的光滑磨皮风格,缺乏真实皮肤在心理压力下的纹理变化。整体而言,图像停留在「表面情绪」的呈现层面,未能深入到提示词要求的「微表情与复杂心理状态」的精细刻画层次。

困难难度评测结果

  • 得分:86.67 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】画面整体完成度较高,成功捕捉到婚礼场景中老年父母的复合情绪与亲密互动。母亲的情感表达尤为出色,眼部泪光、面部表情层次丰富,符合提示词核心要求。主要问题在于父亲的情绪表达相对单薄:眼部泪水质感缺失,伤感情绪层次不足,导致双人情感表达的平衡性略有欠缺。面部微表情细节方面,母亲眼部泪水虽有质感但分布略显均匀,缺乏真实泪液的不规则形态。肢体互动与场景氛围表现优秀,构图、光线、服装均符合婚礼场合要求,整体传达出人生重要时刻的复杂心理状态。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...