GPT Image 2 在「人物表情」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GPT Image 2
- 用例名称:人物表情
- 测试类型:图像生成
- 评测维度:人物生成
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一位中年男性坐在公园长椅上,面露忧郁的表情,眉头紧锁,眼神望向远方,嘴角微微下垂,双手交叉放在膝盖上。他穿着深色的休闲外套,背景是秋天的公园,有几片落叶飘过。
任务要求
AI 模型需要满足以下要求:
- 画面中的中年男性面部须呈现明显忧郁表情,眉头紧锁(可见皱眉纹),嘴角向下弯曲
- 人物眼神方向明确朝向画面远处或侧方,而非直视镜头
- 人物坐姿自然,双手交叉叠放于膝盖之上,动作清晰可辨
- 服装为深色(深灰、深蓝或黑色)休闲外套,颜色与款式符合描述
- 背景呈现秋季公园特征,包含暖色调(橙/黄/红)落叶元素,且有落叶飘落的动态感
- 人物面部结构完整,五官比例正常,无畸形、融合或多余器官
评测结果
综合得分
该模型在此用例的得分为:83.67 分(满分 100 分),已通过
基础难度评测结果
- 得分:83.67 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像整体完成度较高,背景氛围营造尤为出色,秋季公园的色彩与飘落落叶的动态感堪称本图最大亮点。人物的性别、年龄、服装均准确对应提示词。主要不足集中在表情细节层面:嘴角未呈现明显下垂、眉头皱眉力度不足,导致「忧郁」情绪的表达强度打了折扣,更像是「沉思」状态。双手姿态也与提示词描述略有出入。综合来看是一张质量良好但在核心表情细节上未能完全达标的图像。
进阶难度评测结果
- 得分:83.33 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在场景氛围营造和动作道具呈现方面表现优秀,生日派对的欢乐氛围充分体现,背景装饰丰富完整,吹蜡烛动作准确自然。然而在核心维度「面部表情准确性」上存在明显偏差:女孩眼睛闭合无法确认月牙形状态,嘴唇收拢吹气导致未露出牙齿,整体表情更偏向专注瞬间而非洋溢纯真笑容。这是吹蜡烛动作与展示笑容表情之间的矛盾——模型选择了动作准确性而牺牲了表情完整性。若提示词同时要求「吹蜡烛」和「露出牙齿的笑容」,在生理逻辑上存在冲突,但模型应优先满足表情要求或在吹气前/后捕捉笑容瞬间。
困难难度评测结果
- 得分:83.67 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度较高的 AI 生成图像,在细节刻画和光影构图方面表现优秀,老年画家的皮肤纹理、颜料痕迹、画室环境均真实可信。但在核心任务「表现特定表情」上存在明显短板:眼神缺乏锐利感,嘴唇未呈现紧抿状态,导致「高度专注」的情绪强度被削弱,整体神态偏向平和而非紧张投入。这使得图像在「facial_expression_accuracy」维度失分较多,未能精准传达提示词要求的复合情绪。若模型能在眼神张力和唇部肌肉状态上进一步优化,整体表现将显著提升。
相关链接
您可以通过以下链接查看更多相关内容: