GPT Image 2 在「多光源混合」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GPT Image 2
  • 用例名称:多光源混合
  • 测试类型:图像生成
  • 评测维度:光影色彩

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一个现代办公室的角落,落地窗透进明亮的午后阳光,在白色办公桌上形成清晰的光影。桌上的玻璃水杯折射出彩虹光斑,旁边的绿植叶片在阳光下呈现半透明的翠绿色,地面上有窗框投下的几何阴影。

任务要求

AI 模型需要满足以下要求:

  1. 画面中须同时呈现自然光(午后阳光,暖橙/暖黄色调)与室内环境光两种光源,二者在色温上形成可辨识的冷暖对比,阳光入射方向来自落地窗侧
  2. 阳光在白色办公桌上形成明确的明暗交界,桌面受光区域呈现暖色调,阴影区域与受光区存在明显亮度差异
  3. 玻璃水杯须呈现光线折射效果,包括但不限于彩虹光斑、色散条纹或透过水杯的光线弯曲,折射方向与光源位置逻辑一致
  4. 绿植叶片在阳光照射侧须呈现半透明的翠绿色透光感,体现植物叶片对光线的透射特性
  5. 地面上须有窗框投下的几何形阴影(矩形框架或网格状),阴影形状与窗框结构对应,方向与光源入射角一致
  6. 场景须完整包含落地窗、白色办公桌、玻璃水杯、绿植四项核心元素,各元素位置关系符合办公室角落的空间逻辑

评测结果

综合得分

该模型在此用例的得分为:80.1 分(满分 100 分),已通过

基础难度评测结果

  • 得分:80.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在场景构成和部分光学效果上完成度较高,尤其是玻璃水杯的彩虹折射光斑和地面窗框几何阴影是亮点。然而,作为一道「测试模型处理多种光源」的题目,最核心的色温表现存在明显缺陷——午后阳光的暖色调特征几乎消失,整体画面呈现冷白色调,两种光源的色温对比未能建立。此外,绿植叶片半透明透光效果的缺失也是重要扣分项。图像整体质量尚可,但在光源色温这一核心考察点上未能达标。 【GEMINI】作为一名视觉评审,这张图像在‘氛围感’上做得很好,但在‘光学逻辑’上存在明显短板。模型虽然捕捉到了阳光的色彩,但对于复杂的光学交互(如色散、次表面散射、几何投影)处理流于表面。这更像是一张优秀的插画,而非一张在物理光学上经得起推敲的专业摄影作品。特别是提示词明确要求的‘彩虹光斑’完全缺失,属于关键要求未达成。 【KIMI】图像基本符合提示词要求,但在光源色温表现和光学交互效果上有改进空间。

进阶难度评测结果

  • 得分:83.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的多光源场景生成图像,核心任务完成度极高。冷白日光灯与暖黄车灯的色温对比强烈且准确,地面积水的双光源反射效果出色,冷暖光交汇区域的色彩过渡自然,成功营造出深夜地下停车场的真实氛围。主要问题集中在右侧暖光区域:强光导致车辆细节略有损失,饱和度偏高接近过曝,雾气效果略显夸张。但这些瑕疵并未严重影响整体表现,模型在多光源处理、光学交互逻辑和氛围营造方面均展现出较强能力。 【GEMINI】这是一张在‘氛围感’上拿了高分,但在‘物理真实性’上经不起推敲的作品。作为一名评审员,我认可其对冷暖色温对比的直观呈现,但模型在处理复杂光影交互(尤其是多向阴影和水面透视反射)时表现出了明显的AI局限性。光源看起来是‘贴’在场景上的,而不是真正参与了场景内物体的几何交互。 【KIMI】整体而言,图像较好地完成了提示词要求,但在光源色温和光学交互逻辑方面仍有改进空间。

困难难度评测结果

  • 得分:78.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度较高的多光源场景图像,成功还原了彩色玻璃窗与蜡烛两类光源的色温特征,丁达尔效应和地面反射效果表现出色,色彩融合质量优秀,整体氛围神圣梦幻。主要问题在于多光源复合阴影表现不足,部分光束色温纯度过高略显人工化,以及地面反射逻辑的物理准确性有待提升。尽管存在这些瑕疵,图像仍展现了较强的视觉表现力和光学交互效果,基本达到提示词要求。 【GEMINI】这是一张在艺术氛围上达标但在物理光学逻辑上存在多处漏洞的图像。模型在处理复杂多光源交互(尤其是反射与复合阴影)时表现疲软,未能精准还原提示词中关于‘四色光束’和‘多色映射’的具体细节要求。视觉表现倾向于套用泛化的‘教堂光影’模板,而非基于提示词进行物理模拟。 【KIMI】整体而言,图像较好地完成了提示词的要求,但在光学交互逻辑和色彩融合方面还有提升空间。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...