GPT Image 2 在「霓虹与反射」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GPT Image 2
- 用例名称:霓虹与反射
- 测试类型:图像生成
- 评测维度:光影色彩
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一个红色霓虹灯招牌在黑暗中发光,霓虹灯的光芒照亮了下方的金属表面,在光滑的金属上形成清晰的红色倒影。背景是深夜的城市,霓虹光在周围的雾气中产生朦胧的光晕效果。
任务要求
AI 模型需要满足以下要求:
- 红色霓虹灯招牌须呈现明显的自发光效果,灯管颜色为高饱和度纯正红色,无明显偏橙或偏粉
- 霓虹灯光在周围雾气中产生可见的朦胧光晕,光晕应以灯管为中心向外柔和渐变扩散
- 霓虹灯下方的金属表面须呈现清晰可辨的红色倒影,倒影色彩与灯光颜色保持一致
- 金属表面须具备光滑镜面质感,通过高光与反射层次与粗糙材质形成明显区分
- 背景须呈现深夜城市环境,包含建筑轮廓、街道或城市光点等可识别的夜间城市元素
- 画面整体以暗调为主,霓虹灯作为核心光源与背景形成强烈明暗对比,同时暗部须保留可见细节,避免大面积死黑
评测结果
综合得分
该模型在此用例的得分为:84.6 分(满分 100 分),已通过
基础难度评测结果
- 得分:84.6 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度很高的 AI 生成图像,几乎完美满足了提示词的所有核心要求。霓虹灯的发光效果、金属表面的镜面反射、以及深夜城市氛围三大要素均得到优秀呈现。特别是反射质量达到了专业级水准,倒影清晰度和色彩一致性堪称典范。唯一可改进之处在于背景城市建筑的细节层次可以更丰富,以增强画面的纵深感和环境光的多样性。整体而言,这是一张在技术执行层面几乎无可挑剔的作品。 【GEMINI】这是一张在第一眼视觉上非常惊艳,但经不起专业推敲的作品。霓虹灯的发光表现和整体氛围渲染达到了商业插画的水准。然而,在核心测试点——‘复杂反射光’的处理上,模型表现出了典型的物理逻辑缺失。倒影与实物的几何对应关系崩溃,使得金属材质看起来更像是被涂了红漆的粗糙水泥,而非光滑的反射表面。作为针对‘反射质量’的测试,该模型未能通过严格的物理准确性校验。 【KIMI】整体上,图像较好地完成了提示词要求,但在光晕扩散和金属表面光滑质感的表现上还有提升空间。
进阶难度评测结果
- 得分:83.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的AI生成图像,对提示词的还原度相当高。三类光源(暖红尾灯、冷白荧光灯、绿色应急灯)同时呈现且色彩明确区分,地面湿润反射效果真实,地下停车场环境细节丰富完整。最突出的表现是远景绿色体积光散射和地面多色光斑交织效果。主要不足在于车身金属漆面的扭曲映射特征不够强烈,未能充分体现弧面镜面反射与地面漫反射之间的材质质感差异,这是与满分之间最主要的差距。整体而言,该图像在复杂反射光处理方面表现优秀,属于高水准生成结果。 【GEMINI】这是一张在氛围营造上及格但在物理光学细节上经不起推敲的作品。模型虽然捕捉到了提示词中的色彩元素和空间特征,但在处理‘复杂反射’这一核心任务时,未能建立起光源、反射面与观察者之间的几何逻辑联系。特别是地面反射的随机性太强,且关键的绿色体积光效果缺失,导致画面在高阶质感上存在断层。 【KIMI】整体而言,图像较好地完成了提示词要求,但在车身反射效果和绿色应急出口灯的光散射效果上还有改进空间。
困难难度评测结果
- 得分:79.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像在整体视觉效果上相当华丽,成功呈现了豪华酒店室内喷泉的梦幻氛围,彩虹效果和多色LED水下照射是最突出的亮点。场景要素完整性高,构图层次感强。主要短板集中在材质质感的精细区分上:玻璃幕墙的透明特性缺失是最明显的硬伤,马赛克焦散效果静态化也未能达到提示词的动态波动要求。光学物理逻辑整体合理但存在细节瑕疵。综合来看,这是一张视觉效果优秀但在材质渲染精度上有明显提升空间的作品。 【GEMINI】这是一张视觉冲击力极强的图像,但在专业光学维度下经不起推敲。模型在处理复杂的光学物理现象(如色散和焦散)时,倾向于使用‘色彩叠加’而非‘物理模拟’。虽然满足了普通用户的审美需求,但在材质的物理真实性和光影逻辑上仍有较大提升空间,尤其是在玻璃的折射/反射双重特性表现上显得过于机械。 【KIMI】整体而言,图像较好地完成了提示词的要求,但在部分细节上仍有改进空间,特别是在光学效果的自然过渡和材质质感的精细表现上。
相关链接
您可以通过以下链接查看更多相关内容: