GPT Image 2 在「复杂多层场景」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GPT Image 2
  • 用例名称:复杂多层场景
  • 测试类型:图像生成
  • 评测维度:场景构建

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:现代办公室内部,前景是一张木质办公桌和电脑显示器,中景是落地窗和绿植,背景是城市天际线,下午阳光透过窗户洒进室内。

任务要求

AI 模型需要满足以下要求:

  1. 图像成功生成,画面完整无截断,无明显技术性错误(如大面积噪点、图像损坏、内容与提示词完全无关)
  2. 画面呈现清晰的三段式空间构图:前景为办公桌与显示器,中景为落地窗与绿植,背景为室外城市天际线,各层次通过遮挡关系或景深加以区分
  3. 前景中木质办公桌(具备木质色调或纹理特征)与电脑显示器均清晰可见,无严重变形或遮挡
  4. 中景中落地窗(大型竖向窗户,高度显著)与绿植(叶片轮廓可辨)可被识别
  5. 背景中城市天际线清晰存在,可见至少2栋以上建筑轮廓,呈现室外城市环境
  6. 下午阳光效果得到体现:画面整体色温偏暖,且存在来自落地窗方向的自然光感(如光线方向性、窗户投影或暖色光斑),符合下午室内采光的视觉特征

评测结果

综合得分

该模型在此用例的得分为:85.1 分(满分 100 分),已通过

基础难度评测结果

  • 得分:85.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度很高的 AI 生成图像,严格满足了提示词的所有核心要求。三段式空间构图清晰且自然,前景木质办公桌与显示器、中景落地窗与多盆绿植、背景城市天际线均完整呈现且细节到位。下午阳光透过窗户洒入室内的光效表现真实,暖色光斑、阴影过渡和光线方向性均符合自然采光特征。画面在空间层次、元素还原和光影氛围三个维度上均达到了较高水准,仅在前景与中景的距离感以及天空色温统一性上有微小改进空间,但这些并不影响整体质量。该图像展现了模型在处理复杂空间层次任务时的强大能力。 【GEMINI】这是一张在氛围感上初看合格,但在专业视觉逻辑下经不起推敲的作品。空间层次虽有划分,但因透视错误和光影缺失导致层次间缺乏真实的物理关联。尤其是光影处理,未能模拟出真实落地窗采光的复杂投影关系,是制约其进入高质量区间的核心问题。 【KIMI】整体而言,图像较好地完成了提示词的要求,呈现了清晰的空间层次感和丰富的提示词元素。然而,前景与中景的过渡和光影效果的表达仍有提升空间。

进阶难度评测结果

  • 得分:83.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的复杂空间层次要求,所有指定元素均清晰呈现,三层景深结构完整,锦鲤池水与石灯笼的细节表现尤为出色。主要不足在于中远景空间过渡略显拥挤、木桥质感偏弱,以及整体色彩饱和度略高于「春日午后」的清淡气质。综合来看属于高质量生成,达到提示词要求的优秀水准。 【GEMINI】这是一张视觉冲击力较强但经不起推敲的作品。模型在宏观氛围和材质渲染上表现出色,但在处理复杂空间逻辑和特定生物特征(红白锦鲤)时显得力不从心。细节上的比例失调(花瓣)和透视错误(桥梁)是拉开与顶级模型差距的主要原因。 【KIMI】整体而言,这幅图像很好地完成了提示词的要求,展现了日式庭园的多层次景观。前景、中景和远景的层次关系清晰,细节还原度高,光线和材质表现良好。尽管在水面透明感和锦鲤细节上还有提升空间,但整体质量已经非常高。

困难难度评测结果

  • 得分:82.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度很高的未来都市立体交通枢纽图像,四层空间结构清晰,夜晚多光源效果出色,材质表现真实细腻。核心扣分点在于对「透明玻璃地板下的地铁隧道」的空间关系理解偏差——提示词要求的是垂直向下透视的地下隧道,而图像呈现为水平延伸的透明管道,虽视觉效果优秀但与提示词描述的空间逻辑有微妙差异。此外,磁悬浮轨道特征不够明确,部分路人细节略显模糊。整体而言,图像在光影、材质、构图层次上表现优异,但在提示词精确还原度上存在可改进空间。综合三个维度的加权得分约为 87 分,属于「基本完成要求,但存在 1-2 处明显瑕疵」的高质量作品。 【GEMINI】这是一张在宏观构图和氛围营造上非常出色的作品,成功捕捉了未来都市的繁华感。然而,作为一名挑剔的评审员,我必须指出其在微观物理逻辑和材质真实度上的失误。玻璃地板作为最前景的核心元素,其光学表现的缺失严重削弱了画面的沉浸感。空间层次虽然丰富,但层与层之间的物理衔接(尤其是扶梯部分)仍带有明显的AI生成痕迹,缺乏真实的工程美学。 【KIMI】这张AI生成的图像在整体上较好地完成了提示词的要求,展现了未来都市的立体交通枢纽。然而,在空间层次的透视关系、光影效果的真实性以及材质质感的表现上仍有改进空间。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...