GPT Image 2 在「三点透视」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GPT Image 2
  • 用例名称:三点透视
  • 测试类型:图像生成
  • 评测维度:透视视角

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:一个简单的立方体房间内部,从房间的一个角落向对角看去,能清晰看到三面墙壁、地板和天花板都向不同的消失点汇聚,展现基础的三点透视效果。房间内只有一把椅子放在中央。

任务要求

AI 模型需要满足以下要求:

  1. 图像成功生成,无技术性错误(如黑屏、严重噪点、内容缺失)
  2. 采用极端俯视或仰视视角(大仰角或大俯角),使垂直边缘线明显向画面上方(天点)或下方(地点)汇聚,形成清晰的第三消失点,而非默认平视的两点透视
  3. 立方体房间内部呈现三点透视:两组水平线分别向左右两侧消失点汇聚,所有垂直线(墙角线、门框线等)向同一个垂直方向消失点汇聚,三组透视线均不平行于画框边缘
  4. 视角为从房间一个角落向对角方向看去,画面中可同时清晰看到三面墙壁、地板和天花板,角落的竖向交线可见
  5. 房间中央放置一把椅子,椅子的透视方向与房间保持一致,椅子尺寸与房间空间比例合理,符合近大远小的透视规律

评测结果

综合得分

该模型在此用例的得分为:68.1 分(满分 100 分),已通过

基础难度评测结果

  • 得分:68.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在两点透视的执行上表现尚可,但完全未能实现提示词要求的三点透视效果——这是本次测试的核心考察点。所有垂直线均平行于画框,没有向第三消失点汇聚,本质上是一张普通的两点透视室内图。图像中虽然添加了「天花板消失点」「地板消失点」等标注,但这些标注与实际图像内容不符,垂直线并未真正收敛,属于「贴标签」而非「真正实现」三点透视。模型未能理解三点透视需要极端仰视或俯视视角才能产生的垂直方向透视变形这一核心原理。 【GEMINI】该图像未能通过三点透视的压力测试。模型选择了最稳妥的‘两点透视’方案,完全回避了垂直方向的透视变形要求。虽然画面简洁干净,但在处理复杂空间几何逻辑方面表现平庸,未能体现出对高级透视原理的理解。 【KIMI】整体上,图像较好地完成了提示词的要求,展示了三点透视效果,空间层次感清晰。但在椅子的尺寸比例上略有不足,需要进一步调整。

进阶难度评测结果

  • 得分:83.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的三点透视图像生成作品,成功完成了提示词的核心要求。三点透视结构准确且清晰可辨,垂直方向向上汇聚的天点与水平方向左右两个消失点的透视线组均表现正确,体现了模型对复杂透视的良好理解。螺旋上升的现代图书馆内部结构完整,仰视角度与中庭底部视点逻辑自洽,玻璃天窗与自然光效果强化了画面的纵深感。存在的问题主要集中在中间层书架单元的透视缩放比例细节略有不均匀,以及底层右侧栏杆交接处的透视衔接略显生硬,但这些瑕疵不影响整体透视结构的准确性。总体而言,模型在处理复杂三点透视任务时表现优秀,完成度高且视觉效果出色。 【GEMINI】这是一张在氛围感上表现优异,但在严苛几何透视下经不起推敲的作品。模型虽然捕捉到了‘仰视’和‘螺旋’的意向,但在处理复杂的三点透视叠加曲线结构时,无法维持全局坐标系的统一。左侧消失点的偏差和螺旋结构的物理断裂是主要失分项,反映了模型在处理非线性几何透视时的逻辑局限性。 【KIMI】整体而言,图像较好地完成了提示词要求,展示了复杂的三点透视结构,建筑结构与透视比例基本一致,画面纵深感与场景完整性表现良好。尽管存在一些细微的透视偏差,但总体质量较高。

困难难度评测结果

  • 得分:73.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:GPT Image 2
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在整体视角设置和科技氛围营造上表现尚可,成功呈现了未来地下交通枢纽的基本框架和纵深感。但在核心的透视准确性和结构一致性方面存在明显缺陷:左右扶梯和横向桥梁的透视线条过于平行,右侧弧形轨道的透视变形失真,多层次空间结构未能清晰达到五个层次的要求,且局部透视系统不统一。这些问题导致画面在严格的三点透视测试中表现不佳,未能完全满足提示词对「准确表现至少五个不同深度层次的空间关系,每个层次都有清晰的三点透视结构」的要求。综合来看,图像部分完成了任务,但距离高质量完成仍有明显差距。 【GEMINI】作为一名评审员,我认为该模型在‘氛围营造’上表现出色,但在‘空间几何理解’上不及格。它通过堆砌发光元素和复杂的线条掩盖了透视逻辑的混乱。三点透视作为本次测试的核心硬性要求,模型完成度较低,垂直线的平行处理直接导致了大俯角张力的丧失。此外,结构一致性的缺失(穿模问题)说明模型尚未建立起三维空间的实体碰撞逻辑。 【KIMI】整体而言,这张图像较好地完成了提示词的要求,在透视准确性、结构一致性和画面纵深感方面都有不错的表现。但部分磁悬浮轨道的透视处理和空间张力的强化还有改进空间。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...