GPT Image 2 在「天文台观测仪器阵列布局」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GPT Image 2
- 用例名称:天文台观测仪器阵列布局
- 测试类型:图像生成
- 评测维度:数量控制
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一个现代天文台的观测平台场景,包含4台不同型号的光学望远镜,每台望远镜都有独立的支架和控制台,望远镜呈半圆形排列,背景是星空
任务要求
AI 模型需要满足以下要求:
- 生成3-5台光学望远镜(以4台为目标,允许±1台误差),每台望远镜须具备镜筒、目镜等可辨识的光学仪器特征
- 每台望远镜形态清晰独立,设备之间无融合或严重重叠,可单独计数
- 所有望远镜整体呈半圆形或弧形排列,弧形布局需自然流畅,设备间距均匀合理
- 每台望远镜配有独立支架(如赤道仪架或地平式支架)和控制台(如操作面板或终端设备)等基础配套设施
- 背景为夜间星空,星空与观测平台场景自然融合,整体画面具备现代专业天文台的视觉氛围
评测结果
综合得分
该模型在此用例的得分为:97.67 分(满分 100 分),已通过
基础难度评测结果
- 得分:97.67 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张几乎完美完成提示词要求的AI生成图像。图像精确呈现4台不同型号的光学望远镜,每台设备形态独立、特征清晰,配备专业级支架和现代化控制台,整体呈半圆形排列,空间布局合理自然。背景星空层次丰富,银河清晰可见,与观测平台场景完美融合,充分展现现代专业天文台的视觉氛围。设备细节考究,从镜筒结构到控制台界面均具备高度专业性。唯一微小瑕疵是弧形排列略偏平缓、部分控制台底座材质细节略显简化,但这些不影响整体质量。该图像在实体计数、空间布局和专业细节三个维度均表现优异,是一次成功的AI图像生成案例。
进阶难度评测结果
- 得分:80.67 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像整体上较好地还原了大型射电天文台控制中心的专业氛围,设备数量基本符合提示词要求,空间布局合理,构图专业。最主要的缺陷集中在射电望远镜接收器的视觉语义表达上——实体接收器设备缺乏专业形态特征,与数据处理终端视觉混淆,主要依赖文字标签区分。频谱分析仪和数据处理终端的表现较为出色。综合来看,图像完成了提示词的大部分要求,但在设备语义分化这一核心测试维度上存在明显不足。
困难难度评测结果
- 得分:78.33 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在整体场景构建、主要设备类型识别与计数方面表现优秀,抛物面天线、光学望远镜、气象监测站、太阳能板阵列、雷达天线五类设备的数量与视觉特征均符合提示词要求,山顶多层平台的空间逻辑与构图质量突出。主要问题集中在数据采集终端这一类别:实际可明确识别的设备数量少于标注声称的7个,且该类设备在远景中缺乏独特的专业视觉特征,与建筑附属设施混淆,导致计数准确性与语义区分度均受到影响。整体而言,图像完成了提示词的核心要求,但在小型设备的精确表达上存在改进空间。
相关链接
您可以通过以下链接查看更多相关内容: