GPT Image 2 在「天文台观测仪器阵列布局」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GPT Image 2
用例名称：天文台观测仪器阵列布局
测试类型：图像生成
评测维度：数量控制

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一个现代天文台的观测平台场景，包含4台不同型号的光学望远镜，每台望远镜都有独立的支架和控制台，望远镜呈半圆形排列，背景是星空

任务要求

AI 模型需要满足以下要求：

生成3-5台光学望远镜（以4台为目标，允许±1台误差），每台望远镜须具备镜筒、目镜等可辨识的光学仪器特征
每台望远镜形态清晰独立，设备之间无融合或严重重叠，可单独计数
所有望远镜整体呈半圆形或弧形排列，弧形布局需自然流畅，设备间距均匀合理
每台望远镜配有独立支架（如赤道仪架或地平式支架）和控制台（如操作面板或终端设备）等基础配套设施
背景为夜间星空，星空与观测平台场景自然融合，整体画面具备现代专业天文台的视觉氛围

评测结果

综合得分

该模型在此用例的得分为：97.67 分（满分 100 分），已通过

基础难度评测结果

得分：97.67 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张几乎完美完成提示词要求的AI生成图像。图像精确呈现4台不同型号的光学望远镜，每台设备形态独立、特征清晰，配备专业级支架和现代化控制台，整体呈半圆形排列，空间布局合理自然。背景星空层次丰富，银河清晰可见，与观测平台场景完美融合，充分展现现代专业天文台的视觉氛围。设备细节考究，从镜筒结构到控制台界面均具备高度专业性。唯一微小瑕疵是弧形排列略偏平缓、部分控制台底座材质细节略显简化，但这些不影响整体质量。该图像在实体计数、空间布局和专业细节三个维度均表现优异，是一次成功的AI图像生成案例。

进阶难度评测结果

得分：80.67 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像整体上较好地还原了大型射电天文台控制中心的专业氛围，设备数量基本符合提示词要求，空间布局合理，构图专业。最主要的缺陷集中在射电望远镜接收器的视觉语义表达上——实体接收器设备缺乏专业形态特征，与数据处理终端视觉混淆，主要依赖文字标签区分。频谱分析仪和数据处理终端的表现较为出色。综合来看，图像完成了提示词的大部分要求，但在设备语义分化这一核心测试维度上存在明显不足。

困难难度评测结果

得分：78.33 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在整体场景构建、主要设备类型识别与计数方面表现优秀，抛物面天线、光学望远镜、气象监测站、太阳能板阵列、雷达天线五类设备的数量与视觉特征均符合提示词要求，山顶多层平台的空间逻辑与构图质量突出。主要问题集中在数据采集终端这一类别：实际可明确识别的设备数量少于标注声称的7个，且该类设备在远景中缺乏独特的专业视觉特征，与建筑附属设施混淆，导致计数准确性与语义区分度均受到影响。整体而言，图像完成了提示词的核心要求，但在小型设备的精确表达上存在改进空间。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题