GPT Image 2 在「六个物体排列」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GPT Image 2
用例名称：六个物体排列
测试类型：图像生成
评测维度：数量控制

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

六个红色苹果整齐地摆放在白色桌面上，呈2x3的矩形排列，每个苹果大小相似，表面光滑有光泽。

任务要求

AI 模型需要满足以下要求：

图像中必须恰好包含6个红色苹果，多于或少于6个均视为不合格，每个苹果须独立可辨，边界清晰，不得出现苹果融合或严重遮挡导致数量无法准确判定的情况
6个苹果须严格排列为2行3列的矩形网格布局（横向3个为一行，纵向共2行），行与行、列与列之间对齐整齐，间距分布均匀
所有苹果须放置于白色桌面之上，桌面颜色应为白色或接近白色的浅色，桌面作为主要背景清晰可见
6个苹果的大小须视觉上基本一致，每个苹果表面应呈现红色且具有光滑光泽的质感，无明显形态畸变或颜色严重偏差

评测结果

综合得分

该模型在此用例的得分为：97.67 分（满分 100 分），已通过

基础难度评测结果

得分：97.67 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张几乎完美完成提示词要求的图像。6个红色苹果数量准确，2行3列的矩形排列整齐规范，每个苹果大小一致、表面光滑有光泽，白色桌面背景简洁清晰。图像质量极高，苹果的光泽、纹理、色彩都呈现出真实自然的视觉效果。唯一可挑剔的细节是下排中间苹果与上排存在极微小的对齐偏差，以及个别苹果顶部有轻微自然色差，但这些都不影响整体完成度。该图像充分展示了模型在物体数量控制、空间排列和属性一致性方面的优秀能力。

进阶难度评测结果

得分：83.75 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了提示词的核心要求：6只蝴蝶数量准确，颜色花纹各具特色，空间分布具有一定层次感，背景森林小径场景完整。主要不足在于右下角白色蝴蝶与背景融合度偏高，以及中央两只蝴蝶空间间距略小。整体而言是一张质量较好的AI生成图像，较好地完成了「生成并排列六个物体」的测试任务。

困难难度评测结果

得分：74.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了现代艺术画廊六件雕塑的生成任务，材质多样性和画廊环境质量较高，金属与木质雕塑的材质呈现尤为出色。然而，核心问题集中在空间布局逻辑上：入口结构缺失导致金属雕塑的位置属性无法验证，大理石雕像未能真正置于墙角，玻璃装置与照明设备的边界模糊影响了作品数量的清晰辨认。整体而言是一张视觉质量不错但在提示词精确执行上存在多处偏差的图像，属于「部分完成」到「基本完成」之间的水平。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题