GPT Image 2 在「首尔霓虹街头韩文书法灯牌生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GPT Image 2
- 用例名称:首尔霓虹街头韩文书法灯牌生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张夜晚首尔街头的场景图像。 画面要求: - 画面中心有一个垂直招牌 - 招牌上用韩文书法写着「사랑」(意为「爱」) - 文字呈现粉色霓虹发光效果 - 整体为城市夜景氛围
任务要求
AI 模型需要满足以下要求:
- 画面中存在一个垂直招牌
- 招牌上的韩文「사랑」文字清晰可辨,字形结构准确
- 文字呈现粉色霓虹发光效果
- 整体为夜晚城市街头场景
- 画面整体清晰,构图合理
评测结果
综合得分
该模型在此用例的得分为:68.3 分(满分 100 分),已通过
基础难度评测结果
- 得分:68.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一次典型的「技术优秀但任务失败」案例。图像在霓虹光效渲染和场景氛围营造方面表现出色,达到了专业级的视觉质量,首尔夜景的还原度极高。然而,提示词的核心要求——在招牌上准确呈现韩文「사랑」——完全未能实现,中心招牌上的文字字形结构错误,无法辨识为目标文字。这是致命性缺陷,使得整个生成任务从根本上失败。AI 文字生成能力的短板在此暴露无遗,尽管视觉美学达标,但核心功能性要求的失败导致图像完全不可用。 【GEMINI】这张图像基本完成了提示词的构图要求,但在核心的文字准确性上表现欠佳。作为画面的视觉中心,「사랑」一词的书法结构经不起推敲,存在明显的AI生成痕迹(如笔画融合错误)。虽然光效和氛围达到了及格水平,但细节处的违和感(如背景乱码和透视问题)使其无法成为一张高质量的专业视觉设计作品。 【KIMI】整体上,这张图像较好地完成了提示词的要求,韩文「사랑」的字形结构准确,场景氛围营造到位。霓虹光效表现稍显不足,亮度和对比度可以进一步增强。
进阶难度评测结果
- 得分:80.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在场景氛围营造和地面倒影效果上表现优秀,成功呈现了明洞雨夜繁华街头的视觉冲击力。核心要求中的「사랑」文字清晰可辨、粉色霓虹效果到位、地面倒影清晰、两侧商铺氛围浓郁,主要扣分点在于Gungseo书法风格的体现不够到位,字体艺术性略显不足。整体而言是一张高质量的AI生成图像,完成了提示词的大部分核心要求。 【GEMINI】这是一张氛围感极佳的视觉作品,但在‘文字艺术性’与‘物理反射逻辑’这两个核心技术点上出现了明显失分。作为以韩文书法为卖点的构图,模型未能理解Gungseo体的笔触特征;而地面倒影的简化处理则拉低了画面的写实深度。整体属于‘氛围满分,细节露馅’的典型AI生成产物。 【KIMI】整体上,图像较好地完成了提示词要求,文字准确性和场景氛围都表现良好,但在地面倒影和光影层次感上还有提升空间。
困难难度评测结果
- 得分:74.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在氛围营造、倒影效果和构图层次方面表现良好,成功呈现出首尔明洞雨夜街头的视觉质感。然而,核心致命问题在于韩文文字的严重错误——「사랑」被错误渲染为「사라ㅇ」,第三个字符结构完全错误,这直接导致主题表达失败。此外,Gungseo书法风格缺失、招牌表面雨水光效不够突出、倒影物理精确性存在瑕疵等问题进一步拉低了整体质量。文字准确性是本提示词的核心考察点,该错误属于不可接受的基础性失误,严重影响最终评分。 【GEMINI】这是一张在氛围营造和色彩美学上表现优异的作品,但在细节的物理逻辑与特定文化元素(韩文书法)的深度理解上仍有明显差距。文字虽‘准’但不‘精’,倒影虽‘美’但不‘真’,属于典型的AI感较强的华丽图像,未能完全跨越物理真实性的门槛。 【KIMI】整体上,图像较好地完成了提示词要求,但在一些细节上还有提升空间。
相关链接
您可以通过以下链接查看更多相关内容: