响应式图片

这是一个 AI 大模型评测用例，下面将详细介绍测试内容和各模型的表现。

基本信息

用例名称：响应式图片
测试类型：网页生成
评测维度：响应式布局
参与评测的模型数：193 个

系统提示词（System Prompt）

你是一名前端开发工程师，擅长 HTML、CSS 和响应式布局设计。你的任务是根据需求编写结构清晰、样式规范的网页代码。所有代码需在单个 HTML 文件中完成，确保可独立运行。使用语义化 HTML 标签组织页面结构。使用 CSS 媒体查询实现基础响应式布局。图片需配置必要的可访问性属性。代码风格简洁易读，适合入门级开发者理解和维护。

用户提示词（User Prompt）

# 响应式图片展示页面（基础版） ## 应用要求 - 所有代码（HTML、CSS）必须在一个 HTML 文件中 - 直接输出完整的、可独立运行的 HTML 代码 - 图片使用在线占位图服务（如 https://picsum.photos 或 https://via.placeholder.com） ## 页面结构与功能要求 ### 1. 页面头部（Header） - 包含网站标题和简短描述文字 - 背景使用纯色或简单的线性渐变（2种颜色即可） - 文字居中显示，颜色与背景形成明显对比 ### 2. 图文混排区域 - **桌面端（≥768px）**：图片与文字左右并排，各占 50%，使用 Flexbox 实现 - **手机端（<768px）**：图片在上，文字在下，垂直堆叠布局 - 包含至少 2 组图文混排内容 - 图片宽度在各断点下自适应容器宽度 ### 3. 图片画廊 - 使用 CSS Flexbox 或 Grid 实现简单的多列布局： - 手机端（<768px）：1 列 - 桌面端（≥768px）：3 列 - 所有画廊图片使用 `object-fit: cover` 保持统一比例（宽高比 4:3 或 16:9） - 图片悬停时添加简单的透明度变化效果（opacity 0.8） - 包含至少 6 张图片 ### 4. 图片基础要求 - 所有 `<img>` 标签必须包含有意义的 `alt` 文本 - 图片设置 `width: 100%` 使其自适应容器宽度 - 非首屏图片使用 `loading="lazy"` 延迟加载 ### 5. 断点设计 - 仅需实现一个断点：768px - 手机端（<768px）：单列布局，图片全宽显示 - 桌面端（≥768px）：多列布局 ### 6. 页面底部（Footer） - 包含简单的版权信息文字 - 背景色与 Header 保持一致 - 文字居中显示请直接输出完整的 HTML 代码。

各模型评测结果

第 1：qwen3.6-plus-preview，得分 100.0 分 — 查看该模型的详细评测结果
第 2：Gemini 3.5 Flash，得分 97.7 分 — 查看该模型的详细评测结果
第 3：Qwen 3.7 Max，得分 97.0 分 — 查看该模型的详细评测结果
第 4：GLM-5.1，得分 96.9 分 — 查看该模型的详细评测结果
第 5：MiniMax-M3，得分 96.5 分 — 查看该模型的详细评测结果
第 6：deepseek-v4-flash，得分 96.5 分 — 查看该模型的详细评测结果
第 7：Tencent: Hy3 preview (free)，得分 96.4 分 — 查看该模型的详细评测结果
第 8：Claude Opus 4.6，得分 96.1 分 — 查看该模型的详细评测结果
第 9：glm-5.2，得分 96.0 分 — 查看该模型的详细评测结果
第 10：Google: Gemma 4 26B A4B ，得分 95.5 分 — 查看该模型的详细评测结果
第 11：kimi-k2.6，得分 95.4 分 — 查看该模型的详细评测结果
第 12：glm-4.7，得分 95.4 分 — 查看该模型的详细评测结果
第 13：deepseek-v4-pro，得分 95.3 分 — 查看该模型的详细评测结果
第 14：mimo-v2.5，得分 95.25 分 — 查看该模型的详细评测结果
第 15：Gpt 5.5，得分 95.2 分 — 查看该模型的详细评测结果
第 16：GLM-5v-turbo，得分 95.1 分 — 查看该模型的详细评测结果
第 17：Anthropic: Claude Sonnet 4.6，得分 95.0 分 — 查看该模型的详细评测结果
第 18：qwen3.5-omni-plus，得分 94.8 分 — 查看该模型的详细评测结果
第 19：Elephant，得分 94.8 分 — 查看该模型的详细评测结果
第 20：OpenAI: GPT-5 Mini，得分 94.5 分 — 查看该模型的详细评测结果
第 21：Claude Opus 4 7，得分 94.0 分 — 查看该模型的详细评测结果
第 22：Google: Gemma 4 31B，得分 93.6 分 — 查看该模型的详细评测结果
第 23：deepseek-v3.2，得分 93.3 分 — 查看该模型的详细评测结果
第 24：mimo-v2-flash，得分 93.1 分 — 查看该模型的详细评测结果
第 25：OpenAI: gpt-oss-20b，得分 92.6 分 — 查看该模型的详细评测结果
第 26：qwen3.5-omni-flash，得分 92.1 分 — 查看该模型的详细评测结果
第 27：mimo-v2.5-pro，得分 92.0 分 — 查看该模型的详细评测结果
第 28：qwen3-coder-plus，得分 92.0 分 — 查看该模型的详细评测结果
第 29：OpenAI: gpt-oss-120b，得分 91.6 分 — 查看该模型的详细评测结果
第 30：doubao-seed-2-0-pro，得分 91.6 分 — 查看该模型的详细评测结果
第 31：doubao-seed-2-0-code，得分 89.38 分 — 查看该模型的详细评测结果
第 32：MiniMax-M2.7，得分 85.5 分 — 查看该模型的详细评测结果
第 33：Google: Gemini 3.1 Pro Preview，得分 85.0 分 — 查看该模型的详细评测结果
第 34：kimi-k2.5，得分 84.7 分 — 查看该模型的详细评测结果
第 35：OpenAI: GPT-5.4，得分 84.4 分 — 查看该模型的详细评测结果
第 36：qwen3.5-35b-a3b，得分 83.9 分 — 查看该模型的详细评测结果
第 37：Meituan: LongCat Flash Chat，得分 83.6 分 — 查看该模型的详细评测结果
第 38：OpenAI: GPT-5 Nano，得分 83.5 分 — 查看该模型的详细评测结果
第 39：Anthropic: Claude Haiku 4.5，得分 83.3 分 — 查看该模型的详细评测结果
第 40：hunyuan-pro，得分 83.1 分 — 查看该模型的详细评测结果
第 41：glm-5-turbo，得分 83.1 分 — 查看该模型的详细评测结果
第 42：xAI: Grok 4.20 Beta，得分 82.5 分 — 查看该模型的详细评测结果
第 43：doubao-seed-2-0-lite，得分 82.2 分 — 查看该模型的详细评测结果
第 44：doubao-seed-1-8，得分 82.0 分 — 查看该模型的详细评测结果
第 45：qwen3.5-27b，得分 81.4 分 — 查看该模型的详细评测结果
第 46：mimo-v2-omni，得分 81.2 分 — 查看该模型的详细评测结果
第 47：Qwen: Qwen3.5-9B，得分 80.7 分 — 查看该模型的详细评测结果
第 48：xAI: Grok 4.1 Fast，得分 80.6 分 — 查看该模型的详细评测结果
第 49：mimo-v2-pro，得分 80.2 分 — 查看该模型的详细评测结果
第 50：StepFun: Step 3.5 Flash，得分 80.1 分 — 查看该模型的详细评测结果
第 51：NVIDIA: Nemotron 3 Super (free)，得分 79.7 分 — 查看该模型的详细评测结果
第 52：doubao-seed-1-6，得分 79.7 分 — 查看该模型的详细评测结果
第 53：MiniMax-M2.1，得分 79.1 分 — 查看该模型的详细评测结果
第 54：doubao-seed-2-0-mini，得分 79.1 分 — 查看该模型的详细评测结果
第 55：doubao-seed-1-6-flash，得分 78.3 分 — 查看该模型的详细评测结果
第 56：Google: Gemini 3 Flash Preview，得分 77.8 分 — 查看该模型的详细评测结果
第 57：Grok 4，得分 75.8 分 — 查看该模型的详细评测结果
第 58：OpenAI: GPT-4o-mini，得分 75.5 分 — 查看该模型的详细评测结果
第 59：Google: Gemini 2.5 Flash Lite，得分 73.0 分 — 查看该模型的详细评测结果
第 60：hunyuan-turbo，得分 72.2 分 — 查看该模型的详细评测结果
第 61：MiniMax-M2.5，得分 72.1 分 — 查看该模型的详细评测结果
第 62：hunyuan-large，得分 71.8 分 — 查看该模型的详细评测结果
第 63：Meta: Llama 3.3 70B Instruct，得分 66.6 分 — 查看该模型的详细评测结果
第 64：Mistral: Mistral Nemo，得分 59.7 分 — 查看该模型的详细评测结果
第 65：qwen3-max，得分 0.8 分 — 查看该模型的详细评测结果
第 66：GPT-5.2，得分 — 分 — 查看该模型的详细评测结果

题目

模型排行

加载中…

模型评分

加载中…