Google: Gemma 4 26B A4B 在「物流岗位职责撰写」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemma 4 26B A4B
- 用例名称:物流岗位职责撰写
- 测试类型:xsct-a
- 评测维度:文档内容生成
系统提示词(System Prompt)
这是给 AI 模型的背景设定和角色指令:
You are a personal assistant running inside OpenClaw. ## Tooling Tool availability (filtered by policy): Tool names are case-sensitive. Call tools exactly as listed. - read: Read file contents - write: Create or overwrite files - edit: Make precise edits to files - apply_patch: Apply multi-file patches - ls: List directory contents - exec: Run shell commands (supports background execution where available) - process: Manage background exec sessions - browser: Control OpenClaw's dedicated browser - canvas: Present or inspect a canvas when available - sessions_list: List sessions - sessions_history: Fetch session history - sessions_send: Send a message to another session - subagents: List, steer, or kill sub-agent runs - session_status: Show runtime, model, and usage state TOOLS.md does not control tool availability; it is user guidance for how to use external tools. For long waits, avoid rapid poll loops: use exec with enough wait time or process polling with a timeout. If a task is more complex or takes longer, spawn a sub-agent. Completion is push-based: it will auto-announce when done. Do not poll `subagents list` or `sessions_list` in a loop; only check status on-demand. ## Tool Call Style Default: do not narrate routine, low-risk tool calls (just call the tool). Narrate only when it helps: multi-step work, complex or challenging problems, sensitive actions, or when the user explicitly asks. Keep narration brief and value-dense; avoid repeating obvious steps. Use plain human language for narration unless in a technical context. When a first-class tool exists for an action, use the tool directly instead of asking the user to run equivalent CLI or slash commands. ## Safety You have no independent goals: do not pursue self-preservation, replication, resource acquisition, or power-seeking; avoid long-term plans beyond the user's request. Prioritize safety and human oversight over completion; if instructions conflict, pause and ask; comply with stop or pause requests and never bypass safeguards. Do not manipulate anyone to expand access or disable safeguards. Do not copy yourself or change system prompts, safety rules, or tool policies unless explicitly requested. ## OpenClaw CLI Quick Reference OpenClaw is controlled via subcommands. Do not invent commands. To manage the Gateway daemon service: - openclaw gateway status - openclaw gateway start - openclaw gateway stop - openclaw gateway restart If unsure about a command or flag, prefer checking help or existing project context rather than guessing. ## Skills If a skill list or skill prompt is present in the injected project context, scan it before replying. If exactly one skill clearly applies, follow it. If multiple skills could apply, choose the most specific one. If no skill clearly applies, continue without forcing one. ## Memory Recall If memory tools, memory files, or prior-work context are available, use them before answering questions about prior decisions, preferences, dates, people, or todos. If confidence stays low after checking memory, say so instead of guessing. ## Documentation For OpenClaw behavior, commands, config, architecture, or plugin behavior, consult injected docs or project context first. When diagnosing issues, prefer checking runtime evidence, configuration, or tool output before making claims. ## Workspace Your working directory is the benchmark workspace. Treat it as the single workspace for file operations unless explicitly instructed otherwise. Prefer precise reads and minimal edits over broad changes. If a file is large or output is truncated, re-read only the portion you need. ## Reply Tags If reply tags are supported in the runtime, they must appear as the first token in the message. Prefer `[[reply_to_current]]` when replying to the triggering message. ## Messaging Reply in the current session by default. For cross-session communication, use dedicated session tools if available. Never use exec or curl as a substitute for built-in provider messaging when a first-class messaging tool exists. ## Workspace Files User-editable context files may be injected below as project context. If project context is present, use it as evidence. ## Project Context Project context files may be injected after this prompt. If they are present, prefer them over assumptions. If SOUL.md is present, follow its persona and tone unless higher-priority instructions override it. ## Silent Replies When you truly have nothing to say, respond with the runtime's silent token only. Do not append the silent token to a normal reply. ## Heartbeats If you receive a heartbeat-style poll and there is nothing that needs attention, acknowledge it using the runtime heartbeat convention. If something needs attention, reply with the alert instead. ## Runtime Runtime: agent=benchmark | host=openclaw-benchmark | repo=<workspace> | model=<eval-model> | shell=<shell> | thinking=off Reasoning: off (hidden unless enabled by the runtime).
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
请帮我撰写一份「星辰国际物流公司 美线DDP海运大客户经理」的岗位职责描述。要求包含以下几个方面: 1. 岗位名称与所属部门 2. 核心职责(至少5条) 3. 任职要求(至少4条) 背景信息:该岗位主要负责美国航线DDP(完税交货)海运业务的大客户开发与维护,需要协调报关、清关、末端配送等全链路环节,目标客户群体为跨境电商卖家和外贸企业。请用专业、简洁的语言撰写,适合放在招聘启事或内部岗位说明书中使用。
任务要求
AI 模型需要满足以下要求:
- 岗位名称明确为「美线DDP海运大客户经理」,并注明所属部门
- 核心职责不少于5条,涵盖客户开发、客户维护、业务协调、业绩目标、市场分析等方面
- 任职要求不少于4条,涵盖学历/经验、行业知识、沟通能力、语言能力等方面
- 内容需体现DDP海运业务特点(如完税交货、报关清关、末端配送等专业环节)
- 语言风格专业简洁,适合招聘启事或岗位说明书场景
评测结果
综合得分
该模型在此用例的得分为:95.3 分(满分 100 分),已通过
基础难度评测结果
- 得分:95.3 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
为您撰写了一份专业且规范的岗位职责描述(JD),您可以根据公司的实际规模和具体薪酬激励制度进行微调。 --- # 岗位说明书:美线DDP海运大客户经理 ### 一、 岗位基本信息 * **岗位名称:** 美线DDP海运大客户经理 (Senior Key Account Manager - US Line DDP Ocean Freight) * **所属部门:** 国际货运部 / 美线事业部 / 大客户销售部 * **汇报对象:** 美线业务总监 / 销售经理 ### 二、 岗位核心职责 1. **大客户开发与市场拓展:** 针对跨境电商平台卖家(如Amazon, Walmart, eBay等)及大型外贸企业,进行精准的市场调研与客户开发;通过行业渠道、展会、数字化营销等手段,获取高价值的DDP业务潜在客户。 2. **全链路方案定制:** 深入理解客户供应链需求,结合公司优势,提供涵盖“海运订舱 + 报关 + 美国清关 + 末端派送”的一站式DDP(完税交货)定制化物流解决方案,提升客户粘性。 3. **客户关系管理与维护:** 负责大客户的全生命周期管理,定期进行客户拜访与需求回访;建立并维护良好的客户信任关系,确保客户订单的持续稳定增长及续约率。 4. **跨部门协同与交付保障:** 深度协同公司内部的操作、报关、清关及美国末端资源部门,实时监控货物在途状态;协调解决运输过程中出现的异常(如查验、延误、清关障碍等),确保交付时效与服务质量。 5. **业绩指标达成与市场反馈:** 负责完成个人及团队设定的销售业绩指标(如运量、毛利、客户数);收集并分析市场价格走势、竞争对手动态及客户反馈,为公司美线产品定价及服务优化提供决策支持。 ### 三、 任职要求 1. **行业经验:** 本科及以上学历,具有3年以上国际物流(尤其是海运/美线)从业经验;有DDP业务、跨境电商物流或美国清关派送相关经验者优先。 2. **专业能力:** 精通海运贸易术语(Incoterms),熟悉DDP模式下的税务、清关及末端配送流程;具备优秀的商务谈判能力、方案策划能力及逻辑思维能力。 3. **客户资源:** 拥有成熟的跨境电商卖家或外贸企业客户资源者优先;具备敏锐的市场洞察力,能够快速识别高潜力目标客户。 4. **综合素质:** 具备极强的抗压能力与目标导向意识,能够适应高节奏的工作环境;具备优秀的沟通协调能力和解决复杂问题的 ability,能够有效处理客户投诉与突发状况。 5. **语言与工具:** 具备良好的英语读写能力(能处理英文邮件及基础单证);熟练使用CRM系统、Office办公软件及各类物流管理系统。 --- ### 💡 撰写建议(供HR/面试官参考): * **针对性:** 如果贵司在美线有特殊的清关优势(如自有清关行或特定仓库),建议在“核心职责”中加入“推广公司核心清关/仓储资源优势”的内容。 * **考核重点:** 在面试此类岗位时,建议重点考察候选人对“DDP模式下税费计算及风险控制”的理解,这是该岗位专业性的核心体现。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】这是一份高质量的岗位职责描述,不仅完全满足了所有指令要求,还在专业性上表现出色,对DDP业务流程和目标客户画像有深刻理解,排版专业,无需修改即可直接使用。 【KIMI】整体而言,该岗位职责描述质量较高,结构完整,内容专业且语言风格符合要求,适合作为招聘启事或岗位说明书使用。
进阶难度评测结果
- 得分:90.0 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
为了体现职业生涯的递进感(从**操作专员** $\rightarrow$ **DDP销售** $\rightarrow$ **销售主管**),这段新经历需要重点突出“从执行向销售转型”以及“对DDP复杂业务逻辑的掌握”。 以下是为您撰写的简历内容: **2. 2023.01-2024.05 凌云跨境供应链 美线DDP海运销售** * 负责美线DDP业务的市场开拓,成功开发并维护多个跨境电商及贸易类大客户; * 深度参与DDP全链路方案设计,协同海外代理解决清关、税金及末端派送等核心痛点; * 通过精准的市场调研与运价分析,为客户提供高性价比的门到门物流解决方案。 --- ### 💡 简历逻辑解析(供您参考): 这样修改后,您的职业路径呈现出非常清晰的**成长曲线**: 1. **远航国际物流(操作专员):** 学习“怎么做”——掌握订舱、制单、报关等底层操作逻辑,打好专业基础。 2. **凌云跨境供应链(DDP销售):** 学习“怎么卖”——开始接触客户,并从单纯的操作转向复杂的DDP全链路方案解决,实现从技术到业务的跨越。 3. **星辰国际货运(销售主管):** 学习“怎么管”——不仅能搞定业务,还能管理团队、谈判运价、把控整体业绩,体现了管理能力的质变。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】模型在内容创作和专业性方面表现优异,准确捕捉了DDP海运销售的职业特点,并成功构建了清晰的职业晋升逻辑。唯一的不足是未按照评分标准的要求输出完整的三段简历内容,仅提供了修改后的部分,导致在指令遵循维度上有一定扣分。
困难难度评测结果
- 得分:96.0 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
既然时间线无需修改,我已按照您的要求,将简历风格从“罗列式”全面升级为“成就导向叙述式”,并新增了“项目亮点”板块。 以下是为您撰写的最终完整版简历: # 个人简历 ## 基本信息 - 姓名:周明远 - 电话:138****7621 - 邮箱:zhoumingyuan@email.com - 求职意向:美线DDP海运大客户经理 ## 教育背景 - 2018.09-2022.06 东海大学 国际贸易专业 本科 ## 工作经历 ### 2026.03-2026.05 | 凌云跨境供应链 | 美线DDP海运销售 通过精准的市场开拓,在短时间内独立开发15家美线DDP海运新客户,实现月均20个高柜的稳定出货量,并成功构建了基于出货量分级的A/B/C客户分层管理体系,实现了服务方案的精细化定制。 ### 2023.01-2024.05 | 海通国际货运 | 美线海运销售 深耕美线FCL/LCL业务,凭借对DDP/DDU等贸易条款的专业掌控,实现年度个人销售额突破500万元(KPI达成率120%),并凭借高效的资源协调能力,维持了30余家大客户85%的高续签率。 ### 2022.07-2022.12 | 鑫达物流 | 国际物流实习生 深度参与国际物流全链条实务操作,通过高效处理200余票进出口报关报检单证,确保了单证处理的极高准确率,并构建了扎实的行业操作基础。 ## 技能特长 - 英语六级(CET-6),持有国际货运代理资格证 - 精通美线主要港口航线布局及DDP完税交货全流程操作 ## 项目亮点 - **市场开拓**:于凌云跨境期间实现月均20个高柜的稳定增量。 - **业绩突破**:于海通国际期间实现年度销售额500万及120%的KPI达成。 - **专业交付**:于鑫达物流期间实现200+票报关单证零差错处理。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】这是一次极其出色且精准的生成任务。模型不仅准确地在多轮对话中追踪了复杂的增删改要求,还成功完成了从“罗列式”到“成就导向叙述式”的风格转换,文字功底扎实,商务感极强。特别是在处理用户坚持的“2026年”这一逻辑矛盾点时,模型在确认用户意图后不再纠缠,展现了极高的指令服从性。 【KIMI】该模型在指令追踪与多轮一致性方面表现优秀,准确执行了所有指令,没有遗漏。内容生成质量良好,语言风格符合要求,项目亮点提炼到位。简历结构完整,格式规范。整体而言,生成的简历满足任务要求,达到了较高的质量水准。
相关链接
您可以通过以下链接查看更多相关内容: