Elephant 在「医疗报告跨语言转述」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Elephant
  • 用例名称:医疗报告跨语言转述
  • 测试类型:文本生成
  • 评测维度:翻译能力

系统提示词(System Prompt)

这是给 AI 模型的背景设定和角色指令:

你是一名资深多语种医学翻译专家及医患沟通顾问,专注于心内科及内科领域的医学文书翻译与通俗化转述。 回答要求: 1. 严禁在输出中包含任何自我引用、解释性开场白或结尾总结,直接输出翻译正文。 2. 医学数值(如血压值、胆固醇数值)必须原样保留,不得修改或省略。 3. 专业医学术语须在准确翻译的同时,以括号或简短说明的方式转化为普通患者可理解的语言。 4. 在段落之间、建议事项之间的合适位置添加换行,使文本结构清晰易读。 5. 保持原文全部信息,不得增删任何医疗事实或建议内容。

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

请将以下英文心内科医疗报告翻译成中文。要求在保持医学术语准确性的同时,让没有医学背景的普通患者也能读懂报告内容。 原文: 'The patient presents with mild hypertension (140/90 mmHg) and elevated LDL cholesterol (165 mg/dL). Recommend lifestyle modifications including dietary changes and regular exercise. Follow-up in 3 months.' 具体要求: 1. 保持原意完全不变,所有医学数值必须准确保留 2. 对「hypertension(高血压)」和「LDL cholesterol(低密度脂蛋白胆固醇)」等专业术语,须在翻译时附加通俗说明 3. 在合适的位置添加换行使其分段,建议事项每项单独成行 4. 直接输出格式化后的翻译文本,不要加任何解释或包装

任务要求

AI 模型需要满足以下要求:

  1. 血压值「140/90 mmHg」和胆固醇值「165 mg/dL」必须原样出现在译文中,不得省略或替换单位。
  2. 「hypertension」须译为「高血压」,「LDL cholesterol」须译为「低密度脂蛋白胆固醇」,并附有通俗解释(如「即血液中的'坏胆固醇'」)。
  3. 译文须涵盖原文三个核心信息:①病情描述、②生活方式建议(含饮食调整和规律运动两项)、③三个月后复诊。
  4. 建议事项(饮食调整、规律运动)须分行呈现,整体文本有清晰的段落结构。
  5. 输出内容为纯翻译正文,不含任何「以下是翻译」「译文如下」等引导语或解释性文字。

评测结果

综合得分

该模型在此用例的得分为:91.7 分(满分 100 分),已通过

基础难度评测结果

  • 得分:91.7 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

患者表现出轻度高血压(140/90 mmHg)(血压偏高)。 低密度脂蛋白胆固醇水平升高(165 mg/dL)(坏胆固醇水平高)。 建议进行生活方式调整,包括饮食改变。 建议进行规律运动。 3个月后复诊。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】该模型表现非常出色,严格遵循了所有的负面约束和格式要求。翻译不仅在医学术语上保持了专业性,还成功地通过通俗化的解释降低了理解门槛。排版清晰,非常适合患者阅读。 【KIMI】整体来看,该译文较好地完成了原文信息的传递,对专业术语进行了必要的通俗解释,但在格式和内容完整性方面还有提升空间。建议进一步细化生活方式建议,使译文更加完整、易于患者理解。

进阶难度评测结果

  • 得分:91.4 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

患者目前表现出中度抑郁发作(情绪低落、兴趣减退等核心症状),并伴随躯体不适(如睡眠或消化方面的困扰)。 建议采用认知行为治疗(通过谈话方式帮助调整负面思维模式),并配合低剂量SSRI类药物(一种调节情绪的常用抗抑郁药)进行治疗。 在患者积极配合治疗(按时服药并参与治疗)的前提下,预后情况通常较为乐观。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】这是一份高质量的医学翻译。模型不仅精准完成了德语到汉语的术语转换,更出色地平衡了专业性与通俗性。它完美执行了系统提示词中的所有约束,特别是分段处理和去包装化输出,非常符合医患沟通的实际需求。在术语解释上,它优先考虑了家属的理解成本,虽然省略了复杂的生化全称,但功能性描述非常准确。 【KIMI】整体而言,翻译准确、通俗易懂,体现了对精神科语境的敏感性。在格式和语气方面也基本符合要求,但仍有改进空间,特别是在传递预后信息时,可以更加积极一些,以增强家属的信心。

困难难度评测结果

  • 得分:88.7 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

You have been diagnosed with advanced lung adenocarcinoma (T4N2M1a, Stage IV), which means the cancer has spread to distant parts of the body (Metastasis to distant organs). The test shows that you are positive for an EGFR gene mutation (a change in a protein that can fuel cancer growth), and treatment with targeted molecular drugs (medicines that specifically attack cancer cells while sparing some healthy cells) is recommended. While we approach your outlook with care and respect, focusing on your comfort and choices, there is meaningful hope that these new treatment options can help extend the time you are able to live with quality.

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】这是一份高质量的翻译。模型很好地平衡了医学专业性和患者可理解性,特别是在处理敏感的预后沟通时,语气拿捏得当,体现了资深医患沟通顾问的水平。格式上严格遵守了负向约束。唯一的微小改进空间是对 TNM 各个指标的具体含义解释可以更详细一些,以帮助患者更精准地理解分期。 【KIMI】该翻译整体表现良好,准确传达了原文的医学信息,并以患者友好的方式进行了解释。预后部分体现了跨文化沟通策略,但人文关怀的表达还有提升空间。格式基本符合要求,但分段逻辑性有待加强。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...