Qwen: Qwen3.5-9B 在「投资尽调报告精华提炼」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Qwen: Qwen3.5-9B
用例名称：投资尽调报告精华提炼
测试类型：文本生成
评测维度：文本摘要

系统提示词（System Prompt）

这是给 AI 模型的背景设定和角色指令：

你是一名具备金融背景的专业投资分析师助理，擅长阅读投资尽调报告并提炼关键信息。回答要求： 1. 严格基于报告原文提取信息，禁止捏造或推测任何数据，所有数字必须与原文完全一致。 2. 使用清晰、简洁的专业语言，以条目或分段形式呈现关键要点，便于投资委员会快速阅读。 3. 优先关注财务表现、团队构成、融资情况、客户资源和产品价值等核心维度。 4. 保持客观中立的投研语调，不添加主观评价或无依据的结论。

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

以下是一份关于某科技初创公司的投资尽调报告片段，请仔细阅读后，为投资委员会提炼并总结报告中的关键要点。 --- 【尽调报告摘录】公司成立于2021年，专注于AI驱动的供应链优化解决方案。2023年营收达到500万美元，同比增长200%。团队规模35人，其中技术人员占60%。已获得两轮融资，总计800万美元。主要客户包括3家世界500强企业。产品在降低库存成本方面平均为客户节省15-20%。 --- 请按照以下五个维度，逐一提炼报告中的关键信息，每个维度用1-3句话概括： 1. **公司基本情况**（成立时间、业务方向） 2. **财务表现**（营收规模与增长） 3. **团队构成**（规模与结构） 4. **融资情况**（轮次与金额） 5. **客户与产品价值**（客户质量与产品效果）

任务要求

AI 模型需要满足以下要求：

五个维度均需覆盖，不得遗漏任何一项。
所有数字（营收金额、增长率、团队人数、技术人员占比、融资总额、客户数量、节省比例）必须与原文完全一致，不得有任何偏差。
每个维度的描述应简洁准确，不超过3句话，避免冗余重复。
不得在原文信息之外添加任何推断、评价或无依据的结论。
语言表达应符合投资报告的专业风格，避免口语化表达。

评测结果

综合得分

该模型在此用例的得分为：96.2 分（满分 100 分），已通过

基础难度评测结果

得分：96.2 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

1. **公司基本情况** 公司成立于 2021 年，核心业务聚焦于 AI 驱动的供应链优化解决方案。 2. **财务表现** 2023 年营收达到 500 万美元，同比增长 200%。 3. **团队构成** 团队总规模 35 人，其中技术人员占比 60%。 4. **融资情况** 已获得两轮融资，累计融资金额总计 800 万美元。 5. **客户与产品价值** 主要客户包括 3 家世界 500 强企业，产品在降低库存成本方面平均为客户节省 15-20%。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】候选输出整体表现优秀，严格遵循原文提取信息，所有关键数据准确无误，五个维度结构清晰完整，语言专业简洁，完全符合投资委员会快速阅读的使用场景。与参考答案相比，候选输出更为简洁克制，未额外添加主观评价（如「增速显著」「技术导向特征明显」等），在「禁止推断」要求层面反而更为严谨。细节上可进一步优化引言语句和部分维度的专业化措辞，但整体质量达到较高水准。【GEMINI】模型表现出色，完美遵循了所有指令要求。不仅在数据提取上做到了零误差，而且在结构化呈现和专业语调控制方面也表现得非常专业，是一份高质量的尽调摘要。【KIMI】该候选输出在事实准确性方面表现完美，所有数据与原文完全一致，无任何幻觉或错误。结构清晰规范，五个维度完整覆盖。语言表达专业简洁，符合投资报告要求。主要提升空间在于：可在不添加主观评价的前提下，对信息进行适度整合提炼（如占比换算、趋势说明），以增强「为投资委员会提炼关键信息」的服务价值，目前呈现方式偏重于信息罗列而非深度提炼。

进阶难度评测结果

得分：87.5 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

**投资执行摘要** **1. 投资亮点** * **营收增速显著超越市场预期，且具备高盈利质量**：公司 2023 年营收达 500 万美元，较 2022 年（200 万美元）同比增长 150%。该增速远超市场 25% 的年增长率，表明产品市场需求强劲。同时，65% 的毛利率在科技行业中处于高位，反映出公司在成本控制或技术溢价方面具备显著优势，支撑了营收增长的质量。 * **具备技术先发优势与广阔市场空间**：在 50 亿美元的总可寻址市场（TAM）中，面对 5 家主要竞争对手，公司核心算法具备约 2 年的技术领先优势。这一技术窗口期结合高毛利表现，验证了公司在细分赛道的卡位能力，为未来收入增长提供了潜在支撑。 * **现金流跑道充裕，具备阶段性运营安全垫**：公司当前现金跑道为 18 个月，配合 15 万美元/月的月度烧钱率，表明公司资金状况在短期内能够支撑持续运营。结合 500 万美元的年度营收规模，当前流动性状况足以覆盖下一轮融资前的正常业务开支，降低了短期资金链断裂风险。 **2. 主要风险** * **客户集中度过高，存在收入波动风险**：前 3 大客户贡献了 70% 的收入，收入来源结构较为单一。若核心客户发生流失或价格谈判失利，将直接导致营收大幅下滑，并对 65% 的毛利率及现金流稳定性造成实质性冲击。 * **技术护城河存在被侵蚀的风险**：尽管目前拥有约 2 年的技术领先优势，但核心算法存在被竞争对手复制的风险。若技术壁垒降低，可能导致公司失去差异化竞争优势，进而影响长期增长动能及市场定价能力。 * **数据隐私监管趋严带来的合规成本**：数据隐私相关法规日趋严格，可能迫使公司在合规投入上增加开支，或限制部分业务模式的扩展。若无法及时适应监管要求，可能面临合规处罚或市场准入受限的风险。 **3. 综合建议** * **投资建议**：**审慎推进**。 * **决策依据**：尽管公司展现了优异的营收增长（150%）和盈利指标（65% 毛利率），但 70% 的客户集中度与 2 年技术领先周期的不确定性构成了重大投资约束。在缺乏客户多元化验证及技术壁垒深度保护的情况下，直接全额投资风险较高。 * **关键前提条件与后续尽调方向**： 1. **客户结构验证**：需进一步尽调公司具体的客户流失率及合同续约条款，评估在失去单一客户情况下营收的韧性。 2. **技术 IP 审计**：核查核心算法的知识产权保护体系及专利布局，量化技术被复制的风险对估值的影响。 3. **合规成本测算**：要求管理层提供针对数据隐私法规的合规预算及应对方案，评估其对 2024 年毛利的具体影响。综上所述，建议投资委员会基于上述前提条件，考虑分阶段注资或附加对赌条款后推进投资。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【KIMI】整体而言，候选人的输出质量很高，严格遵循了评分标准和要求。在事实准确性、结构完整性、数据关联分析、风险识别深度以及建议逻辑自洽性等方面都表现出色。尽管在数据分析深度上略逊于参考答案，但整体上已经很好地完成了任务，给出了专业、客观、中立的投资分析和建议。

困难难度评测结果

得分：92.0 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

投资论点团队核心优势显著，CEO 前亚马逊供应链高级总监，CTO MIT 博士，技术团队 40% 来自 FAANG 公司。产品护城河强劲，处理超过 10 亿条供应链数据，已申请 8 项，获批 3 项专利。业务模型成熟，ARR 450 万美元，客户留存率 92%，NPS 65。营收增长明确，预计 2024 年 1200 万美元，2025 年 2500 万美元。当前估值 8000 万美元（16 倍营收），处于同类上市公司平均 PS 倍数 12-20 倍。主要顾虑当前估值距 IPO 所需 1 亿美元 ARR 尚有差距。B 轮融资 2000 万美元后投后估值 1 亿美元，需警惕营收增速不及预期导致 PS 倍数下修。平均合同期限 3 年，但缺乏烧钱率数据，存在资金链断裂风险，需关注现金流。关键成功指标 1. 2025 年营收达成率；2. 净留存率（维持 92% 以上）；3. 毛利率；4. 客户平均合同期限。投资建议建议投资。供应链 SaaS 赛道稀缺，团队背景与数据积累构成核心护城河。附加条件：要求披露未来 12 个月现金流预测，确保资金使用效率，并优先保障 2025 年营收目标，以支撑 3-5 年内 IPO 或并购退出。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】这是一份高质量的投资决策备忘录。模型不仅精准地提取了所有财务和业务数据，还展现了优秀的商业分析能力，特别是在识别信息缺失带来的风险（烧钱率）以及对估值倍数合理性的判断上，体现了资深分析师的专业水准。结构严谨，约束遵守情况完美。【KIMI】整体而言，候选输出在事实准确性和字数约束方面表现较好，但在逻辑结构和分析深度上还有提升空间。建议在Bull Case和Bear Case部分进一步丰富数据支撑和专业判断，使投资备忘录的论证更加充分和有说服力。

基本信息

系统提示词（System Prompt）

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题