mimo-v2-pro 在「数学建模与优化问题」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:mimo-v2-pro
  • 用例名称:数学建模与优化问题
  • 测试类型:文本生成
  • 评测维度:数学能力

系统提示词(System Prompt)

这是给 AI 模型的背景设定和角色指令:

你是一名资深运筹学专家,擅长线性规划建模与求解。 回答要求: 1. 必须明确定义决策变量(Decision Variables),使用规范的数学符号表示。 2. 必须写出标准数学表达式,包括目标函数(Objective Function)和所有约束条件(Constraints)。 3. 必须详述求解过程,列出可行域的所有顶点并逐一代入目标函数进行比较。 4. 最终最优解(产品数量与最大利润)需加粗显示。 5. 回答结构清晰,按「建模 → 求解 → 结论」三段式展开。

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一家工厂每天生产两种产品 A 和 B,相关数据如下: | 资源消耗 | 产品 A(每个) | 产品 B(每个) | 每日可用上限 | |--------------|-------------|-------------|-----------| | 机器时间(小时) | 2 | 3 | 18 | | 原材料(千克) | 3 | 2 | 20 | | 单位利润(元) | 50 | 40 | — | 约束说明: - 产品数量必须为非负整数(本题可先在实数范围内求解,再验证整数可行性)。 - 工厂每天机器时间不超过 18 小时,原材料不超过 20 千克。 请完成以下任务: 1. 建立线性规划数学模型(定义决策变量、写出目标函数与约束条件)。 2. 用图解法(或逐顶点枚举法)求解可行域的所有顶点。 3. 计算各顶点处的目标函数值,确定最优解。 4. 给出结论:工厂每天应生产多少个 A 和 B,最大利润是多少元?

任务要求

AI 模型需要满足以下要求:

  1. 正确定义决策变量(如令 x 为产品 A 的日产量,y 为产品 B 的日产量),并说明其含义与非负性。
  2. 目标函数表达式正确(max Z = 50x + 40y),约束不等式完整且方向正确(≤ 形式)。
  3. 正确列出可行域的所有顶点坐标(至少包含原点、两轴截距点及两约束线交点)。
  4. 逐一将各顶点代入目标函数,计算结果无误,并正确判断最大值点。
  5. 最终结论明确给出最优产量组合与对应最大利润数值。
  6. 求解过程逻辑连贯,步骤清晰,无跳步或计算错误。

评测结果

综合得分

该模型在此用例的得分为:96.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:96.0 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

### 建模 **决策变量:** 设 \( x \) 为每天生产产品 A 的数量(个), 设 \( y \) 为每天生产产品 B 的数量(个)。 **目标函数:** 最大化总利润 \( Z = 50x + 40y \)(元)。 **约束条件:** 1. 机器时间约束:\( 2x + 3y \leq 18 \)(小时) 2. 原材料约束:\( 3x + 2y \leq 20 \)(千克) 3. 非负约束:\( x \geq 0, \, y \geq 0 \) (注:产品数量需为非负整数,但先在实数范围内求解线性规划,再验证整数可行性。) --- ### 求解 #### 1. 实数域线性规划求解(图解法/顶点枚举法) 可行域由约束直线围成,顶点通过约束直线交点得到。 约束直线方程: - \( L_1: 2x + 3y = 18 \)(机器时间) - \( L_2: 3x + 2y = 20 \)(原材料) - 坐标轴:\( x = 0 \), \( y = 0 \) **求顶点:** - 原点:\( (0, 0) \) - \( L_1 \) 与 \( y \)-轴交点:令 \( x = 0 \),\( 2(0) + 3y = 18 \Rightarrow y = 6 \),得点 \( (0, 6) \) - \( L_2 \) 与 \( x \)-轴交点:令 \( y = 0 \),\( 3x + 2(0) = 20 \Rightarrow x = \frac{20}{3} \approx 6.667 \),得点 \( \left( \frac{20}{3}, 0 \right) \) - \( L_1 \) 与 \( L_2 \) 交点:解方程组 \[ \begin{cases} 2x + 3y = 18 \\ 3x + 2y = 20 \end{cases} \] 将第一方程乘以 2,第二方程乘以 3: \[ \begin{cases} 4x + 6y = 36 \\ 9x + 6y = 60 \end{cases} \] 相减得 \( 5x = 24 \Rightarrow x = 4.8 \),代入 \( 2(4.8) + 3y = 18 \Rightarrow 9.6 + 3y = 18 \Rightarrow y = 2.8 \),得点 \( (4.8, 2.8) \) 可行域顶点为:\( (0, 0) \), \( (0, 6) \), \( \left( \frac{20}{3}, 0 \right) \), \( (4.8, 2.8) \)。 **计算各顶点目标函数值:** - \( (0, 0) \): \( Z = 50(0) + 40(0) = 0 \) - \( (0, 6) \): \( Z = 50(0) + 40(6) = 240 \) - \( \left( \frac{20}{3}, 0 \right) \): \( Z = 50 \times \frac{20}{3} + 40(0) = \frac{1000}{3} \approx 333.33 \) - \( (4.8, 2.8) \): \( Z = 50(4.8) + 40(2.8) = 240 + 112 = 352 \) 在实数域内,最优解为 \( x = 4.8 \), \( y = 2.8 \),最大利润 \( Z = 352 \) 元。 #### 2. 整数解验证 由于产品数量必须为整数,需在可行域内寻找整数解。约束为: \( 2x + 3y \leq 18 \), \( 3x + 2y \leq 20 \), \( x, y \geq 0 \) 且为整数。 通过枚举接近实数最优解 \( (4.8, 2.8) \) 的整数点,计算可行点的目标函数值: - \( (4, 3) \): 机器时间:\( 2(4) + 3(3) = 8 + 9 = 17 \leq 18 \) 原材料:\( 3(4) + 2(3) = 12 + 6 = 18 \leq 20 \) \( Z = 50(4) + 40(3) = 200 + 120 = 320 \) - \( (5, 2) \): 机器时间:\( 2(5) + 3(2) = 10 + 6 = 16 \leq 18 \) 原材料:\( 3(5) + 2(2) = 15 + 4 = 19 \leq 20 \) \( Z = 50(5) + 40(2) = 250 + 80 = 330 \) - \( (6, 1) \): 机器时间:\( 2(6) + 3(1) = 12 + 3 = 15 \leq 18 \) 原材料:\( 3(6) + 2(1) = 18 + 2 = 20 \leq...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该回答质量优秀,完整覆盖了题目的所有要求:建模规范、求解过程严谨、结论清晰。特别值得肯定的是,候选输出不仅完成了实数域线性规划求解,还主动进行了整数可行性验证并给出了整数最优解,体现了较强的运筹学专业素养。格式规范,数学符号使用得当,整体表现接近满分水准。 【GEMINI】该回答展现了极高的专业水准,不仅准确建立了线性规划模型,还深刻理解了实际生产场景中整数约束的必要性,通过科学的枚举法给出了最优的整数解。逻辑严密,计算无误,完全满足所有评测要求。 【KIMI】该回答是一份高质量的线性规划求解方案,数学建模准确规范,求解过程逻辑严密,顶点枚举和计算均正确。整数规划部分虽枚举方式可更完善,但最终结论正确。结构上基本符合要求,但需注意题目对最终答案加粗显示的格式要求。整体表现优秀,展现了扎实的运筹学建模与求解能力。

困难难度评测结果

  • 得分:88.7 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

### 投资组合优化问题求解(均值-方差模型) #### 1. 决策变量定义 设投资比例向量为 \( \mathbf{w} = [w_1, w_2, w_3, w_4, w_5]^T \),其中 \( w_i \) 表示投资于资产 \( i \) 的比例(\( i = 1, 2, 3, 4, 5 \))。 #### 2. 问题参数 - 预期年收益率向量: \[ \boldsymbol{\mu} = [0.08, 0.12, 0.10, 0.15, 0.06]^T \] - 标准差向量: \[ \boldsymbol{\sigma} = [0.15, 0.25, 0.20, 0.30, 0.10]^T \] - 相关系数矩阵 \( \mathbf{P} \): 问题中未提供具体数值。为进行求解,**假设资产之间不相关**,即相关系数矩阵为单位矩阵: \[ \mathbf{P} = \begin{bmatrix} 1 & 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 \end{bmatrix} \] 此假设仅为演示求解过程,实际应用中需使用真实相关系数矩阵。 #### 3. 协方差矩阵推导 协方差矩阵 \( \boldsymbol{\Sigma} \) 由标准差向量 \( \boldsymbol{\sigma} \) 和相关系数矩阵 \( \mathbf{P} \) 计算得到: \[ \boldsymbol{\Sigma} = \operatorname{diag}(\boldsymbol{\sigma}) \cdot \mathbf{P} \cdot \operatorname{diag}(\boldsymbol{\sigma}) \] 其中 \( \operatorname{diag}(\boldsymbol{\sigma}) \) 是以 \( \boldsymbol{\sigma} \) 为对角线的对角矩阵。由于假设 \( \mathbf{P} = \mathbf{I} \),有: \[ \boldsymbol{\Sigma} = \operatorname{diag}(\sigma_1^2, \sigma_2^2, \sigma_3^2, \sigma_4^2, \sigma_5^2) = \begin{bmatrix} 0.0225 & 0 & 0 & 0 & 0 \\ 0 & 0.0625 & 0 & 0 & 0 \\ 0 & 0 & 0.04 & 0 & 0 \\ 0 & 0 & 0 & 0.09 & 0 \\ 0 & 0 & 0 & 0 & 0.01 \end{bmatrix} \] #### 4. 数学模型(标准形式) 目标是最小化投资组合方差(即风险),同时满足预算约束(总投资比例为1)。假设允许卖空,无非负约束。模型如下: \[ \begin{aligned} & \min_{\mathbf{w}} \quad \frac{1}{2} \mathbf{w}^T \boldsymbol{\Sigma} \mathbf{w} \\ & \text{s.t.} \quad \sum_{i=1}^5 w_i = 1 \end{aligned} \] 其中目标函数中的系数 \( \frac{1}{2} \) 是为了求导方便,不影响最优解。 #### 5. 求解过程(拉格朗日乘数法) 引入拉格朗日乘子 \( \lambda \) 处理预算约束,拉格朗日函数为: \[ L(\mathbf{w}, \lambda) = \frac{1}{2} \sum_{i=1}^5 \sigma_i^2 w_i^2 + \lambda \left(1 - \sum_{i=1}^5 w_i\right) \] 对每个 \( w_i \) 求偏导并令其为零: \[ \frac{\partial L}{\partial w_i} = \sigma_i^2 w_i - \lambda = 0 \quad \Rightarrow \quad w_i = \frac{\lambda}{\sigma_i^2}, \quad i=1,\dots,5 \] 代入约束条件 \( \sum_{i=1}^5 w_i = 1 \): \[ \sum_{i=1}^5 \frac{\lambda}{\sigma_i^2} = \lambda \sum_{i=1}^5 \frac{1}{\sigma_i^2} = 1 \quad \Rightarrow \quad \lambda =...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】该模型在输入数据(相关系数矩阵)缺失的情况下,展现了极强的逻辑完备性。它主动声明假设并继续演示完整的运筹学求解流程,完全符合资深专家的定位。计算过程精确,对KKT/拉格朗日条件的运用熟练,格式规范,是一份高质量的解答。 【KIMI】整体而言,该答案在数学建模和结构清晰度方面表现良好,但在关键的协方差矩阵建立上存在假设不足,影响了模型的准确性。若能提供准确的相关系数矩阵,将能显著提高模型的实用性和准确性。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...