Qwen: Qwen3.5-9B 在「实现基因序列比对算法」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Qwen: Qwen3.5-9B
用例名称：实现基因序列比对算法
测试类型：文本生成
评测维度：代码生成

系统提示词（System Prompt）

这是给 AI 模型的背景设定和角色指令：

你是一名生物信息学入门课程的算法讲师，擅长用清晰易懂的方式讲解基础序列比对原理。回答要求： 1. 在编写代码前，用1-2句话简述所用比对方法的核心思路（如逐位比较）。 2. 代码需包含输入合法性校验（仅允许A、T、C、G字符，不区分大小写）。 3. 相似度计算公式须明确：相似度 = 完全匹配的位置数 / 较短序列长度 × 100%。 4. 输出格式须包含：相似度百分比、匹配/错配的逐位对比字符串、完全匹配子序列列表及其起始位置。 5. 代码需有必要注释，变量命名清晰，适合初学者阅读。

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

## 题目：实现基础DNA序列比对工具请实现一个简单的DNA序列比对函数，完成两条DNA序列的基础比对分析。 ### 背景说明 DNA序列由四种碱基组成：腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)、鸟嘌呤(G)。基础比对即将两条序列按位置逐一对齐，统计匹配情况。 ### 功能要求 1. **输入校验** - 检查序列是否只包含合法碱基（A、T、C、G，不区分大小写，处理时统一转为大写） - 若包含非法字符，抛出异常或返回错误信息，并说明非法字符是什么 2. **相似度计算** - 对齐方式：将两条序列从头部对齐，以较短序列的长度为比对范围 - 相似度公式：`相似度(%) = 匹配位置数 / 较短序列长度 × 100` - 返回保留两位小数的百分比字符串，例如 `「87.50%」` 3. **逐位比对可视化** - 输出三行对比字符串（参考格式如下）：

评测结果

综合得分

该模型在此用例的得分为：89.8 分（满分 100 分），已通过

基础难度评测结果

得分：89.8 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

你好！我是生物信息学入门课程的算法讲师。很高兴能为你讲解这个基础序列比对工具的实现。 ### 核心思路简述本工具采用**“头对头”全局对齐**策略，不引入任意空位（Gap），直接将两条序列从第 1 个碱基开始逐位对齐，比对范围限制在较短序列的长度内，统计相同字符的数量并生成可视化对比。下面是完整的 Python 实现代码，包含了输入校验、相似度计算、可视化输出及匹配片段统计。 ```python def dna_alignment(seq1, seq2): """ 基础 DNA 序列比对工具 :param seq1: 第一条 DNA 序列字符串 :param seq2: 第二条 DNA 序列字符串 :return: 比对结果字典及格式化输出字符串 """ # 1. 输入合法性校验 valid_bases = {'A', 'T', 'C', 'G'} # 统一转为大写便于处理 seq1_upper = seq1.upper() seq2_upper = seq2.upper() # 检查非法字符 errors1 = [c for c in seq1_upper if c not in valid_bases] errors2 = [c for c in seq2_upper if c not in valid_bases] # 如果存在非法字符，抛出异常并说明 if errors1 or errors2: all_errors = set(errors1 + errors2) raise ValueError(f"输入包含非法字符：{sorted(all_errors)}。DNA 序列仅允许包含 A, T, C, G。") # 2. 核心比对过程 # 确定比对长度（较短序列决定） length1, length2 = len(seq1_upper), len(seq2_upper) min_len = min(length1, length2) match_count = 0 match_indices = [] # 记录所有匹配位置的索引 # 逐位比对 for i in range(min_len): if seq1_upper[i] == seq2_upper[i]: match_count += 1 match_indices.append(i) # 3. 相似度计算 # 公式：相似度 = 匹配位置数 / 较短序列长度 × 100 if min_len == 0: similarity = 0.0 else: similarity = (match_count / min_len) * 100 # 保留两位小数 similarity_str = f"{similarity:.2f}%" # 4. 构建匹配子序列列表（统计连续匹配片段） matching_subsequences = [] if match_indices: # 将连续的匹配索引聚合成区间 [start, end) start = match_indices[0] end = match_indices[0] for idx in match_indices[1:]: if idx == end + 1: # 连续匹配，更新 end end = idx else: # 匹配中断，保存上一个片段 matching_subsequences.append((seq1_upper[start:end+1], start)) start = idx end = idx # 保存最后一个片段 matching_subsequences.append((seq1_upper[start:end+1], start)) # 5. 生成逐位对比可视化字符串 (三行) # 符号说明：'=' 表示匹配，'!' 表示错配 (仅比较 min_len 范围) seq1_display = seq1_upper[:min_len] seq2_display = seq2_upper[:min_len] comp_display = "" for i in range(min_len): if seq1_upper[i] == seq2_upper[i]: comp_display += "=" else: comp_display += "!" # 6. 返回结果 result = { "similarity": similarity_str, "seq1": seq1_display, "seq2": seq2_display, "comparison": comp_display, "matches": matching_subsequences } return...

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该实现质量较高，充分满足了基础DNA序列比对工具的各项功能要求。代码结构清晰、注释详细、适合教学场景使用。核心算法（逐位比对、连续片段聚合）实现正确，相似度公式严格遵循规范。输入校验完善，能准确报告非法字符。主要可优化点：可将比对结果的三行可视化封装成独立的格式化输出函数，以及支持大小写混合输入时在错误信息中回显原始非法字符（而非大写后的版本）。总体而言是一个功能完整、代码规范、教学友好的实现。【GEMINI】模型表现优秀，不仅准确完成了各项功能需求，且代码风格非常适合教学。虽然在算法深度上未涉及复杂的动态规划，但完全符合题目「基础DNA序列比对」的定位，文档说明清晰，逻辑严密。【KIMI】该实现是一份优秀的生物信息学入门教学代码，严格遵循了「头对头」全局对齐策略，无Gap插入，核心算法正确。代码风格 pedagogical（教学友好），注释充分，变量命名清晰。在功能正确性上表现优异，仅在输出格式的细节呈现（完全匹配子序列的定义方式）上有轻微可优化空间。整体达到高质量教学代码标准。

进阶难度评测结果

得分：83.3 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

## Needleman-Wunsch 全局序列比对算法说明 Needleman-Wunsch 算法使用动态规划思想，通过构建得分矩阵计算全局最优比对得分。状态转移方程为： **F[i][j] = max(F[i-1][j-1] + score(x[i],y[j]), F[i-1][j] + gap_penalty, F[i][j-1] + gap_penalty)** 其中 match 得分为正，错配与空位均为惩罚值，回溯从 F[m][n] 至 F[0][0] 获得最优比对路径。 --- ## 完整代码实现 ```python def needleman_wunsch(seq1, seq2, match_score=1, mismatch_penalty=-1, gap_penalty=-2): """ Needleman-Wunsch 全局序列比对算法参数: seq1: 第一个DNA序列字符串 seq2: 第二个DNA序列字符串 match_score: 匹配得分（默认1） mismatch_penalty: 错配惩罚值（默认-1） gap_penalty: 空位惩罚值（默认-2）返回: dict: 包含比对得分、得分矩阵、比对序列 """ # ==================== 边界检查 ==================== if not isinstance(seq1, str) or not isinstance(seq2, str): raise TypeError("序列参数必须为字符串类型") seq1 = seq1.upper() seq2 = seq2.upper() # 检查非法字符（仅允许 ACGT 及 N） valid_chars = set("ACGTN") for seq in [seq1, seq2]: for char in seq: if char not in valid_chars: raise ValueError(f"发现非法字符 '{char}'，仅允许 ACGTN") # 空序列处理 m, n = len(seq1), len(seq2) if m == 0 and n == 0: return { 'score': 0, 'matrix': [[0]], 'align_seq1': '', 'align_seq2': '', 'message': '两个序列均为空' } elif m == 0: return { 'score': n * gap_penalty, 'matrix': [[i * gap_penalty for i in range(n + 1)]], 'align_seq1': '-' * n, 'align_seq2': seq2, 'message': f'序列1为空，插入 {n} 个空位' } elif n == 0: return { 'score': m * gap_penalty, 'matrix': [[j * gap_penalty for j in range(m + 1)]], 'align_seq1': seq1, 'align_seq2': '-' * m, 'message': f'序列2为空，插入 {m} 个空位' } # ==================== 初始化得分矩阵 ==================== # 行对应 seq1 + 空位，列对应 seq2 + 空位 matrix = [[0] * (n + 1) for _ in range(m + 1)] # 初始化第一列（序列1上方插入空位） for i in range(1, m + 1): matrix[i][0] = i * gap_penalty # 初始化第一行（序列2左方插入空位） for j in range(1, n + 1): matrix[0][j] = j * gap_penalty # ==================== 填充得分矩阵 ==================== def calculate_score(c1, c2): return match_score if c1 == c2 else mismatch_penalty for i in range(1, m + 1): for j in range(1, n + 1): match_diag = matrix[i-1][j-1] + calculate_score(seq1[i-1], seq2[j-1]) match_up = matrix[i-1][j] + gap_penalty match_left = matrix[i][j-1] +...

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【KIMI】整体而言，代码实现了 Needleman-Wunsch 算法的核心功能，得分矩阵构建和回溯路径寻找准确。参数化支持良好，代码结构清晰，异常处理得当。在参数说明和代码细节上还有改进空间。

困难难度评测结果

得分：75.0 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

## 核心算法状态转移方程本系统采用 **Gotoh 算法** 实现仿射空位罚分（Affine Gap Penalty）的动态规划。定义以下三个 DP 表状态： 1. **$M_{i,j}$**：序列 1 前 $i$ 个字符与序列 2 前 $j$ 个字符比对，且**最后一个操作为匹配/错配**时的最大得分。 2. **$X_{i,j}$**：序列 1 前 $i$ 个字符与序列 2 前 $j$ 个字符比对，且**最后一个操作为序列 2 空位**（即序列 1 有字符，序列 2 为 Gap）时的最大得分。 3. **$Y_{i,j}$**：序列 1 前 $i$ 个字符与序列 2 前 $j$ 个字符比对，且**最后一个操作为序列 1 空位**（即序列 1 为 Gap，序列 2 有字符）时的最大得分。其中 $\text{sub}(s1[i], s2[j])$ 为替换矩阵得分，$\text{gap}_{open}$ 为空位开放罚分（通常为负值），$\text{gap}_{ext}$ 为空位延伸罚分（通常为负值）。 ### 全局比对（Needleman-Wunsch） $$ \begin{aligned} M_{i,j} &= \max(M_{i-1,j-1}, X_{i-1,j-1}, Y_{i-1,j-1}) + \text{sub}(s1[i], s2[j]) \\ X_{i,j} &= \max(X_{i-1,j} + \text{gap}_{ext}, M_{i-1,j} + \text{gap}_{open}) \\ Y_{i,j} &= \max(Y_{i,j-1} + \text{gap}_{ext}, M_{i,j-1} + \text{gap}_{open}) \end{aligned} $$ *注：全局比对初始化时，第一行/列需按空位罚分累计。* ### 局部比对（Smith-Waterman） $$ \begin{aligned} M_{i,j} &= \max(0, M_{i-1,j-1}, X_{i-1,j-1}, Y_{i-1,j-1}) + \text{sub}(s1[i], s2[j]) \\ X_{i,j} &= \max(0, X_{i-1,j} + \text{gap}_{ext}, M_{i-1,j} + \text{gap}_{open}) \\ Y_{i,j} &= \max(0, Y_{i,j-1} + \text{gap}_{ext}, M_{i,j-1} + \text{gap}_{open}) \end{aligned} $$ *注：局部比对初始化全为 0，回溯从全局最大值开始，遇到 0 终止。* --- ```python import math from typing import Dict, Tuple, List, Optional, Union from collections import defaultdict # =================配置常量================== # BLOSUM62 替换矩阵 (标准蛋白质比对) BLOSUM62 = { 'A': {'A': 4, 'R': -1, 'N': -2, 'D': -2, 'C': -3, 'Q': 1, 'E': -1, 'G': 0, 'H': 2, 'I': -1, 'L': -1, 'K': -2, 'M': -1, 'F': -3, 'P': -1, 'S': -1, 'T': -1, 'W': -4, 'Y': -2, 'V': 0}, 'R': {'A': -1, 'R': 5, 'N': 0, 'D': -2, 'C': -3, 'Q': -1, 'E': -1, 'G': -2, 'H': -2, 'I': -1, 'L': -1, 'K': 2, 'M': -1, 'F': -1, 'P': -1, 'S': -1, 'T': -1, 'W': -4, 'Y': -1, 'V': 0}, 'N': {'A': -2, 'R': 0, 'N': 6, 'D': 1, 'C': -3, 'Q': 1, 'E': 0, 'G': -2, 'H': -1, 'I': -3, 'L': -3, 'K': 0, 'M': -2, 'F': -3, 'P': -1, 'S': 0, 'T': -1, 'W': -4, 'Y': -2, 'V': -3}, 'D': {'A': -2, 'R': -2, 'N': 1, 'D': 6, 'C': -3, 'Q': 1, 'E': 4, 'G': -2, 'H': -1, 'I': -4, 'L': -4, 'K': -1,...

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】该模型表现出极高的理论素养和代码规范性，但在工程实现上存在明显缺失。它准确地描述了复杂的仿射空位罚分数学模型，并构建了一个健壮的类框架，包含类型检查和详细的文档。然而，它忽略了任务中关于‘可视化比对字符串’的强制性要求，没有实现回溯算法来生成比对序列，这使得该工具在实际应用中只能作为得分计算器而非完整的比对系统。对于长序列优化的讨论符合预期，但核心分治算法（Hirschberg）未落地。【KIMI】整体而言，该实现在算法设计和接口封装方面表现良好，但在代码的逻辑正确性和完整性方面存在一些缺陷。特别是在全局比对的空间优化和回溯逻辑方面，需要进一步完善和修正。代码的可读性和质量也有待提高，以满足工业级代码的要求。

基本信息

系统提示词（System Prompt）

用户提示词（User Prompt）

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题