传统全外显子测序(WES)在高GC区域常因捕获效率低、测序错误率高出现覆盖断层,进而导致致病变异漏检。
真迈生物最新推出的全局无偏倚Q50测序技术——CMS,搭配艾吉泰康TargetSeq® 捕获技术,可显著提升高GC区域测序表现,真正实现 “捕得全、测得准”,为疾病诊断提供高敏可靠的技术基石。
本次测试基于NA12878制备艾全外® V5 Panel文库,在SURFSeq 5000 及另外两款测序平台上测序,CMS测序化学在测序精准度和覆盖均一性上表现突出:
IGV示例:TRRAP基因高GC区域“捕得全 +测得准”

01
测试方案
本次测试选用NA12878标准品,通过艾全外®人外显子组Panel V5核心版构建文库,并将同一文库在3个技术平台上进行PE150测序,旨在系统对比分析各平台的测序性能表现。
表1. 测试方案

02
测试结果
覆盖均一性
SURFSeq 5000 CMS V1.0测序数据靶区20×覆盖率超99%,Fold 80 Base Penalty表现最优。在相对低覆盖区域(图3)评估中,Platform B相对低覆盖区域数量为CMS的1.6倍(异常区域较少但测序错误率高,详见下文错误率评估部分),Platform C为CMS的38倍(异常区域多但测序错误率较低)。

图1. 不同技术平台的覆盖度表现

图2. 不同技术平台均一性表现(艾全外V5核心版)

图3. 不同技术平台低覆盖度区域的表现(艾全外V5核心版)
注:1. 相对低覆盖区域定义:基于滑动窗口法,窗口设置20 bp、步长10 bp滑动切分靶区,统计各窗口覆盖深度并除以所有窗口深度中位数进行均一化;对a/b测序平台同一窗口均一化数值进行比较,当满足 a_nor/b_nor > 1.5、a_nor > 0.3 且 b _nor< 0.5 时,则判定a平台在该窗口覆盖深度显著优于b,b平台为相较于a的低覆盖区域。
2. CMS superior:CMS覆盖度表现更优的窗口数量。
3. Competitor superior:对比平台Platform B/C覆盖度表现更优的窗口数量。
变异检出与测序错误偏好
在Germline检测中,CMS V1.0综合性能最优:InDel F1-score达97.78%,SNV F1-score达99.54%。在测序错误偏好评估上,CMS V1.0的eNPM(Error Numbers Per Million Positions)01、03、05指标显著优于对比平台。以eNPM05(每百万个位点中错误率>=5%的单碱基替换错误数)为例,CMS仅为Platform B 的 1/54(20/1075)、Platform C 的 1/6(20/118)。
结合覆盖均一性分析可知,传统NGS测序技术难以同时兼顾“覆盖均一性”和“测序精准度”。Platform B在覆盖均一性上表现较好(相对低覆盖区域为CMS的1.6倍),但其覆盖的reads质量却“差强人意”(eNPM05:1075)。Platform C则恰恰相反,其确保了较好的测序质量(eNPM05:118)或者说保留了质量较好的reads,却是以“牺牲”reads覆盖作为代价(低覆盖区域为CMS的38倍)。

图4. 不同技术平台Germline的表现(艾全外V5核心版)
表2. 不同技术平台的eNPM(Error Numbers Per Million Positions)统计

临床关注的测序困难区域示例
表3. 临床关注的部分高GC/复杂难测区域及其挑战

RPGR ORF15、MUC6、TRRAP 等高GC区域在CMS V1.0上实现均一和精准检测。这得益于艾吉泰康对高GC区域探针的特异性优化+真迈CMS测序技术无偏倚高精准的测序性能。

图5. 不同技术平台对 RPGR 高GC区域的覆盖表现(艾全外V5核心版)

图6. 不同技术平台对 MUC6 高GC区域的覆盖表现(艾全外V5核心版)

图7. 不同技术平台对 TRRAP 高GC区域的覆盖表现(艾全外V5核心版)
真迈生物将携手艾吉泰康等生态伙伴,凭借“捕得全、测得准”的硬核技术,为临床诊断和基础科研研究提供更稳定、更可靠的国产解决方案。