利用法医SNP系谱推断技术侦破命案积案1例
1.
2.
3.
通讯作者: 杨帆,男,硕士,警务技术副高级任职资格,主要从事法医物证学研究;E-mail:afanti007@yeah.net
编委: 陶瑞旸
收稿日期: 2024-03-28
基金资助: |
|
Received: 2024-03-28
作者简介 About authors
孟必成(1992—),男,硕士,警务技术中级任职资格,主要从事法医物证学研究;E-mail:806834143@qq.com
关键词:
本文引用格式
孟必成, 何柏芳, 姚智卿, 王斌, 黄江平, 郝思静, 曹禹, 余华光, 杨帆.
1 案 例
1.1 简要案情
2013年,某镇一女性被杀害,头部有血和多处钝器伤,颈部有掐痕。经鉴定,死亡原因为颅脑损伤合并机械性窒息。案发后在现场的毛巾血斑中检出一男性15个常染色体STR分型,但在数据库中未比中嫌疑人。近日,本鉴定中心对该样本进行复检,成功获得该男性41个Y-STR分型,并通过数据库比中某省一徐姓家系。经调查,该家系规模庞大、人员众多,且人员流动性较强,多个分支已迁往外地,排查难度极大。因此,本鉴定中心筛选出可通过五级亲缘关系覆盖整个家系的79例家族人员样本,使用法医SNP系谱推断技术进一步排查。
1.2 检验方法
1.2.1 DNA提取与STR检验
使用全自动24道微量DNA提取工作站(长春市博坤生物科技有限公司)提取现场检材DNA,使用Chelex-100法提取比对家系样本DNA,应用VeriFilerTM Plus PCR扩增试剂盒、YFilerTM Platinum PCR扩增试剂盒(美国Thermo Fisher Scientific公司)和Y SUPP Plus荧光检测试剂盒(无锡中德美联生物技术有限公司)对上述检材DNA分别进行PCR扩增,扩增产物使用3500xL基因分析仪(美国Applied Biosystems公司)检测获得常染色体STR和Y-STR分型。
1.2.2 DNA提取与全基因组测序
使用全自动24道微量DNA提取工作站提取现场检材DNA,应用HiPure MicroBiome DNA提取试剂盒(上海迈跟生物科技有限公司)提取比对家系样本基因组DNA。应用MGIEasy酶切DNA文库制备试剂盒(深圳华大智造科技股份有限公司)构建全基因组文库并进行DNA纳米球环化,使用MGISEQ-2000RS测序仪搭配MGISEQ-2000RS高通量测序试剂套装(FCL PE100,深圳华大智造科技股份有限公司)进行全基因组测序。
1.2.3 数据分析及系谱推断
应用GATK分析流程筛选可靠的变异信息,并通过“国际人类基因组单体型图(HapMap)计划”和“千人基因组计划”等群体基因组信息进行质量校正,对获得的全基因组SNP数据通过共祖片段(identity-by-descent,IBD)长度判断两两个体的亲缘关系等级。
1.3 检验结果
对现场物证毛巾血斑提取DNA,获得DNA总量为13.15 ng,用MGIEasy酶切DNA文库制备试剂盒进行文库制备,在MGISEQ-2000RS测序仪上使用MGISEQ-2000RS高通量测序试剂套装(FCL PE100)中单张芯片进行单样本测序,获得1 248.43 M Reads,Clean Reads比例达0.96,Q20为0.96,Q30为0.90,GC比例为0.48。与Hg38人类基因组参考序列比对,比对率为78.27%,去重后平均测序深度为19.33X。其中98.70%的序列≥1X覆盖度,86.33%的序列≥4X覆盖度,40.14%的序列≥10X覆盖度,18.35%的序列≥20X覆盖度。上述全基因组检测数据质量较高,可以继续分析。
对目标家系79例人员样本按相同文库制备方案,采用8个样本一张芯片的检测方法,对人员样本进行全基因组测序,获得39.70~1 248.43 M原始Reads(平均428.74 M),平均Clean Reads比例为0.99,Q20为0.98,Q30为0.94。将所有样本全基因组测序数据与Hg38标准序列进行比对,结果显示,与物证样本毛巾血斑亲缘关系最近的为71号样本,比对结果见表1。
表1 物证样本与人员样本的全基因组测序结果比对情况
Tab. 1
项目 | 毛巾血斑 | 71号样本 |
---|---|---|
比对率/% | 78.27 | 99.83 |
重复序列比例/% | 36.19 | 3.62 |
插入片段/bp | 431.80 | 268.30 |
平均测序深度(去重)/X | 19.33 | 13.13 |
覆盖度(≥1X)/% | 98.70 | 98.65 |
覆盖度(≥4X)/% | 86.33 | 93.15 |
覆盖度(≥10X)/% | 40.14 | 64.11 |
覆盖度(≥20X)/% | 18.35 | 16.21 |
所有样本经“国际人类基因组单体型图(HapMap)计划”和“千人基因组计划”等群体基因组信息进行碱基质量校正后筛选得到数据量等于3 M且可靠的全基因组SNP位点(99.5%置信区间),依据以下标准做进一步质控:(1)人群基因组数据库置信敏感度>99.5%;(2)经变异质量校正排除假阳性变异;(3)经比对质量、变异置信度等参数进一步硬过滤;(4)所有样本中SNP位点覆盖率≥0.9;(5)单SNP位点覆盖深度>10X。根据以上标准,将物证样本毛巾血斑全基因组数据与和其亲缘关系最近的71号样本进行分析。
71号样本与毛巾血斑的有效SNP数为961 431个,亲缘关系系数为0.012,IBD比例为0.003,推断亲缘关系为四级以上。结合其他人员样本与毛巾血斑的亲缘关系系数及IBD比例,判断71号样本在所有检测样本中与现场物证的亲缘关系最接近,可以作为线索进行排查。
办案单位根据本次全基因组检测提供的线索对71号样本的家系进行深挖,发现该人有一堂哥失联,其两个儿子随母亲改嫁后分别改姓。对其中一子罗某采样并检验,其常染色体STR分型与现场物证DNA分型完全一致,由此成功锁定本案嫌疑人。
2 讨 论
随着DNA测序技术的发展,测序通量不断增大,成本越来越低,法医SNP系谱推断技术的应用越来越广泛。在案件侦查中,检测SNP可以帮助判断两个个体之间来自共同祖先的可能性和亲缘关系的远近。根据孟德尔遗传定律,孩子的基因一半来自父亲,一半来自母亲。随着减数分裂的进行,同源染色单体交换次数增加,IBD逐渐变短。因此,通过大规模平行测序获得SNP,表现为共有SNP减少。
本例中71号样本与物证样本毛巾血斑共检测到961 431个有效SNP,亲缘关系系数达到0.012,参考不同等级的亲缘关系系数分布范围[1],推断71号样本与物证样本毛巾血斑来源个体之间为四级以上亲缘关系,从而为案件的侦破指明了方向。值得注意的是,嫌疑人与71号样本人员实际上为堂叔侄关系,亲缘关系等级为五级,与本例通过法医SNP系谱推断技术得到的四级以上亲缘关系的结论基本相符。通过大量的家系数据修正亲缘关系预测方法和模型,使该技术更准确地预测亲缘关系等级,是未来重要的研究方向之一。
此外,虽然本例中14号、46号等13个样本与物证样本毛巾血斑的亲缘关系系数高于71号样本,但其中部分样本测序质量欠佳,检测获得的有效SNP个数远远少于71号样本,而亲缘关系的计算会受到实际检测到的SNP数量影响,对于五级以上亲缘关系的影响更大,因此上述样本未作为线索进行排查[2]。
随着经济的发展和社会的变迁,我国人员流动性日益增强,这也对家系排查和嫌疑人锁定提出了更高要求。人员众多、流动性强、复杂多变的家系,特别是存在非婚生、入赘等特殊情况的复杂家系,可以通过法医SNP系谱推断技术精准解决排查与定位问题。具体来说,就是利用Y-STR男性家系筛查结合基于IBD的法医SNP系谱推断技术,不断缩小排查范围,实现对嫌疑人的精准定位[3]。
参考文献
基于IBS算法预测亲缘关系准确性研究
[J].
Accuracy research on the kinship relationship prediction by IBS algorithm
[J].
基于高密度单核苷酸多态性的共祖远亲缘关系预测算法准确性研究
[J].
Accuracy research on the distant kinship relationship prediction by IBD algorithm
[J].
精准医疗时代的法医表型特征分子刻画研究进展
[J].
Research progress on forensic molecular phenotyping in the age of precision medicine
[J].
/
〈 |
|
〉 |
