法医学杂志, 2024, 40(4): 330-339 DOI: 10.12116/j.issn.1004-5619.2023.530403

论著

基于不同STR分型试剂盒的肿瘤组织身源鉴定方法

吴黎明,1,2, 陈安琪3, 张素华,3, 李成涛,1,2

1.山西医科大学法医学院,山西 太原 030001

2.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063

3.复旦大学基础医学院,上海 200032

Identification Methods of Tumor Tissue Origin Based on Different STR Typing Kits

WU Li-ming,1,2, CHEN An-qi3, ZHANG Su-hua,3, LI Cheng-tao,1,2

1.School of Forensic Medicine, Shanxi Medical University, Taiyuan 030001, China

2.Shanghai Key Laboratory of Forensic Medicine, Key Laboratory of Forensic Science, Ministry of Justice, Shanghai Forensic Service Platform, Academy of Forensic Science, Shanghai 200063, China

3.School of Basic Medical Sciences, Fudan University, Shanghai 200032, China

通讯作者: 张素华,女,研究员,博士研究生导师,主要从事法医遗传学交叉研究;E-mail:zhang_suhua@fudan.edu.cn李成涛,男,研究员,博士研究生导师,主要从事法医遗传学研究;E-mail:lichengtaohla@163.com

编委: 陶瑞旸

收稿日期: 2023-04-28  

基金资助: 国家自然科学基金重点项目.  81930056
国家自然科学基金面上项目.  82072123

Received: 2023-04-28  

作者简介 About authors

吴黎明(1997—),男,硕士研究生,主要从事法医遗传学研究;E-mail:wlm199712@163.com

摘要

目的 建立基于常用STR分型试剂盒的肿瘤组织身源鉴定方法。 方法 采用ForenSeqTM DNA Signature Prep试剂盒检测55例配对肿瘤组织样本(肿瘤组织和同一个体正常组织成对)以及75例无关个体全血样本27个常染色体STR基因座的分型情况,并模拟55例肿瘤组织的全同胞、亲子对分型数据,统计成对肿瘤(paired carcinoma,PC)、肿瘤-无关个体(tumor-unrelated individual,UI)、肿瘤-全同胞(tumor-simulated full sibling,FS)与肿瘤-亲子(tumor-simulated parent-offspring,PO)的共有等位基因个数(number of total identical alleles,An )及状态一致性(identity by state,IBS)评分。以上述统计结果作为参照,建立8个常用STR分型试剂盒的肿瘤组织身源鉴定预测模型,并尝试构建一个专用于肿瘤组织身源鉴定的模型。使用另外23例配对肿瘤组织样本的检测结果对鉴定模型的准确性、灵敏度及特异度进行验证与评估。 结果 (1)在任一试剂盒中,全不同基因座数量(A0)在PC组与PO组之间差异无统计学意义。1个相同基因座数量(A1)、2个相同基因座数量(A2)和IBS评分在PC组与UI、FS、PO组之间差异均有统计学意义。(2)不同STR基因座的An 与IBS评分在不同组别存在差异,其中,13个STR基因座(CSF1POD12S391D19S433D20S482D2S1338D3S1358D4S2408D7S820D8S1179FGATH01TPOXvWA)的A2在PC组均高于其他STR基因座;2个STR基因座(D6S1043Penta E)的A2在UI组低于其他STR基因座。(3)成功构建了8个常用STR分型试剂盒的肿瘤组织身源鉴定预测模型以及15个STR基因座的肿瘤组织身源鉴定模型(15-STRs),灵敏度均达100%,特异度为97.56%~99.88%,准确度为97.59%~99.89%。其中,15-STRs模型的灵敏度为100%,特异度为99.88%,准确率为99.89%,高于常用商业化试剂盒。 结论 本研究成功建立了8个常用STR分型试剂盒的肿瘤组织身源鉴定方法,拓展了肿瘤组织身源鉴定的应用范围。通过比较不同基因座在肿瘤组织身源鉴定中的差异,筛选出了15个特别适用于肿瘤组织身源鉴定的STR基因座,为未来肿瘤组织溯源的试剂盒构建提供了数据基础。

关键词: 法医遗传学 ; 二代测序 ; 短串联重复序列 ; 预测模型 ; 状态一致性 ; 肿瘤组织 ; 个体识别 ; 共有等位基因个数

Abstract

Objective To establish the identification method of tumor tissue origin based on commonly used STR typing kits. Methods ForenSeqTM DNA Signature Prep kit was used to detect the typing of 27 autosomal STR loci in 55 paired tumor tissue samples (tumor tissue paired with normal tissue of the same individual) and 75 unrelated individual whole blood samples. The genotyping data of full sibling pairs and parent-child pairs of 55 tumor tissues were simulated. The number of total identical alleles (An ) and identity by state (IBS) scores were calculated within the paired carcinoma (PC), the tumor-unrelated individual (UI), the tumor-simulated full sibling (FS) and the tumor-simulated parent-offspring (PO) groups. The tumor tissue origin identification and prediction models of 8 commonly used STR typing kits were established based on the statistical results obtained above, and an attempt was made to establish a specific model for tumor tissue origin identification. The accuracy, sensitivity and specificity were verified and evaluated using the additional 23 paired tumor tissue samples. Results (1) In any kit, there was no statistically significant difference in the number of loci shared with 0 identical allele (A0) between the PC and PO groups. The number of loci shared with 1 identical allele (A1), 2 identical alleles (A2), and IBS scores were statistically significant different between the PC group and the UI, FS and PO groups. (2) The An and IBS scores of different STRs varied in different groups. The A2 levels of 13 STRs (CSF1PO, D12S391, D19S433, D20S482, D2S1338, D3S1358, D4S2408, D7S820, D8S1179, FGA, TH01, TPOX, vWA) in PC group were higher than those of other STR loci. The A2 levels of two STRs (D6S1043, Penta E) in UI group were significantly lower than those of other STR loci. (3) The tumor tissue origin identification and prediction models of 8 commonly used STR typing kits and the identification model of tumor tissue origin with 15 STR loci (15-STRs) were successfully established, with sensitivity of 100%, specificity of 97.56%-99.88%, and accuracy of 97.59%-99.89%. Among them, the 15-STRs model had 100% sensitivity, 99.88% specificity, and 99.89% accuracy, which were higher than those of commonly used commercial kits. Conclusion This study successfully establishes the tumor tissue origin identification methods with 8 commonly used STR typing kits, which expands the application of tumor tissue origin identification. In addition, the differences of different loci in the identification of tumor tissue origin were compared, and 15 STR loci which were particularly suitable for the identification of tumor tissue origin were selected, providing the data basis for the establishment of tumor origin tracing kits in future.

Keywords: forensic genetics ; next-generation sequencing ; short tandem repeat (STR) ; prediction model ; identity by state (IBS) ; tumor tissues ; individual identification ; number of total identical alleles

PDF (828KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

吴黎明, 陈安琪, 张素华, 李成涛. 基于不同STR分型试剂盒的肿瘤组织身源鉴定方法. 法医学杂志[J], 2024, 40(4): 330-339 DOI:10.12116/j.issn.1004-5619.2023.530403

WU Li-ming, CHEN An-qi, ZHANG Su-hua, LI Cheng-tao. Identification Methods of Tumor Tissue Origin Based on Different STR Typing Kits. Journal of Forensic Medicine[J], 2024, 40(4): 330-339 DOI:10.12116/j.issn.1004-5619.2023.530403

肿瘤不仅是我国,也是全世界的主要公共卫生问题,是我国最常见的死亡原因之一[1-2]。肿瘤的发病率和死亡率居高不下,因肿瘤组织样本标记错误、混乱及污染等问题导致的医疗纠纷愈发频繁,涉及肿瘤组织溯源的司法鉴定案件也随之增加[3-5]。但是,如何准确进行肿瘤组织的身源鉴定仍是法医学鉴定领域的难题,主要体现在以下两个方面:(1)肿瘤组织样本均为肿瘤细胞和正常细胞的混合样本,对于其较低组分的检出难度较大;(2)许多肿瘤在生长期间广泛存在STR水平的突变[6-9],这些突变导致无法用常规的个体识别判定标准来进行鉴定,这也是目前最主要的鉴定难点。虽然基于毛细管电泳(capillary electrophoresis,CE)平台的STR分型(CE-STR)技术已开发出许多成熟的体系用于普通检材的个体识别,但在肿瘤组织个体识别中的应用还比较缺乏。

2010年,有研究[10-11]基于CE平台建立了肿瘤组织身源鉴定方法,但仅使用了15个STR基因座。随着检测技术的推陈出新,DNA联合索引系统(combined DNA index system,CODIS)在2011年更新为19个新的CODIS核心基因座,用于鉴定的STR基因座逐步多样化,既往模型已无法满足实际应用的需求。若使用更多的试剂盒来进行肿瘤组织身源鉴定,考虑到时间、成本、样本等问题,无法对多个试剂盒一一尝试。近年来,二代测序(next-generation sequencing,NGS)技术不断发展和完善,其高通量、高灵敏度的特点[12-13]使其能够容纳更多的遗传标记,无需多个体系联合使用就能得到足够多的STR分型结果,样本损耗小且成本逐渐降低,一次测序结果就可适配多个STR试剂盒,同时建立多个试剂盒的肿瘤组织身源鉴定模型,大大节省了样本和时间。此外,本课题组前期研究[14]比较了肿瘤组织样本在NGS检测平台和CE检测平台的STR分型差异,结果表明两者的一致性高达91.43%。因此,基于NGS的STR检测技术 (NGS-STR)是为不同试剂盒建立肿瘤组织身源鉴定模型的有效工具。

本研究拟采用55例配对肿瘤组织样本的NGS-STR分型结果以及75例无关个体全血样本的NGS-STR分型检测数据,基于共有等位基因个数(number of total identical alleles,An )和状态一致性(identity by state,IBS)评分为8个常用STR分型试剂盒建立肿瘤组织身源鉴定预测模型,并比较不同试剂盒之间的差异,以期为法医学鉴定工作中肿瘤组织的身源鉴定提供参考。

1 材料与方法

1.1 样本

共使用78例配对肿瘤组织样本(肿瘤组织和同一个体正常组织成对),肿瘤样本均经病理学确认,来源于长海医院以及复旦大学附属华东医院,其中55例用于模型的建立,23例用于模型的准确性验证。75例无关个体全血样本为日常案件积累所得。所有研究对象在采样前均签署知情同意书,该研究已获得司法鉴定科学研究院伦理委员会的审批(审批文号:SJY2013-W002)。

将样本分为成对肿瘤(paired carcinoma,PC)、肿瘤-无关个体(tumor-unrelated individual,UI)、肿瘤-全同胞(tumor-simulated full sibling,FS)与肿瘤-亲子(tumor-simulated parent-offspring,PO)组。PC组为肿瘤组织和同一个体正常组织成对,共55对;UI组为肿瘤组织和无关个体血样成对,共4 125对;模拟55例肿瘤组织的全同胞和亲子分型数据,分别与对应的肿瘤组织形成FS组55对、PO组110对。分别统计各组的An 和IBS评分。

1.2 DNA提取方法

每例肿瘤组织取25 mg,使用DNeasy® Blood & Tissue试剂盒(德国Qiagen公司)提取DNA,所有操作与步骤参考说明书进行。每例全血样本(无关个体)取200 μL,使用QIAamp® DNA Blood Mini试剂盒(德国Qiagen公司)提取DNA,所有操作与步骤参考说明书进行。使用QubitTM dsDNA定量试剂盒(美国Thermo Fisher Scientific公司)检测DNA浓度。

1.3 基于NGS的STR分型检测

使用ForenSeqTM DNA Signature Prep试剂盒(美国Illumina公司)对样本进行测序,使用配套软件Universal Analysis Software(德国Qiagen公司)自动进行数据分析,操作步骤以及数据分析均按照相关使用说明执行。于本地服务器下载包含所测样本的基因座名称、基因分型、测序深度及序列信息的Excel文件,进行统计分析。

1.4 试剂盒筛选

从法医学鉴定常用的STR分型试剂盒中筛选试剂盒用于后续模型的建立,筛选标准为:单一试剂盒所使用的STR基因座全部包含在ForenSeqTM DNA Signature Prep试剂盒所检测到的27个STR基因座范围内。筛选出的8个试剂盒分别为:SiFaSTRTM 23plex DNA身份鉴定系统(司法鉴定科学研究院研发,简称“SiFa-23plex”)[15]、AGCU Expressmarker 22荧光检测试剂盒(无锡中德美联生物技术有限公司,简称“AGCU EX22”)[16]、Goldeneye® DNA身份鉴定系统20A[基点认知技术(北京)有限公司,简称“Goldeneye® 20A”][17]、PowerPlex® 21系统(美国Promega公司,简称“PowerPlex® 21”)[18]、AmpFSTRTM IdentifilerTM PCR扩增试剂盒(美国Applied Biosystems公司,简称“AmpFSTRTM IdentifilerTM”)[19]、AmpFSTR® SinofilerTM PCR扩增试剂盒(美国Applied Biosystems公司,简称“AmpFSTRTM SinofilerTM”)[19]、PowerPlex® 16系统[20](美国Promega公司,简称“PowerPlex® 16”)、AmpFSTRTM NGM SElectTM PCR扩增试剂盒(美国Applied Biosystems公司,简称“AmpFSTRTM NGM”)[21],各试剂盒使用的STR基因座数量分别为21、21、19、20、15、15、15、15个,详见表1

表1   8个试剂盒使用的STR基因座

Tab. 1  STR loci of 8 kits

基因座SiFa-23plexAGCU EX22Goldeneye® 20APowerPlex® 21AmpFSTRTM IdentifilerTMAmpFSTRTM SinofilerTMPowerPlex® 16AmpFSTRTM NGM
D3S1358
FGA
D8S1179
vWA
D16S539
D18S51
D21S11
D7S820-
D5S818-
CSF1PO-
D13S317-
D2S1338-
D19S433-
TH01-
TPOX--
D12S391--
D6S1043---
Penta E---
Penta D---
D10S1248-----
D1S1656-----
D2S441------
D22S1045-------
D4S2408--------
D9S1122--------
D17S1301--------
D20S482--------

注:“√”表示包含该基因座,“-”表示不包含该基因座;粗体表示该基因座包含于后续所挑选出的15个STR基因座内。

新窗口打开| 下载CSV


1.5 An 和IBS评分的统计及计算

分别统计各试剂盒PC、UI、FS和PO组的An 与IBS评分情况。将每对样本在某一基因座上具有相同等位基因的个数记作An,根据其所拥有的共有等位基因个数,分为全不同基因座数量(A0)、1个相同基因座数量(A1)和2个相同基因座数量(A2)。IBS评分为一对样本在每个基因座上所有相同等位基因数目的总和,即IBS=0×A0+1×A1+2×A2。基于IBS评分系统构建肿瘤组织样本的身源鉴定预测模型,探究各试剂盒应用于肿瘤组织身源鉴定的差异。

1.6 肿瘤组织身源鉴定预测模型的构建及验证

使用55例配对肿瘤组织样本(肿瘤组织和同一个体正常组织成对)的NGS-STR检测结果,依据各试剂盒所使用的STR基因座,分别统计各试剂盒在PC、UI、FS和PO组的An 与IBS评分,取An 与IBS评分中区分能力最佳的指标作为训练组,为每一个试剂盒建立相应的肿瘤组织身源鉴定预测模型。

根据最佳指标在各组的表现,筛选出更适合作为肿瘤组织身源鉴定的STR基因座,并据此构建一个专用于肿瘤组织身源鉴定的模型。

使用另外23例配对肿瘤组织样本(肿瘤组织和同一个体正常组织成对)的NGS-STR检测结果对所有模型进行灵敏度验证;将23例肿瘤组织样本与75例无关个体全血样本的NGS-STR检测结果进行两两配对,形成1 725对非成对肿瘤组织对,对所有模型进行特异度验证;根据上述检测结果计算所有预测模型的准确度。对所有模型进行验证后,通过比较准确度、灵敏度和特异度探究各模型之间的差异。

1.7 统计分析

应用GraphPad Prism 8.0软件(美国GraphPad Software公司)对数据进行分析,采用独立样本t检验比较各组间An 或IBS评分的差异,检验水准α=0.000 1。

统计各试剂盒不同组别An 和IBS评分的发生频率并进行拟合分析,探究各组样本的分布特点在各试剂盒中是否存在差异。

受试者操作特征(receiver operator characteristic,ROC)曲线的曲线下面积(area under the curve,AUC)可用于评估模型的准确性,AUC越大,表明其区分阳性和阴性的能力越强[22]。将各试剂盒PC组的An 和IBS评分数据分别与UI、FS、PO 3组进行比较,并绘制ROC曲线计算AUC,根据AUC检测An 和IBS评分的区分能力,选择An 和IBS评分中区分能力最强的值作为确立肿瘤组织身源鉴定预测模型的阈值标准。

常用的诊断试验的数据资料有:真阳性(true positive,TP),即实际值和检测结果均为阳性;假阳性(false positive,FP),即实际值为阴性而检测结果为阳性;真阴性(true negative,TN),即实际值和检测结果均为阴性;假阴性(false negative,FN),即实际值为阳性而检测结果为阴性。根据上述数据计算模型的特异度、灵敏度和准确度。灵敏度表示真阳性率,即实际值为阳性时,检测结果也为阳性的研究对象在所有阳性对象中的比例,计算公式为:灵敏度=TP/(TP+FN)。特异度表示真阴性率,即实际值为阴性时,检测结果也为阴性的研究对象在所有阴性对象中的比例,计算公式为:特异度=TN/(FP+TN)。准确度,即实际值和检测结果均为阳性或阴性的结果在所有研究对象中的比例,计算公式为:准确度=(TP+TN)/(TP+TN+FP+FN)。约登指数可以直观展示模型的整体性能,约登指数越大提示准确度越佳,其计算公式为:约登指数=灵敏度+特异度-1[22]

统计各试剂盒分别使用An 和IBS评分区分PC组与另外3组(UI、FS、PO)时的灵敏度、特异度及约登指数,绘制ROC曲线得到最佳的阈值。此时,要求满足灵敏度和特异度均在95%以上、约登指数最大这两个条件,来保证模型的有效性。据此统计各试剂盒满足此条件的阈值及对应的灵敏度、特异度及约登指数,并将其作为各预测模型进行肿瘤组织身源鉴定的参考标准。

2 结 果

2.1 An 及IBS评分的统计分析

各试剂盒不同组别An 与IBS评分的统计结果显示,虽然各试剂盒不同组别An 和IBS评分的平均值各不相同,但是A0A1A2以及IBS评分在PC、UI、FS、PO组中的分布规律一致(表2)。

表2   8个试剂盒不同组别的An 及IBS评分 (x¯±s)

Tab. 2  The An and IBS scores of different groups in 8 kits

试剂盒组别A0A1A2IBS评分
AGCU EX22PC(n=55)0.15±0.260.40±0.6120.45±0.7741.31±0.98
UI(n=4 125)6.00±1.671)8.58±1.701)6.42±1.721)21.42±2.911)
FS(n=55)2.78±1.241)9.96±1.681)8.25±1.821)26.47±2.641)
PO(n=110)0.33±0.4914.97±1.541)5.70±1.711)26.37±1.921)
AmpFSTRTM IdentifilerTMPC(n=55)0.05±0.110.11±0.2014.84±0.3029.78±0.40
UI(n=4 125)5.95±1.521)5.97±1.511)5.24±1.461)16.43±2.431)
FS(n=55)1.80±0.971)7.02±1.401)6.18±1.441)19.38±2.031)
PO(n=110)0.09±0.1710.49±1.421)4.42±1.451)19.08±1.401)
AmpFSTRTM NGMPC(n=55)0.07±0.140.16±0.2814.76±0.4029.69±0.53
UI(n=4 125)3.62±1.421)6.29±1.621)4.73±1.481)16.11±2.351)
FS(n=55)1.93±0.961)6.78±1.181)6.29±1.311)19.36±1.971)
PO(n=110)0.10±0.1810.84±1.401)4.06±1.391)18.96±1.401)
AmpFSTRTM SinofilerTMPC(n=55)0.05±0.110.15±0.2614.80±0.3629.75±0.45
UI(n=4 125)4.16±1.511)6.49±1.581)4.47±1.581)15.53±2.711)
FS(n=55)1.91±0.981)7.09±1.671)6.00±1.561)19.09±2.031)
PO(n=110)0.11±0.2010.75±1.381)4.15±1.411)19.04±1.481)
Goldeneye® 20APC(n=55)0.13±0.230.36±0.5718.51±0.7137.38±0.90
UI(n=4 125)5.58±1.661)7.59±1.721)5.83±1.641)19.15±2.821)
FS(n=55)2.53±1.191)9.07±1.721)7.40±1.791)23.87±2.451)
PO(n=110)0.32±0.4913.51±1.571)5.71±1.631)23.85±1.831)
PowerPlex® 16PC(n=55)0.13±0.230.33±0.5114.55±0.6629.42±0.85
UI(n=4 125)5.82±1.501)4.76±1.411)4.76±1.411)15.33±2.381)
FS(n=55)1.98±0.931)7.15±1.431)5.87±1.491)18.89±2.131)
PO(n=110)0.29±0.4510.59±1.311)4.12±1.321)18.83±1.431)
PowerPlex® 21PC(n=55)0.13±0.230.38±0.6019.50±0.7439.36±0.93
UI(n=4 125)8.03±1.731)5.99±1.671)5.99±1.671)20.00±2.931)
FS(n=55)2.65±1.201)9.47±1.791)7.87±1.731)25.22±2.421)
PO(n=110)0.34±0.5114.28±1.661)5.38±1.731)25.05±1.871)
SiFa-23plexPC(n=55)0.15±0.260.40±0.6320.45±0.7941.31±1.01
UI(n=4 125)6.11±1.711)8.50±1.811)6.39±1.741)21.27±2.941)
FS(n=55)2.85±1.221)9.89±1.731)8.25±1.801)26.40±2.551)
PO(n=110)0.35±0.5215.05±1.621)5.61±1.751)26.26±1.951)

注:A0A1A2分别为拥有全不同基因座的数量、拥有1个相同基因座的数量和拥有2个相同基因座的数量。PC为成对肿瘤(paired carcinoma),UI为肿瘤-无关个体(tumor-unrelated individual),FS为肿瘤-全同胞(tumor-simulated full sibling),PO为肿瘤-亲子(tumor-simulated parent-offspring,PO)。n表示样本对数。1)与PC组比较,P<0.000 1。

新窗口打开| 下载CSV


各试剂盒PC组和PO组的A0值极低,其中在PC组最高为0.15±0.26(AGCU EX22、SiFa-23plex),在PO组最高为0.35±0.52(SiFa-23plex),均小于1;A0更多集中于UI组和FS组,以UI组为最,最高为8.03±1.73(PowerPlex® 21)。各试剂盒的A1值仍是在PC组最低,但在PO组最高,最高为15.05±1.62(SiFa-23plex),其次为FS组,之后为UI组。A2在各组的分布与A1相差较大,PC组中A2值最高,FS组次之,UI组再次,PO组最低。

IBS评分结果显示,PC组最高,FS组和PO组次之,UI组最低。

所有试剂盒PC组的A0值与UI、FS组相比,差异均有统计学意义(P<0.000 1),但与PO组相比,差异无统计学意义(P>0.000 1)。所有试剂盒PC组的A1A2、IBS评分结果与其余3组相比,差异均有统计学意义(P<0.000 1)。

分别统计各试剂盒不同组别An 值和IBS评分的发生频率,得到拟合曲线(附图1)。A0值在所有试剂盒中对于样本的区分度都是最低的,其在PC组的频率曲线与其他3组(UI、FS、PO组)均存在交叉,且与PO组的频率曲线几乎完全重合,表明仅依据A0无法区分PC组和PO组的样本。从A1A2和IBS评分的数据分布来看,PC组与其他3组的曲线虽有交叉,但是交叉面积较少,曲线分布相对独立,尤其在A2和IBS评分条件下表现出来的区分度最佳。

本研究将8个试剂盒各自的PC组分别与UI、FS、PO组进行对比,绘制各试剂盒在A0A2A1及IBS评分条件下的ROC曲线,并计算各自的AUC。结果(表3)显示:不同组别中A0的AUC普遍较低,所有试剂盒在A0条件下的AUC最低,尤其在PO组均低于0.6,说明在A0条件下PC组与PO组之间差异无统计学意义(P>0.000 1)。各试剂盒在A1和IBS评分条件下的AUC均不低于0.980 0,但在A2条件下的AUC较A1和IBS评分条件下更高,表明A2的区分能力更强,除试剂盒AmpFSTRTM SinofilerTM的UI组(AUC为0.998 7)和FS组(AUC为0.999 2)的AUC低于0.999 5外,其余试剂盒各组的AUC在A2条件下均高于0.999 5且差异均有统计学意义(P<0.000 1)。因此,将A2作为阈值设定的标准比A0A1、IBS评分更为适合。

表3   8个试剂盒不同组别的AUC值

Tab. 3  AUC values of different groups in 8 kits

试剂盒组别A0A1A2IBS评分
AGCU EX22PC vs UI0.996 30.999 81.000 00.999 9
PC vs FS0.952 41.000 00.999 80.998 5
PC vs PO0.577 11)1.000 01.000 00.999 7
AmpFSTRTM IdentifilerTMPC vs UI0.998 40.998 80.999 90.999 5
PC vs FS0.931 11.000 00.999 50.997 2
PC vs PO0.526 71)1.000 01.000 00.999 4
AmpFSTRTM NGMPC vs UI0.978 90.995 80.999 80.998 3
PC vs FS0.938 80.999 80.999 50.992 4
PC vs PO0.531 11)1.000 00.999 90.994 7
AmpFSTRTM SinofilerTMPC vs UI0.989 60.999 60.998 70.990 0
PC vs FS0.940 50.999 70.999 20.997 9
PC vs PO0.531 21)1.000 01.000 00.998 9
Goldeneye® 20APC vs UI0.995 90.997 71.000 01.000 0
PC vs FS0.935 41.000 00.999 80.999 8
PC vs PO0.572 81)1.000 01.000 00.999 2
PowerPlex® 16PC vs UI0.998 00.989 30.999 80.999 5
PC vs FS0.910 20.998 80.999 00.996 2
PC vs PO0.568 21)1.000 01.000 00.997 9
PowerPlex® 21PC vs UI0.998 10.991 51.000 01.000 0
PC vs FS0.945 11.000 00.999 50.999 2
PC vs PO0.577 61)1.000 01.000 00.999 8
SiFa-23plexPC vs UI0.996 40.999 51.000 00.999 9
PC vs FS0.952 41.000 00.999 50.997 4
PC vs PO0.581 91)1.000 01.000 00.998 9

注:1)P>0.000 1。

新窗口打开| 下载CSV


2.2 各试剂盒的肿瘤组织身源鉴定方法

基于上述各试剂盒An 和IBS评分的统计结果,选择A2作为确定肿瘤组织身源鉴定的标准阈值。据此,本研究得到8个试剂盒在不同的A2阈值下对应的灵敏度与特异度(详见附表1~8)。对某一试剂盒来说,不同组别符合上述条件的A2阈值范围存在一定差异。以SiFa-23plex试剂盒为例,当A2≥11时,PC组与UI组即可区分,但PC组与FS、PO组则需分别在A2≥13、A2≥10时才可完全区分。若要在UI组满足灵敏度和特异度均达95%以上,A2值应该在11~19;当A2=13时,可得到最大约登指数为99.78,此时灵敏度为100%,特异度为99.78%,检测准确性最佳(附表8)。不仅如此,由于各试剂盒所用的基因座及基因座数量不同,不同试剂盒符合条件的A2阈值标准范围也存在差异。本研究统计了各试剂盒区分PC组和UI、FS、PO组的阈值标准,详见表4。除试剂盒AmpFSTRTM NGM区分PC组与UI组所需阈值(A2≥10)较另两组高外,其他7个试剂盒用于区分PC组与FS组所需的A2阈值是最高的。试剂盒所使用的STR基因座数量越多,区分PC组与其他各组的A2阈值也越高,使用基因座数量多的试剂盒[AGCU EX22(21个)、PowerPlex® 21(20个)、Goldeneye® 20A(19个)、SiFa-23plex(21个)]完全区分各组的A2阈值均为≥13;而使用基因座数量较少(15个)的试剂盒(AmpFSTRTM IdentifilerTM、AmpFSTRTM SinofilerTM、AmpFSTRTM NGM、PowerPlex® 16)完全区分各组的A2阈值均更低,分别为≥10、≥11、≥9、≥10。

表4   8个试剂盒区分PC组与UI、FS、PO组所需的A2阈值

Tab. 4  The A2 thresholds required for 8 kits to distinguish the PC group from the UIFS and PO groups

试剂盒基因座数量/个PC vs UIPC vs FSPC vs PO
A2灵敏度/%特异度/%约登指数A2灵敏度/%特异度/%约登指数A2灵敏度/%特异度/%约登指数
AmpFSTRTM IdentifilerTM15≥9100.0096.5196.51≥10100.0096.3696.36≥7100.0098.1898.18
AmpFSTRTM SinofilerTM15≥9100.0097.2697.26≥1198.1898.1896.36≥8100.0097.2797.27
AGCU EX2221≥11100.0097.5897.58≥13100.0098.1898.18≥10100.0097.2797.27
AmpFSTRTM NGM15≥1098.1899.5897.76≥9100.0096.3696.36≥8100.0097.2797.27
PowerPlex® 1615≥9100.0098.1898.18≥1098.1896.3694.54≥8100.0097.2797.27
PowerPlex® 2120≥10100.0095.2295.22≥13100.0096.3696.36≥10100.0099.0999.09
Goldeneye® 20A19≥10100.0096.4696.46≥13100.0098.1898.18≥10100.0099.0999.09
SiFa-23plex21≥11100.0097.3897.38≥13100.0096.3696.36≥10100.0098.1898.18

新窗口打开| 下载CSV


表5   27个STR基因座在不同组别中的A2

Tab. 5  The A2 values of 27 STR loci in different groups

基因座PC组UI组FS组PO组基因座PC组UI组FS组PO组
Penta E43111118CSF1PO551 5472225
D18S51517041627D12S391551 0832326
Penta D516741411D19S433551 6882129
D22S1045521 2532117D20S482552 7292843
D10S1248531 5582125D2S1338558072123
D5S818531 2272125D3S1358552 3702337
D6S1043536071938D4S2408552 0292632
D13S317549112333D7S820551 5152440
D16S539541 2832438D8S1179551 6292641
D17S1301542 3852945FGA551 026178
D1S1656549822623TH01552 6423154
D21S11548592332TPOX552 0832140
D2S441541 1122633vWA551 0402734
D9S1122542 2942335

新窗口打开| 下载CSV


表6   15-STRs模型在不同组别中的An 及IBS评分 (x¯±s)

Tab. 6  The An and IBS scores of 15-STRs model in different groups

组别A0A1A2IBS评分
PC(n=55)0.07±0.130.18±0.2914.74±0.3829.67±0.49
UI(n=4 125)3.71±1.351)5.73±1.581)5.56±1.531)16.83±2.371)
FS(n=55)1.78±1.351)7.03±1.241)6.18±1.521)19.40±2.321)
PO(n=110)0.18±0.3010.47±1.391)4.34±1.401)19.16±1.471)

注:n表示样本对数;1)与PC组比较,差异有统计学意义(P<0.000 1)。

新窗口打开| 下载CSV


表7   15-STRs模型在不同A2阈值下区分PC组与UI、FS、PO组的灵敏度、特异度和约登指数

Tab. 7  Sensitivityspecificity and Youden index of 15-STRs model to distinguish the PC groupfrom the UIFS and PO groups at different A2 thresholds

A2PC vs UIPC vs FSPC vs PO
灵敏度/%特异度/%约登指数灵敏度/%特异度/%约登指数灵敏度/%特异度/%约登指数
1100.000.150.15100.003.643.64100.000.910.91
2100.001.121.12100.003.643.64100.001.821.82
3100.005.125.12100.003.643.64100.0012.7312.73
4100.0014.3814.38100.003.643.64100.0033.6433.64
5100.0029.5029.50100.0020.0020.00100.0060.9160.91
6100.0048.2448.24100.0041.8241.82100.0077.2777.27
7100.0068.5868.58100.0060.0060.00100.0088.1888.18
8100.0085.0285.02100.0080.0080.00100.0094.5594.55
9100.0094.3594.35100.0085.4585.45100.0097.2797.27
10100.0098.5098.50100.0090.9190.91100.0098.1898.18
11100.0099.7699.76100.0090.9190.91100.00100.00100.00
12100.00100.00100.00100.00100.00100.00100.00100.00100.00
13100.00100.00100.0098.18100.0098.1898.18100.0098.18
1498.18100.0098.1876.36100.0076.3698.18100.0098.18
1576.36100.0076.3676.36100.0076.3676.36100.0076.36

新窗口打开| 下载CSV


表8   所有肿瘤组织身源鉴定模型的准确度、灵敏度和特异度 (%)

Tab. 8  Accuracysensitivity and specificity ofall tumor tissue origin identification models

模型准确度灵敏度特异度
AmpFSTRTM IdentifilerTM97.59100.0097.56
AmpFSTRTM SinofilerTM99.48100.0099.47
AGCU EX2298.74100.0098.72
AmpFSTRTM NGM97.94100.0097.91
PowerPlex® 1698.51100.0098.49
PowerPlex® 2199.60100.0099.59
Goldeneye® 20A99.77100.0099.76
SiFa-23plex99.66100.0099.65
15-STRs99.89100.0099.88

新窗口打开| 下载CSV


本研究统计了不同STR基因座在各组的A2值(表5),得到在PC组A2值最高的13个STR基因座(CSF1POD12S391D19S433D20S482D2S1338D3S1358D4S2408D7S820D8S1179FGATH01TPOXvWA)以及在UI组A2值最低的2个STR基因座(Penta ED6S1043)共15个STR基因座来尝试构建肿瘤组织身源鉴定模型(15-STRs)。统计15-STRs模型共有等位基因的数量(An )及IBS评分,结果见表6。PC组与其余3组的比较中,除了A0值(0.07±0.13)与PO组(0.18±0.30)的差异无统计学意义外,其他A0A1A2及IBS评分的差异均有统计学意义(P<0.000 1)。

经统计,若使用15-STRs模型进行肿瘤组织身源鉴定,可按照以下标准:A2≥10时,可区分PC组与UI组;A2≥12时,可区分PC组与FS组;A2≥9时,可区分PC组与PO组。详见表7

2.3 身源鉴定模型的验证

本研究对8个STR分型试剂盒构建的肿瘤组织身源鉴定预测模型以及15个STR基因座构建的肿瘤组织身源鉴定模型(15-STRs)进行了验证,得到的灵敏度、特异度和准确度详见表8。所有模型的灵敏度均达100%,特异度为97.56%~99.88%,准确度高达97.59%~99.89%。

其中,使用15-STRs模型对23例配对肿瘤组织样本进行灵敏度验证,结果显示每一对样本中的A2均≥12,根据模型可完全区分PC组和UI、PO、FS 3组,即23对样本中的肿瘤组织和正常组织均来源于同一个体;对1 725对非成对肿瘤组织对进行检测,结果显示绝大多数非成对肿瘤组织对的A2低于12,仅有2对(肿瘤组织58T和52T分别与1个无关个体正常组织配对形成的非成对肿瘤组织对)的A2为12~13,根据模型可完全区分PC组和UI、PO、FS 3组,表明有2对非成对肿瘤组织对被误判为成对肿瘤组织对。经计算,15-STRs模型的准确度为99.89%,灵敏度为100%,特异度为99.88%,均高于另外8个STR分型试剂盒构建的肿瘤组织身源鉴定预测模型。

3 讨 论

一直以来,肿瘤组织身源鉴定是法医学鉴定中的一个难点,由于肿瘤组织和正常组织混杂在一起,且肿瘤组织相较于正常组织出现基因突变的概率更高,极易出现等位基因丢失,导致分型结果出现误差。然而我国的肿瘤发病率一直居高不下,肿瘤组织的个体识别成为法医学鉴定领域迫切需要解决的一个问题。本研究所使用的肿瘤组织身源鉴定预测模型是基于27个STR基因座所建立的。在实际应用中,各试剂盒所用的STR基因座、数量都不同,因此无法完全按照之前建立的标准[14]来进行肿瘤组织身源鉴定。为此本研究筛选了8个常用STR分型试剂盒,为各试剂盒建立了基于An 和IBS评分系统的肿瘤组织身源鉴定预测模型,据此来比较应用不同试剂盒进行肿瘤组织个体识别的差异,同时也为之后应用各试剂盒进行肿瘤组织个体识别提供参考。肿瘤组织与正常组织相比,存在较高的微卫星不稳定性和较多的杂合性丢失现象[7]。与CE平台相比,NGS检测平台检测深度高,能够同时检测的遗传标记更多,可以更好地区分等位基因[12],因此更适合用于肿瘤组织的检测。ForenSeqTM DNA Signature Prep试剂盒作为法医学领域常用的NGS试剂盒,也是发展最成熟的试剂盒之一,无疑是首选试剂盒。在本研究中,使用该试剂盒对55例配对肿瘤组织和75例无关个体正常组织样本进行了27个常染色体STR分型,根据8个常用STR分型试剂盒所使用的STR基因座,挑选出对应的STR分型数据,分为PC、UI、FS和PO组,并根据各组An 和IBS评分的统计结果建立相应的预测模型,为各试剂盒的肿瘤组织身源鉴定提供相应的参考标准,以期更加便捷地进行肿瘤组织身源鉴定。由于各试剂盒使用的STR基因座不同,参考标准也有差异,在实际应用中,可以根据所使用的试剂盒选择相应的标准来进行肿瘤组织身源鉴定。

此外,本研究尝试组建一个新的专门用于肿瘤组织身源鉴定的模型,根据本课题组前期构建的肿瘤组织身源鉴定方法[14],表明A2最适合作为构建模型的主要参考。同时,基于上述对8个STR分型试剂盒An 值和IBS评分的分析,表明A2作为阈值设定的标准比A0A1、IBS评分更为适合。据此,本研究参考A2值筛选出更适合作为肿瘤组织身源鉴定的STR基因座。STR基因座的A2值在PC组越高,能够检测到的目标等位基因越多,具有越高的灵敏度;在UI、FS、PO组越低,说明其在不同个体相似的等位基因越少,具有越高的特异度。本研究对比的8个试剂盒使用的基因座数量在15~21个,其中AGCU EX22、Goldeneye® 20A、PowerPlex® 21、SiFa-23plex使用的STR基因座数量均≥19个,确定所检测的肿瘤组织与正常组织源于同一个体只需要A2≥13即可(各试剂盒特异度和灵敏度均在95%以上),故本研究仅筛选了15个STR基因座来构建肿瘤组织身源鉴定模型(15-STRs),并确定了相应的鉴定标准。基于数据分析结果,应用15-STRs模型进行肿瘤组织身源鉴定的标准为:(1)如果A2≥10,则表明所检测肿瘤组织与正常组织不是来源于无关个体;(2)如果A2≥12,则可确定所检测的肿瘤组织与正常组织源于同一个体。本研究使用另外23例配对肿瘤组织样本对模型进行验证,准确度高达99.89%,特异度也达到了99.88%。本研究所建立的15-STRs模型的准确度和特异度比8个常用STR分型试剂盒都高,说明其更适用于肿瘤组织的身源鉴定。

肿瘤组织并不作为司法鉴定首选的检材来使用,因此,长时间以来肿瘤组织的身源鉴定在法医学鉴定领域存在一定的欠缺,本课题组既往建立的肿瘤组织鉴定模型[14]在一定程度上弥补了基于NGS的肿瘤组织身源识别方法,但在实际应用方面仍有许多问题值得探索。本研究构建的肿瘤组织身源鉴定预测模型为8个常用STR分型试剂盒用于肿瘤组织身源鉴定提供了相应的参考,在实际案件的应用中也更加快捷方便。同时本研究对构建专门的肿瘤组织鉴定试剂盒进行了探索,选取了15个适合用于肿瘤组织身源鉴定的STR基因座,并提供了鉴定标准,为今后构建相应的体系提供了数据基础。

本研究受限于样本数量,并未对肿瘤组织的类型进行细分,不同类型的肿瘤其鉴定结果可能存在差异,因此,对于肿瘤组织的身源鉴定仍需要进一步的探索和研究。

参考文献

高蓓初海超芦文丽.

1990—2019年中国恶性肿瘤疾病负担变化趋势分析

[J].中华疾病控制杂志,2022264):430-436489. doi:10.16462/j.cnki.zhjbkz.2022.04.012 .

[本文引用: 1]

GAO BCHU H CLU W Let al.

Changing trend concerning the burden of cancer between 1990 and 2019 in China

[J]. Zhonghua Jibing Kongzhi Zazhi,2022264):430-436489.

[本文引用: 1]

蔡倩李传苍周雅冰.

2019年恶性肿瘤死亡对中国居民期望寿命的影响

[J].现代肿瘤医学,2023316):1131-1135. doi:10.3969/j.issn.1672-4992.2023.06.029 .

[本文引用: 1]

CAI QLI C CZHOU Y Bet al.

Impact of cancer death on life expectancy of Chinese residents in 2019

[J]. Xiandai Zhongliu Yixue,2023316):1131-1135.

[本文引用: 1]

鲁涤.

利用肿瘤体积倍增时间分析体检引发医疗纠纷1例

[J].法医学杂志,2012286):466-468. doi:10.3969/j.issn.1004-5619.2012.06.018 .

[本文引用: 1]

LU D.

Medical dispute caused by physical examination using analysis of tumor volume doubling time: A case report

[J]. Fayixue Zazhi,2012286):466-468.

[本文引用: 1]

马莹张韶华王秀丽.

肿瘤患者医疗纠纷的法医病理学鉴定分析

[J].中国医药导刊,2011139):1612-1613. doi:10.3969/j.issn.1009-0959.2011.09.088 .

MA YZHANG S HWANG X Let al.

Forensic pathology identification of medical disputes in tumor patients

[J]. Zhongguo Yiyao Daokan,2011139):1612-1613.

郭亚东蔡继峰常云峰.

肿瘤患者医疗纠纷法医病理学鉴定74例分析

[J].法医学杂志,2010263):192-195. doi:10.3969/j.issn.1004-5619.2010.03.009 .

[本文引用: 1]

GUO Y DCAI J FCHANG Y Fet al.

Forensic analysis of 74 tumor related medical malpractice cases

[J]. Fayixue Zazhi,2010263):192-195.

[本文引用: 1]

POETSCH MPETERSMANN AWOENCKHAUS Cet al.

Evaluation of allelic alterations in short tandem repeats in different kinds of solid tumors —Possible pitfalls in forensic casework

[J]. Forensic Sci Int,20041451):1-6. doi:10.1016/j.forsciint.2004.03.006 .

[本文引用: 1]

DANG ZLI LKONG Xet al.

Evaluation of allelic alterations in short tandem repeats in papillary thyroid cancer

[J]. Mol Genet Genomic Med,202084):e1164. doi:10.1002/mgg3.1164 .

[本文引用: 1]

VAUHKONEN HHEDMAN MVAUHKONEN Met al.

Evaluation of gastrointestinal cancer tissues as a source of genetic information for forensic investigations by using STRs

[J]. Forensic Sci Int,20041392/3):159-167. doi:10.1016/j.forsciint.2003.10.016 .

方建新李成涛肖立.

13个STR位点在人消化系统肿瘤组织中的变异分析

[J].法医学杂志,2007234):280-282. doi:10.3969/j.issn.1004-5619.2007.04.012 .

[本文引用: 1]

FANG J XLI C TXIAO L.

Evaluation of allelic alterations in 13 CODIS STR loci in tumor tissues from human digestive system

[J]. Fayixue Zazhi,2007234):280-282.

[本文引用: 1]

赵书民张素华李成涛.

采用Identifiler系统判定消化系统肿瘤组织身源准则探讨

[J].法医学杂志,2011272):102-106. doi:10.3969/j.issn.1004-5619.2011.02.006 .

[本文引用: 1]

ZHAO S MZHANG S HLI C T.

A primary study of criterion for source identification of gastrointestinal tumor sample with Identifiler multiplex system

[J]. Fayixue Zazhi,2011272):102-106.

[本文引用: 1]

李成涛.

消化系统肿瘤组织身源鉴定策略探索

[D].上海复旦大学2010.

[本文引用: 1]

LI C T.

A pilot study of source identification of body for gastrointestinal tumor tissue

[D]. ShanghaiFudan University2010.

[本文引用: 1]

PERVEZ M THASNAIN M J UABBAS S Het al.

A comprehensive review of performance of next-generation sequencing platforms

[J]. Biomed Res Int,202220223457806. doi:10.1155/2022/3457806 .

[本文引用: 2]

MCCOMBIE W RMCPHERSON J DMARDIS E R.

Next-generation sequencing technologies

[J]. Cold Spring Harb Perspect Med,2019911):a036798. doi:10.1101/cshperspect.a036798 .

[本文引用: 1]

陈安琪.

肿瘤组织突变状态评估及身源鉴定研究

[D].上海复旦大学2022.

[本文引用: 4]

CHEN A Q.

Investigation on tumor status evaluation and individual identification

[D]. ShanghaiFudan University2022.

[本文引用: 4]

孔倩倩陈丽琴李成涛.

增加检测STR和引入参考样本对叔侄关系鉴定的效能分析

[J].法医学杂志,2022383):360-366. doi:10.12116/j.issn.1004-5619.2022.520407 .

[本文引用: 1]

KONG Q QCHEN L QLI C Tet al.

Efficiency analysis of uncle-nephew relationship identification by increasing STR markers and adding reference sam-ples

[J]. Fayixue Zazhi,2022383):360-366.

[本文引用: 1]

徐冬冬王韵杨慧凌.

亲子鉴定中Penta D出现三等位基因1例

[J].法医学杂志,2021376):912-913. doi:10.12116/j.issn.1004-5619.2019.591105 .

[本文引用: 1]

XU D DWANG YYANG H Let al.

Triallelic pattern found in Penta D in a paternity test: A case report

[J]. Fayixue Zazhi,2021376):912-913.

[本文引用: 1]

周旭明高登星李发院.

EX20+30Y试剂盒的建立及法医学应用

[J].法医学杂志,2021375):639-645. doi:10.12116/j.issn.1004-5619.2020.500509 .

[本文引用: 1]

ZHOU X MGAO D XLI F Y.

Development and forensic application of EX20+30Y kit

[J]. Fayi-xue Zazhi,2021375):639-645.

[本文引用: 1]

邵诚臣姚以宁周月琴.

采用ITO法鉴定母亲为姐妹的特殊半同胞关系

[J].法医学杂志,2021376):836-840. doi:10.12116/j.issn.1004-5619.2020.500712 .

[本文引用: 1]

SHAO C CYAO Y NZHOU Y Qet al.

Application of ITO method in determination of special half-sibling relationship

[J]. Fayixue Zazhi,2021376):836-840.

[本文引用: 1]

邹凯南曹禹夏子芳.

Expressmarker 22 STR荧光检测试剂盒的法医学应用

[J].法医学杂志,2012286):448-450. doi:10.3969/j.issn.1004-5619.2012.06.013 .

[本文引用: 2]

ZOU K NCAO YXIA Z Fet al.

Forensic application of Expressmarker 22 STR loci direct PCR amplification kit

[J]. Fayixue Zazhi,2012286):448-450.

[本文引用: 2]

李梅李诗莹张倍倍.

复杂亲缘关系鉴定的研究进展

[J].法医学杂志,2020365):691-698. doi:10.12116/j.issn.1004-5619.2020.05.016 .

[本文引用: 1]

LI MLI S YZHANG B Bet al.

Research progress on complex kinship analysis

[J]. Fayixue Zazhi,2020365):691-698.

[本文引用: 1]

练惠辉戈文东林峰.

福建汉族人群21个常染色体STR基因座的遗传多态性

[J].法医学杂志,2015313):211-214. doi:10.3969/j.issn.1004-5619.2015.03.010 .

[本文引用: 1]

LIAN H HGE W DLIN Fet al.

Genetic polymorphisms of 21 autosomal STR loci of Fujian Han population

[J]. Fayixue Zazhi,2015313):211-214.

[本文引用: 1]

HAJIAN-TILAKI K.

Receiver operating characteristic (ROC) curve analysis for medical diagnostic test evaluation

[J]. Caspian J Intern Med,201342):627-635.

[本文引用: 2]

/