学生物信息,做法证先锋

文摘   2025-01-12 08:54   辽宁  
最近正在看电视剧《我是刑警》,这部电视剧比其他刑事案件精彩的地方是比较真实,不仅案情来自于真实案例,而且故事情节非常真实,比如很多时候案件进入死胡同了。之前也看过很多刑侦片,有法官主导破案的,有律师主导破案的,有检察官主导破案的还有法医主导破案的,最扯的还得属画像师主导破案的,这部电视剧非常真实。不过这次内容我们还是要介绍一下再居中大放异彩的生物信息技术。



人基因组染色体图谱

人体有一共有 23 对染色体,其中 22 对为常染色体,1 对为性染色体以及其他一些线粒体DNA等。人体全部遗传信息都藏着这些染色体中。这些染色体一半来自父亲,一半来自母亲。这是遗传基本规律。而其中只有男性有 Y 染色体,只能在父子之间单向传递,因此同一父系的所有男性个体中,包括兄弟,父子,叔侄,堂兄弟和祖孙等,都具有同源的 Y 染色体。

图1 人染色体图谱

注意这里说的是同源,在遗传过程中,也会发生一些突变。Y染色体也不是永远都一样的。比如一个男性和堂兄弟之间也是有一些差别。

虽然 Y 染色体在遗传过程总会发生突变,但在 10 代之内通常不会发生大的变化。

Y-STR生物信息技术

由于人体有20亿碱基对,只有ATCG四种碱基组成,这样就必然会有很多重复的区域,其中一种重复称为串联重复Tandom Repeat,例如ATGATGATG,另外一种是散在重复。根据重复单元的长度和序列特征,串联重复序列可以分为以下几类:

根据重复单元的长度和碱基组成,可以进一步分为大卫星DNA(Macro-satellite DNA)、小卫星DNA(Mini-satellite DNA)和微卫星DNA(Micro-satellite DNA)。

其中微卫星DNA(Micro-satellite DNA)也称为短串联重复序列(Short Tandem Repeats,STRs)。重复单元长度较短,一般在1-6个碱基对之间,最常见的是二核苷酸重复(如CA重复、AT重复等)和三核苷酸重复(如CAG重复、CTG重复等)。微卫星DNA在基因组中分布广泛,数量众多,且具有高度的多态性,除去同卵孪生之外,任意两人的多个STR位点长度全相同的几率极小,且相似程度取决于两人的亲缘关系。STR是目前法医DNA分析和遗传图谱构建中最常用的遗传标记之一。


图2 STR位点

Y-STR分析针对的是Y染色体上的特定区域,这些区域在男性个体中具有高度的特异性,Y-STR 序列的重复次数在个体和家系间有显著差异性。由于Y染色体只在男性中遗传,因此Y-STR分析可以专门用于确定犯罪现场发现的男性生物样本的来源。
图3 美国联邦调查局推荐使用的STR位点
研究显示目前经确认的 STR 位点已经有 200 多个,也就是说,如果两个人的 Y 染色体有 4 STR 位点完全匹配,他们拥有共同父系祖先的概率接近 95%,如果有 5 到 9 个 STR 位点完全匹配,他们拥有共同父系祖先的概率则趋近于 100%。
Y-STR分析的主要局限性在于它只能提供男性个体的信息,对于女性嫌疑人或受害者的分析则不适用。不过根据以往统计治疗,90%的凶杀案凶手为男性。
此外,在刑事案件中,Y-STR分析通常与其他DNA分析方法(如常染色体STR分析)相结合使用,以提供更全面和准确的遗传信息。同时,法律专业人士需要了解Y-STR分析的科学原理、局限性和解释方法,以便在案件中正确使用和评估这些证据。
Y-STR测序

那么如何对Y-STR进行测序呢?人基因组过于庞大,测序比较慢,肯定不能采取全基因组测序的方法。而是仅测序目标区域,也就是Y染色体上的STR区域,一般从犯罪现场发现的生物样本如血液、精液、毛发、唾液等都比较少,还要结合PCR扩增技术。

1、样本采集:通常采集血液、唾液、精液或毛发等含有DNA的样本。
2、DNA提取:从样本中提取出高质量的DNA。
3、PCR扩增:使用特异性引物对Y染色体上的STR区域进行PCR扩增,以增加目标DNA片段的数量。
4、测序:对PCR扩增产物进行测序,可以使用传统的Sanger测序或新一代测序技术(如Illumina测序、PacBio测序,nanopore测序等)。
5、数据分析:对测序数据进行分析,确定Y染色体上STR的重复次数和序列变异情况。

图4 《我是刑警》剧照

Y-STR生物信息数据库

光有Y-STR序列结果是不够的,这只有犯罪嫌疑人的生物指纹信息,还需要根据生物指纹信息锁定嫌疑人,还需要一个全民的Y-STR数据库。

Y-STR数据库是一个专门存储Y染色体短串联重复序列(Y-STR)数据的数据库。

我们国家目前已经开始建设了中国Y-STR数据库。由中国公安部物证鉴定中心建立和维护,是国内最权威的Y-STR数据库之一。该数据库包含了大量中国人群的Y-STR分型数据,为国内的法医学和人类遗传学研究提供了重要支持。

未来刑侦发展方向
DNA技术在刑侦方法已经取得了巨大进展,电视剧后半部中,基本上每个答案都要用到DNA技术,虽然DNA技术很有用,但还是可以结合很多新技术。

图5 《我是刑警》剧照
1、机器学习:在张克寒案件中,2010年的时候调用200多人(实到80人)一帧一帧看监控,2012年的时候不得不调用1000多人在体育场里看监控。现在有了人工智能和机器学习的技术,利用机器学习可以进行图像识别,只需要输入人脸,就可以快速筛选出嫌疑人。现在一个手机相册都具有了AI识图的能力,再也不用一帧一帧看监控了。
2、人工智能:利用人工智能技术,通过DNA生物信息还原出的嫌疑人画像。利用已有Y-STR信息与照片进行建模。有了这个大模型之后,新输入的Y-STR将输出嫌疑人外貌特征,例如脸型、肤色、发色、眼镜颜色等。
不过这个想法实现起来还具有很大的难度,因为人体的外貌基因不一定和Y染色体有关联,是全基因组多基因决定的。
3、大数据:利用大数据分析技术进行预测,整合各种来源的犯罪数据,包括警方记录、社交媒体、物联网设备等,进行全面的数据分析,以发现隐藏的犯罪模式和关联。大数据分析可以帮助警方更好地了解犯罪活动的规律,提前采取预防措施,并优化资源分配。
4、物联网与智能监控:随着物联网技术的发展,越来越多的设备将具备联网功能,如监控摄像头、传感器等。这些设备可以实时收集和传输数据,警方可以利用这些数据进行实时监控和预警,及时发现犯罪活动并采取行动。
5、DNA快速测序技术:对DNA进行现场提取,现场测序。目前已经有了DNA快速提取技术和测序技术。新一代纳米孔测序可以最快10分钟完成建库和拿到数据。第一时间得到数据然后进行比对,可以节省大量案情时间。
所谓“上医治未病”,DNA指纹技术,物联网,人工智能,大数据等新技术的加入,不仅能为刑侦提供强有力的证据,更能对犯罪分子起到非常好的震慑作用。


基因学苑
生物云计算专家
 最新文章