大家好,我是邓飞。
今天介绍一下IBS和IBD的区别:
IBS(肠易激综合症)和IBD(炎症性肠病)是两种不同的消化系统疾病,主要区别如下:
IBS(Irritable Bowel Syndrome):是一种功能性肠道疾病,主要表现为腹痛、腹胀、腹泻或便秘,症状通常与饮食、压力和心理因素相关,没有明显的器质性病变。
IBD(Inflammatory Bowel Disease):是一组炎症性疾病,包括克罗恩病(Crohn's disease)和溃疡性结肠炎(Ulcerative Colitis),其特征是免疫系统的异常反应导致肠道慢性炎症,症状通常包括腹痛、腹泻、体重下降和疲劳。
错了,重新来。
IBS(Identical By State,状态同源):IBS指的是两个个体在某一基因座上拥有相同的等位基因,但这些等位基因不一定来源于同一祖先。换句话说,IBS是基于基因型相似性的度量,而不考虑等位基因的具体来源。说人话:IBS是状态同源,是根据基因型相似性进行计算的,不考虑等位基因的来源;
IBD(Identity By Descent,血缘同源:IBD指的是两个个体中共有的等位基因来源于同一祖先。这些等位基因在遗传过程中未经重组而直接传递给后代,因此能够反映个体间的亲缘关系。说人话:IBD是血缘同源,等位基因遗传过程中传递给后代,片段是不变的,需要考虑等位基因的来源。
其实,很久之前,我就写了一篇介绍IBS和IBD的文章:论体型决定性格以及逗比潜质的遗传性分析
文中说:根据SNP或者SSR计算的是IBS矩阵,是不全面的,其实,也可以计算IBD,下面有介绍。
系谱计算的是IBD,同胞,半同胞,表兄弟,都是有亲戚关系的,他们性格,长相相似,是有依据的,因为他们由IBD计算的血缘相似性较高。根据SNP或者SSR计算的是IBS,虽然两个人没有亲戚,但依旧有很高的相似性(比如长相,性格,体型,爱好等),这说明两者的IBS计算的相似性较高。
邓飞2013,公众号:育种数据分析之放飞自我论体型决定性格以及逗比潜质的遗传性分析
说了一大堆概念,代码在哪里???
如何计算IBD?
IBD计算,可以用系谱记录进行计算,计算亲缘关系A矩阵如何利用系谱计算近交系数和亲缘关系系数,怎么推断呢,比如0.25是半同胞,0.5是全同胞或者亲子关系,写到这里,我突然想到,人类的亲疏是根据IBD划分的,亲子关系和同父母的兄弟姐妹的IBD都是0.5,应该是人类中最亲的关系了。
如何计算IBS?
如何计算IBS矩阵呢,其实,Excel也可以计算,比如:ID1和ID2之间的IBS相关系数,比较每个SNP的交叉数,比如SNP1,分别是TT和TT,那么就是2;如果是TT和TA,就是1;如果是TT和AA,就是0。统计一下总和,然后计算一下比值,比如10个SNP总数是20,统计的总和为9,那么IBS为0.45。
把上面的Excel表格的SNP数据,转为plink格式,方法见链接:Excel的SNP数据如何变为plink格式,运行代码:
plink --file file --ibs-matrix
结果如下:
cat plink.mibs
1 0.45 0.85
0.45 1 0.4
0.85 0.4 1
可以看到,ID1 VS ID2为0.45,ID1和ID3是0.85,和Excel计算的结果一样一样滴。
为啥SNP数据还可以计算IBD?
因为官方文档写了呀:https://www.cog-genomics.org/plink/1.9/ibd
PLINK中使用 PI_HAT 值来推定IBD的值。该方法基于**隐马尔科夫模型 hidden Markov model (HMM)**,通过矩估计(method-of-moments)来计算 IBD=1, 2或0 的概率。PLINK1.9中提供了`--genome`的选项,以计算 PI_HAT。
不是直接计算的IBD,而是通过IBS进行推断的,经验值也是0.25是半同胞,0.5是全同胞。
同样的道理,如果是SNP数据计算的G矩阵(如何构建G矩阵-基因组亲缘关系矩阵(Genomic relationships matrix))也应该算是IBD矩阵,和系谱计算的亲缘关系A矩阵一样都属于IBD矩阵。
最后,这个图是几个意思?
这个是表型相似,按道理来说是IBS相似,不可能是IBD矩阵,因为不可能存在亲缘关系。。。感觉这个图让我对我写的一大堆IBS和IBD的内容暴击了1000倍。
想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子