大家好,我是邓飞,之前推荐过这本《Genome-Wide Association Studies》的书籍(GWAS书籍:《Genome-Wide Association Studies》,电子版pdf),2022年出版的,内容比较前沿。电子版书籍获得方法,公众号后台回复:book1,获得pdf链接。
这几天看过一遍了,觉得干货很多,有很多知识点的连通,弄懂了之前是是而非的概念,收获很大。我觉得阅读一本书,如果把刚读懂的输出写篇博客,或者把没有搞懂的内容写出来交流一下,是掌握知识的快捷方法。所以,我计划,把每一章节搞成一篇文章。主要内容,不是单纯的翻译,而是拆解之后的再学习。
工具介绍:
阅读使用的是Zotero(2024年勉强分享办公神器1),加一个翻译插件,选中之后自动翻译为中文:
使用xmind进行内容的整理,针对一些自己搞懂的知识点,使用typora写SS读书卡片,然后用obsidian进行双向链接管理。学渣工具多,说的就是我啊。。。。。。
这本书的目录:
今天介绍第一章:《GWAS分析的主要步骤和关键要点》。
GWAS分析大体有四个部分:
1,表型数据分析
2,基因型数据分析
3,关联分析
4,候选基因分析
GWAS VS QTL:
QTL都是人工群体,有高度的LD衰减,所以需要比较少的标记就可以。但是QTL缩小区间,需要大量的群体才能找到交换单株,工作量巨大。
GWAS群体LD衰减距离很快,所以需要高密度的标记。GWAS成为育种群体挖掘基因的更有利工具。进而应用于MAS。
在多基因效益以及基因间互作的复杂遗传结构,GWAS通常可以提供相对于双亲图谱更高的遗传分辨率
SV分析GWAS的思路:
SV也可以变为主等位纯合、杂合、次等位纯合的格式,编码为0-1-2的格式,用GAPIT分析完全没问题。
研究表明,SV的GWAS结果和SNP的GWAS结果,重复度在93%以上。同时,7%是SV单独解释的,SV解释抗病性中更大比例的变异。
GWAS中考虑单倍型
填充,低密度填充到高密度,需要用到单倍型
定位基因时,单倍型数据可以降低假阳性
GWAS分析汇总不同模型共有位点:
有共有位点,说明这个位点可信度比较高
没有共有位点,并不意味着假阳性或者错误的结果,还需要进一步验证。
做GWAS的自我灵魂拷问:
下一篇,介绍《表型数据处理》,欢迎继续关注。
想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你制定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子
推荐阅读