有小伙伴反馈光宝,没实验条件怎么发文?
这不就是“瞌睡遇到枕头”了,光宝分享的几乎所有文献都是在协助大家解决这个问题。可以多多跟进下光宝发的文章思路,选择满足自己需求的来复现!
纯分析文章,粗略可以分为2类:
临床的:除了利用自己收集的数据外,各种临床数据库,包括国外的(NHANES、SEER、UKB和MIMIC等)和国内的(CHARLS、CHNS等)。利用这些数据库,结合孟德尔随机化分析、机器学习等方法,构建诊断/预后模型之类的。
基础的:各种高通量测序的公共数据(GEO、TCGA、EBI、ArrayExpress等)进行数据挖掘,可以根据发文需求考虑是否添加验证或者机制实验。
那光宝今天重点介绍基础方向的(关注临床数据挖掘的话,可以看看光宝过去的文章)。
也有人有疑虑,现在基础类的纯分析,似乎难以发到高分?也是,任何套路用的多了,自然会落伍。那今天光宝就推荐一篇17.3分顶刊Nat Cell Biol上的生信文章,给大家带带思路。本文利用双诺奖的“深度学习”,结合风头正盛的“单细胞/空间多组学”,通过公共数据结合自测数据的方式,绘制了小鼠肝脏各细胞类型间的增强子调控网络,明确肝细胞中的基因调控网络,给我们华丽的展示了一波生信分析的魔力!(对机器学习/深度学习想要有基础了解的,可以翻下光宝之前的文章哦)
本文思路可完美移植到各种疾病方向,当前各种疾病的公共数据都在极速扩增,放着金山不用,可就太可惜了!涉及的多组学分析和机器学习都极力推荐大家进行系统的学习哦(PS:看到这,是不是非常期盼自己也能开发新的机器学习框架?有梦想就对了,多组学分析、机器学习都是光宝的拿手绝活,想要复现本文思路,我们通通帮你全搞定,还不快来滴滴光宝,有惊喜在等着你哦!)
定制生信分析
云服务器租赁
(加微信备注99领取试用)
题目:单细胞空间多组学和深度学习剖析肝脏分区中增强子驱动的基因调控网络
杂志:Nat Cell Biol
影响因子:17.3
发表时间:2024年1月
公众号回复“999”领取原文PDF,文献编号:241025
研究背景
基因调控网络(GRN)定义细胞特性,转录因子(TF)通过结合基因调控元件调节表达。单细胞技术如scRNA-seq和snATAC-seq揭示了细胞状态和染色质可及性,为研究细胞类型特异性GRN提供了机会。肝脏细胞沿门静脉至中央静脉的梯度变化,受微环境影响。这些变化如何与基因组调控相互作用,尚待进一步研究。
研究结果
1.小鼠肝脏的空间单细胞多组图谱分析
作者应用单细胞多组学技术,包括snRNA-Seq和snATAC-Seq,对小鼠肝脏组织进行多次高通量测序,分析肝脏细胞的染色质可及性和基因表达。结果揭示了细胞亚群和沿门静脉的单向梯度空间轴。
2.关键基因调控网络和转录因子
使用pyscisTarget分析,作者筛选了关键转录因子(TF),并预测了它们的目标增强子区域,构建了增强子调控网络。研究发现,肝细胞核心调控因子包括ONECUT1、CEBPA等,而TBX3和TCF7L1在特定区域特异表达。此外,还发现了与营养、激素和生物钟相关的调控因子。
3.MPRA解析增强子活性的核心基序
采用增强子条码进行大规模平行突变分析(MPRA),筛选肝细胞可及的10,845个基因组区域,克隆后转染至小鼠肝脏和HepG2细胞。结果显示,这些区域的增强子活性显著高于随机序列,特别是HNF1A、HNF4A等因子的靶区域。通过基序分析和随机森林模型,揭示了活性增强子的关键基序,为理解增强子活性的分子机制提供了新见解。
4.DeepLiver解码肝细胞增强子
作者开发了一种深度学习框架DeepLiver,通过卷积神经网络(CNN)分析DNA序列,识别肝脏调控模式。该模型利用迁移学习,优化了对体内MPRA活性和肝细胞分区的预测。尽管样本数量有限,DeepLiver在预测准确性和损失上优于随机分类器,与实验数据的高相关性验证了其有效性。该模型能准确预测DNA序列的细胞类型、增强子活性和分区模式。
文章小结
本文展示了深度学习在医学基础研究中的卓越应用,通过对公共数据和自测数据进行整合分析,解码肝细胞增加子的调控机制,为最终精准调控肝脏分区提供理论基础,实现了科研与临床的完美结合。机器学习和深度学习等是真的豪横,高通量数据的分析和挖掘就是要这么做,小伙伴们好好学学吧!想趁着诺奖这波东风,在机器学习上吃一波红利,就得赶紧动手了!如果想复现本文思路,抓紧联系光宝哦。
生信光公众号持续为大家带来最新生信思路,更多创新性分析思路请查看往期推荐。想复现这种思路或者定制更多创新性思路欢迎直接call光宝,我们团队竭诚为您的科研助力!
文献思路复现
定制生信分析
服 务 器 租 赁
扫码咨询光宝
【往期推荐】