科研干货 | 细菌基因组数据NCBI上传教程2.0

健康   2024-10-28 17:05   江苏  

号外~号外~细菌基因组数据NCBI上传教程更新啦!

上传教程千千万,不如小派这一篇!

单样本、多样本基因组数据上传全部轻松拿捏~

咱们废话不多说,直接上超详细干货

基本流程



一、NCBI注册及上传


1、注册网站:

https://www.ncbi.nlm.nih.gov/account/register/?back_url=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fhome%2Fsubmit.shtml&partners-uri=cms:/account/partners

打开NCBI注册网站,选择第三方平台进行注册登录


2、进入提交页面

打开NCBI官网https://www.ncbi.nlm.nih.gov/,输入账号和密码,点击网页上的Submit栏可进入GenBank界面,找到细菌基因组提交栏,点击进入即可开始本次的提交(或直接点击https://submit.ncbi.nlm.nih.gov/subs/genome/进入提交界面)。

具体步骤如下:


3、点击New submission进入,此步操作可以得到SUB号;



Part 01

单样本基因组上传


二、基本信息填写


1、单个样本基因组上传——选择Single genome,点击continue;


2、进入SUBMITTER完善个人信息,带*为必填项,填写完点击continue。此处的邮箱不建议使用qq邮箱、163邮箱和foxmail邮箱;


3、General Information信息填写(此处以未申请BioProject和BioSample号为例,如果已经申请过可以直接将对应的BioProject和BioSample号直接填写即可):

(1)BioProject和BioSample处选择NO,释放数据日期可根据自己的需要来进行选择;

(2)组装和测序信息填写(组装软件及版本可在结题报告附录-软件列表查看):

细菌框架图项目的组装软件:spades,版本v3.15.4

细菌完成图项目的组装软件:Fyle,版本v2.9.1-b1781;Unicycler,版本 v0.5.0;


(3)测序深度及测序平台的选择:

测序深度=测序数据量/基因组大小(可在结题报告-二代测序数据过滤部分查看);

测序平台:二代一般为Illumina Novaseq平台,三代一般为Pacbio/Nanopore平台(可在结题报告-文库信息部分查看);


(4)填写基因组的组装信息以及是否有关联的文章,填写完成后点击Continue进入下一步;



三、BioProject信息填写


菌株英文描述(大概100个左右word ):描述下该菌株进行全基因组测序的目的、意义及用途(工业/农业/医疗等等)等信息(共性\不同),填写完成后点击Continue进入下一步;



四、BioSample信息填写


1.选择Microbe,点击Continue进入下一步;


2.BioSample Attributes:填写物种拉丁名称及菌株名;菌株的来源,保存单位(xxx单位分离及分离信息 xxx单位保存或 xxx保藏中心保存)和样本收集时间;


3.source:是否需要NCBI注释——选择Yes;



五、Sequence上传,信息填写


1.Files:细菌完成图如果只组装出一条染色体,没有质粒可选择选项1;细菌框架图组装出多条scaffold或细菌完成图组装出了多条完整的染色体/质粒可选择选项2;


2.选择网页版上传,并将基因组中的染色体和质粒的fasta文件全部上传(细菌完成图上传Assembly文件夹*.fasta文件,细菌框架图上传Assembly文件夹*.scaffolds.fna文件),上传后点击Continue进入下一步;


3.Assignment:需要确认组装得到的染色体有几条、是否含有质粒,染色体和质粒是否为完整的环状的,以及Sequence ID需要与fasta文件中>后名字一致。在提交质粒信息的时候,质粒的命名为以“P”开头的名字或者命名为unnamed、unnamed1......


4.填写作者名字及排序,以及该基因组是否有相关联的文章,点击Continue进入下一步;



六、数据提交


核查已填入的信息是否有误,有问题的话返回对应的界面进行修改,确认无误后点击Submit完成本次NCBI上传。一般上传一个星期内NCBI会发邮件到邮箱,给出相应的登录号,这个登录号可直接用于后续的文章中。


Part 02

多样本基因组上传(针对于细菌框架图样本)



1、多个样本基因组上传——选择Batch/multiple genomes,点击continue;


2、Gap信息填写


3、BioProject General Info


4、Publications


5、Biosample Type


6、Attributes


7、Genome Info

(1)填写基因组信息


(2)组装和测序信息填写(组装软件及版本可在结题报告附录-软件列表查看)


8、Files:选择网页版上传,并将基因组中的fasta文件全部上传(细菌完成图上传Assembly文件夹*.fasta文件,细菌框架图上传Assembly文件夹*.scaffolds.fna文件),上传后点击Continue进入下一步;


9、References:填写作者名字及排序,以及该基因组是否有相关联的文章,点击Continue进入下一步;


核查已填入的信息是否有误,有问题的话返回对应的界面进行修改,确认无误后点击Submit完成本次NCBI上传。一般上传一个星期内NCBI会发邮件到邮箱,给出相应的登录号,这个登录号可直接用于后续的文章中。


以上就是细菌基因组上传至NCBI的详细步骤,是不是已经学会了?赶快用自己的数据来试试吧!如果大家在上传过程中有任何疑问,欢迎随时和我们一起探讨,可在文末留言或者邮件交流(microsupport@personalbio.cn)。



1

END

1



上海派森诺生物科技股份有限公司成立于2011年4月,是一家致力于为生命科学、健康医学等领域提供微生物组、基因组、转录组、单细胞及蛋白代谢等多组学分子生物学技术服务及大数据挖掘与分析服务的高新技术企业,是国家级专精特新“小巨人”企业、国家知识产权优势企业、上海市“科技小巨人”企业。公司总部位于上海,设有多家全资子公司,实验及办公面积逾15,000m2

公司建立了完善的基因测序平台和大数据云计算平台,具有完全自主研发的创新技术和成果,派森诺生物及所属子公司已取得授权及受理专利、软件著作权250余项;合作项目论文多次发表在Nature、Lancet等国际生命科学、医学权威期刊,联合署名发表的SCI文章超1,500篇,累计影响因子超过10,000分。公司在全国31个省市设立了销售网点,业务网络覆盖亚洲、欧洲、大洋洲等多个国家,与全球500多所高校、300多家医院及600多家科研机构建立了紧密合作关系。

派森诺生物作为基因检测、蛋白代谢检测及大数据分析、体外诊断试剂开发的服务商,始终秉承“解析基因序列,诠释生命密码,改善人类生活”的企业使命,致力于为广大生命科学、医学工作者提供包括高通量基因测序、临床医学基因检测、蛋白及代谢组检测分析、生物信息学服务、生物云计算、分子生物学实验等科研及临床应用解决方案。


派森诺生物
生命科学研究最新进展,尽在一手掌握!
 最新文章