你只管提要求，剩下的交给AI

文摘其他 2025-01-21 08:13 辽宁

技术一直都在拉开差距，造成马太效应。AI工具并不能让零基础学生物信息变得简单，相反，是让已经会生物信息的工作起来更高效。这次内容我们拿几个具体的案例测试一下Marscode AI的生物信息能力，看一下AI如何提高工作效率。

利用AI下载生物数据

MarsCode AI可以根据我们的要求自动生成代码，还能生成代码注释，也可以作为聊天工具，通过问答式的方法生成代码和答案。这里面最重要的工作是如何将问题描述清楚，准确的给AI正确的提示，这个也称为“提示工程”。接下来我们就使用AI来下载生物数据，看如何进行提示工程。

输入要求：从ensembl下载人基因组。

直接得到下面代码，这个代码是正确的。

#!/bin/bash
# 定义Ensembl的FTP地址和文件名ENSEMBL_FTP="ftp://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/"FILENAME="Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz"
# 创建一个目录来存储下载的文件mkdir -p human_genome# 使用wget下载文件wget -P human_genome $ENSEMBL_FTP$FILENAME# 解压缩下载的文件gunzip human_genome/$FILENAME

但是写到一个脚本中，我们可以继续对话。

提示二：不使用变量。然后输出新的结果。

这次直接得到一行bash命令。

继续提要求，我要下载103的版本。很容易就切掉换到103的版本。

#!/bin/bash
# 直接在一行中执行所有命令mkdir -p human_genome && wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz && gunzip human_genome/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz

接下来继续，提要求下载gtf和gff格式文件。

#!/bin/bash
# 创建一个目录来存储下载的文件mkdir -p human_genome# 下载基因序列文件wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz# 解压缩基因序列文件gunzip human_genome/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz# 下载GTF文件wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/gtf/homo_sapiens/Homo_sapiens.GRCh38.103.gtf.gz# 解压缩GTF文件gunzip human_genome/Homo_sapiens.GRCh38.103.gtf.gz# 下载基因集文件wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/gff3/homo_sapiens/Homo_sapiens.GRCh38.103.gff3.gz# 解压缩基因集文件gunzip human_genome/Homo_sapiens.GRCh38.103.gff3.gz

继续提要求，按照不同染色体下载，这样就可以将染色体信息拆分开。

#!/bin/bash
# 创建一个目录来存储下载的文件mkdir -p human_genome# 下载基因序列文件wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz# 解压缩基因序列文件gunzip human_genome/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz# 下载GTF文件wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/gtf/homo_sapiens/Homo_sapiens.GRCh38.103.gtf.gz# 解压缩GTF文件gunzip human_genome/Homo_sapiens.GRCh38.103.gtf.gz# 下载基因集文件wget -P human_genome ftp://ftp.ensembl.org/pub/release-103/gff3/homo_sapiens/Homo_sapiens.GRCh38.103.gff3.gz# 解压缩基因集文件gunzip human_genome/Homo_sapiens.GRCh38.103.gff3.gz

我嫌wget下载速度太慢了，于是想切换到aria2下载，继续提要求，使用aria2进行下载。由于AI要使用上下文，默认它下载是上一步骤中的按染色体下载的代码。这里在给他新增一个要求“不按染色体下载”，AI很聪明的将aria2用于前面不按染色体拆分的地方进行处理。

#!/bin/bash
# 创建一个目录来存储下载的文件mkdir -p human_genome# 下载基因序列文件aria2c -x 16 -s 16 -d human_genome ftp://ftp.ensembl.org/pub/release-103/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz# 解压缩基因序列文件gunzip human_genome/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz# 下载GTF文件aria2c -x 16 -s 16 -d human_genome ftp://ftp.ensembl.org/pub/release-103/gtf/homo_sapiens/Homo_sapiens.GRCh38.103.gtf.gz# 解压缩GTF文件gunzip human_genome/Homo_sapiens.GRCh38.103.gtf.gz# 下载基因集文件aria2c -x 16 -s 16 -d human_genome ftp://ftp.ensembl.org/pub/release-103/gff3/homo_sapiens/Homo_sapiens.GRCh38.103.gff3.gz# 解压缩基因集文件gunzip human_genome/Homo_sapiens.GRCh38.103.gff3.gz

代码看不懂也不用担心，其实每一条代码下面都是有详细解释的，包括一些重要选项参数，只不过内容太多，没有截图。

基因学苑

生物云计算专家

最新文章

你只管提要求，剩下的交给AI

2025新春特辑：买课程再送一年云服务器练习

AI辅助生物信息分析

2025新春特辑：买课程再送一年云服务器练习

如何利用vscode远程打开图片和网页

看了那么多教程，为何还学不好生物信息？

关于生物信息找工作，50个问答给你说清楚

2025新春特辑：买课程再送一年云服务器练习

tldr：为生物软件添加一个中文注释

【建议收藏】基因学苑文章列表（2025年1月）

利用codespaces快速下载生物数据

学生物信息，做法证先锋

tldr：为命令行添加一个中文注释

2025年学生信，看这套视频就够了

再见了搜狗输入法

2025年学生信，看这套视频就够了

传输数据，还得是Filezilla

2025年学生信，看这套视频就够了

专业写文献的AI，它还是来了

极简工作环境配置

2025年，该学习生物信息了

史诗级升级，bioconda使用本地数据库

2025学生信，看这套教程就够了

《宏基因组数据分析》直播课程开始报名

边唠嗑边搜索

学生物信息，做法证先锋

2025学生信，看这套教程就够了

国内做生信，岂能不会更改镜像

Linux系统如何安装二进制R包

2025学生信，看这套教程就够了

2024学生信，看这套教程就够了

AI编程，就用cursor

考上研上岸，学生信起飞

Github Copilot免费使用啦

考上研上岸，学生信起飞

再也不嘲笑你了

2025想学生信，看这套教程就够了

小工具，大作用

2024学生信，看这套教程就够了

《AI在生物信息中应用》直播课程本周开课

快速升级bioconda

利用codespaces快速下载生物数据

多线程打包压缩数据，提高数据传输速度

2024学生信，看这套教程就够了

一分钟部署生物信息分析环境

学会生信，虽千万人吾往矣

如何使用AI来辅助生物信息分析？

学会生信，与1200万人竞争

安装生物软件新途径

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉