偷偷问一下,关注了吗?
内容获取
1、购买打包合集(《KS科研分享与服务》付费内容打包集合),价格感人,可以加入微信VIP群(答疑交流群,甚至有小伙伴觉得群比代码更好),可以获取建号以来所有内容,群成员专享视频教程,提前更新,其他更多福利!
2、《KS科研分享与服务》公众号有QQ群,进入门槛是20元(完全是为了防止白嫖党,请理解),请考虑清楚。群里有免费推文的注释代码和示例数据(终身拥有),没有付费内容,群成员福利是购买单个付费内容半价!
需要者详情请联系作者(非需要者勿扰,处理太费时间):
这是一个新的系列,关于signac分析scATAC数据,我们从上游开始。我们之前在介绍ArchR的时候,介绍过cellranger-atac分析scATAC上游数据(ArchR包单细胞ATAC分析(1): 上游分析)。这里我们从公共数据库挖掘的角度,从上游分析开始,完成这个系列,关于ATAC的基本知识,请参考10X官网介绍或者其他!
1、ATAC简介:
2、ATAC-seq简单原理介绍:
3、公共数据库数据下载:
我选取的数据是这篇文章的:https://doi.org/10.1038/s41588-023-01445-4,这篇《nature genetics》文章很友好的公开了自己的数据,我选取了每个组一个样本,也就是总共三个样本用于演示,处理太多对我来说没什么意义。因为我的服务器空间并不大,而scATAC上游有很耗费磁盘空间,所以三个样本分开跑的。和其他挖掘SRR数据库一样,首先利用prefetch下载sra文件,然后利用fastq-dump将sra文件分为FASTQ文件,用cat将分割的文件合并,并按照cellranger要求进行命名:请注意,即使我提供了数据,也不要当作生物学样本去使用,仅仅是演示数据,意义不大!
1525 cat SRR_HC.txt
1526 cat SRR_HC.txt | while read id; do ( prefetch $id & ); done
1528 cd SRR21377796/
1529 fastq-dump -O ./ --gzip --split-files SRR21377796.sra
1530 cd ..
1531 cd SRR21377797/
1532 fastq-dump -O ./ --gzip --split-files SRR21377797.sra
1534 cd new_ATAC/SRR21377812/
1536 fastq-dump -O ./ --gzip --split-files SRR21377812.sra
1537 cd ..
1538 cd SRR21377813
1539 ls
1540 fastq-dump -O ./ --gzip --split-files SRR21377813.sra
1541 cd ..
1543 cat ./SRR21377796/SRR21377796_1.fastq.gz ./SRR21377797/SRR21377797_1.fastq.gz ./SRR21377812/SRR21377812_1.fastq.gz ./SRR21377813/SRR21377813_1.fastq.gz > AA_S1_L001_I1_001.fastq.gz
1544 cat ./SRR21377796/SRR21377796_2.fastq.gz ./SRR21377797/SRR21377797_2.fastq.gz ./SRR21377812/SRR21377812_2.fastq.gz ./SRR21377813/SRR21377813_2.fastq.gz > AA_S1_L001_R1_001.fastq.gz
1548 cat ./SRR21377796/SRR21377796_3.fastq.gz ./SRR21377797/SRR21377797_3.fastq.gz ./SRR21377812/SRR21377812_3.fastq.gz ./SRR21377813/SRR21377813_3.fastq.gz > AA_S1_L001_R2_001.fastq.gz
1549 cat ./SRR21377796/SRR21377796_4.fastq.gz ./SRR21377797/SRR21377797_4.fastq.gz ./SRR21377812/SRR21377812_4.fastq.gz ./SRR21377813/SRR21377813_4.fastq.gz > AA_S1_L001_R3_001.fastq.gz
1575 cat SRR_HC.txt | while read id; do ( prefetch $id & ); done
1576 cd new_ATAC/
1578 cd SRR213777880
1579 cd SRR21377780/
1580 cd new_ATAC/SRR21377780
1581 ls
1582 nohup fastq-dump -O ./ --gzip --split-files SRR21377780.sra &
1583 cd ..
1584 cd SRR21377781
1585 ls
1586 nohup fastq-dump -O ./ --gzip --split-files SRR21377781.sra &
1587 cd ..
1588 cd SRR21377782
1589 ls
1590 nohup fastq-dump -O ./ --gzip --split-files SRR21377782.sra &
1591 cd ..
1592 cd SRR21377783/
1593 nohup fastq-dump -O ./ --gzip --split-files SRR21377783.sra &
1594 cd ..
1595 cat ./SRR21377783/SRR21377783_1.fastq.gz ./SRR21377782/SRR21377782_1.fastq.gz ./SRR21377781/SRR21377781_1.fastq.gz ./SRR21377780/SRR21377780_1.fastq.gz > HC_S1_L001_I1_001.fastq.gz
1596 cat ./SRR21377783/SRR21377783_2.fastq.gz ./SRR21377782/SRR21377782_2.fastq.gz ./SRR21377781/SRR21377781_2.fastq.gz ./SRR21377780/SRR21377780_2.fastq.gz > HC_S1_L001_R1_001.fastq.gz
1597 cat ./SRR21377783/SRR21377783_3.fastq.gz ./SRR21377782/SRR21377782_3.fastq.gz ./SRR21377781/SRR21377781_3.fastq.gz ./SRR21377780/SRR21377780_3.fastq.gz > HC_S1_L001_R2_001.fastq.gz
1598 cat ./SRR21377783/SRR21377783_4.fastq.gz ./SRR21377782/SRR21377782_4.fastq.gz ./SRR21377781/SRR21377781_4.fastq.gz ./SRR21377780/SRR21377780_4.fastq.gz > HC_S1_L001_R3_001.fastq.gz
1602 cd new_ATAC/
1603 tail -f nohup.out
1604 cat SRR_SD.txt | while read id; do ( prefetch $id & ); done
1605 conda activate cellranger
1606 cd SRR21377814
1607 nohup fastq-dump -O ./ --gzip --split-files SRR21377814.sra &
1608 cd ..
1609 cd SRR21377815/
1610 nohup fastq-dump -O ./ --gzip --split-files SRR21377815.sra &
1611 cd ..
1612 cd SRR21377816/
1613 nohup fastq-dump -O ./ --gzip --split-files SRR21377816.sra &
1614 cd ..
1615 cd SRR21377817/
1616 nohup fastq-dump -O ./ --gzip --split-files SRR21377817.sra &
1617 cd ..
1618 ls
1619 cat ./SRR21377814/SRR21377814_1.fastq.gz ./SRR21377815/SRR21377815_1.fastq.gz ./SRR21377816/SRR21377816_1.fastq.gz ./SRR21377817/SRR21377817_1.fastq.gz > SD_S1_L001_I1_001.fastq.gz
1620 cat ./SRR21377814/SRR21377814_2.fastq.gz ./SRR21377815/SRR21377815_2.fastq.gz ./SRR21377816/SRR21377816_2.fastq.gz ./SRR21377817/SRR21377817_2.fastq.gz > SD_S1_L001_R1_001.fastq.gz
1621 cat ./SRR21377814/SRR21377814_3.fastq.gz ./SRR21377815/SRR21377815_3.fastq.gz ./SRR21377816/SRR21377816_3.fastq.gz ./SRR21377817/SRR21377817_3.fastq.gz > SD_S1_L001_R2_001.fastq.gz
1622 cat ./SRR21377814/SRR21377814_4.fastq.gz ./SRR21377815/SRR21377815_4.fastq.gz ./SRR21377816/SRR21377816_4.fastq.gz ./SRR21377817/SRR21377817_4.fastq.gz > SD_S1_L001_R3_001.fastq.gz
4、安装cellranger-atac,下载参考基因组:
wget -O cellranger-atac-2.1.0.tar.gz \
"https://cf.10xgenomics.com/releases/cell-atac/cellranger-atac-2.1.0.tar.gz?Expires=1676294517&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1hdGFjL2NlbGxyYW5nZXItYXRhYy0yLjEuMC50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2NzYyOTQ1MTd9fX1dfQ__&Signature=CX4JhovsMLEXYDYPY2GEVv0SaLg3X-KOUBQ-S52aciWgpd996iHomsnN7gulQaws59GywBLaCjwf7mrxGit8Fs6kKJ1IkTbdxVmDKAg9DMFfJ5BwRIck9NX8eeLyBEpDAS6t~WGbfkCViforbugd1tNbBgJRcRN8pIrCnai9GmqZQzzKTbkllArlj3AxKDkPgNin9g6H5cg8D8PcZfFfeu7jdm5rKFdBNtVn1Et45QDQmNoJxuXRngyC5cBKbICUlOmhqE6tOMjuJEBqijVqaLnTSrRRzvyu-rEEuNIdGuIYPwWZQ5RoDh4g0X-ZO60h4RZu3ZoRlEDlsQOlSrJ68w__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
#安装软件
#首先解压
tar -xzvf cellranger-atac-2.1.0.tar.gz
#添加到环境变量
echo 'export PATH=/home/biosoft/cellranger-atac-2.1.0:$PATH' >>~/.bashrc source ~/.bashrc
#查看下帮助文档,是不是安装好了
#ATAC参考基因组下载
wget https://cf.10xgenomics.com/supp/cell-atac/refdata-cellranger-arc-GRCh38-2020-A-2.0.0.tar.gz
tar -zxvf refdata-cellranger-arc-GRCh38-2020-A-2.0.0.tar.gz
5、run cellranger-atac count
nohup cellranger-atac count --id=SRR_AA --reference=/home/aaa/biosoft/refdata-cellranger-arc-GRCh38-2020-A-2.0.0 --fastqs=./ &
nohup cellranger-atac count --id=SRR_HC --reference=/home/aaa/biosoft/refdata-cellranger-arc-GRCh38-2020-A-2.0.0 --fastqs=./ &
nohup cellranger-atac count --id=SRR_SD --reference=/home/aaa/biosoft/refdata-cellranger-arc-GRCh38-2020-A-2.0.0 --fastqs=./ &
6、output
关注我们获取精彩内容:
关注不迷路:扫描下面二维码关注公众号!
B站视频号链接:https://space.bilibili.com/471040659?spm_id_from=333.1007.0.0
关注 KS科研分享与服务,
认清正版优质内容和服务!
优质内容持续输出,物超所值!
合作联系:ks_account@163.com