大家好,欢迎来到IT知识分享网。
激活qiime2的执行环境:source activate qiime2-2019.4
如何查看conda已有的环境:conda info -e
以下分析流程参考:https://docs.qiime2.org/2019.4/tutorials/qiime2-for-experienced-microbiome-researchers/
1、数据准备
现在我们常用的就是这种格式的数据,每个样品一对数据文件
数据来源:https://docs.qiime2.org/2019.7/tutorials/importing/
wget \ -O "casava-18-paired-end-demultiplexed.zip" \ "https://data.qiime2.org/2019.4/tutorials/importing/casava-18-paired-end-demultiplexed.zip"
下载解压后,文件夹中文件如下:
2、将数据转换为qza格式(qiime新定义的自己的格式类型,有点编程中对象的含义)
qiime tools import \ --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path casava-18-paired-end-demultiplexed \ --input-format CasavaOneEightSingleLanePerSampleDirFmt \ --output-path demux-paired-end.qza
3、查看数据质量
qiime demux summarize --i-data demux-paired-end.qza --o-visualization demux-summary-1.qzv
用以下命令查看结果:
qiime tools view demux-summary-1.qzv
4、双端序列合并成单端
qiime vsearch join-pairs –i-demultiplexed-seqs demux-paired-end.qza –o-joined-sequences demux-joinded.qza
5、查看对merge后的数据质量情况
qiime demux summarize –i-data demux-joinded.qza –o-visualization demux-summary-merged.qzv
qiime tools view demux-summary-merged.qzv
##### 以下是使用dada2进行数据去噪,本教程先跳过该步,之后有专门教程介绍dada2使用
4、对数据进行剪切
双端:
qiime dada2 denoise-paired \ --i-demultiplexed-seqs demux-paired-end.qza \ --p-trim-left-f 13 \ --p-trim-left-r 13 \ --p-trunc-len-f 150 \ --p-trunc-len-r 150 \ --o-table table.qza \ --o-representative-sequences rep-seqs.qza \ --o-denoising-stats denoising-stats.qza
单端:
qiime dada2 denoise-single \
--i-demultiplexed-seqs demux-joinded.qza \ #输入应该也是序列,不能是joined对象 --p-trim-left 13 \ --p-trunc-len 150 \ --o-table table.qza \ --o-representative-sequences rep-seqs-merged.qza \ --o-denoising-stats denoising-stats-merged.qza
https://forum.qiime2.org/t/demultiplexing-and-trimming-adapters-from-reads-with-q2-cutadapt/2313
以下参考:
https://blog.csdn.net/woodcorpse/article/details/86685524
https://mp.weixin.qq.com/s/6cLzyJjWQmHm82_U6euJ1g
5、序列质控
qiime quality-filter q-score-joined \
–i-demux demux-joinded.qza \
–o-filtered-sequences demux-joined-filtered.qza \
–o-filter-stats demux-joined-filter-stats.qza
输出结果:
- demux-joined-filter-stats.qza: 统计结果
- demux-joined-filtered.qza: 数据过滤后结果
6、用deblur去冗余,并生成特征表(相当于QIIME1的OTU Table)
qiime deblur denoise-16S \
–i-demultiplexed-seqs demux-joined-filtered.qza \
–p-trim-length 250 \
–p-sample-stats \
–o-representative-sequences rep-seqs.qza \
–o-table table.qza \
–o-stats deblur-stats.qza
输出结果:
- rep-seqs.qza: 代表序列
- deblur-stats.qza: 统计过程
- table.qza: 特征表
备注:
由于DADA2和Deblur产生的“OTU”是通过对唯一序列进行分组而创建的,因此这些OTU相当于来自QIIME 1的100%相似度的OTU,通常称为序列变体。在QIIME 2中,这些OTU比QIIME 1默认的97%相似度聚类的OTU具有更高的分辨率,并且它们具有更高的质量,因为这些质量控制步骤比QIIME 1中实现更好。因此,与QIIME 1相比,可以对样本的多样性和分类组成进行更准确的估计。
7、查看deblur去冗余后的特征表
qiime feature-table summarize \
–i-table table.qza \
–o-visualization table.qzv
–m-sample-metadata-file sample-metadata.tsv
qiime feature-table tabulate-seqs \
–i-data rep-seqs.qza \
–o-visualization rep-seqs.qzv
qiime tools view table.qzv
8、统计每个样品包含的序列数
qiime deblur visualize-stats \
–i-deblur-stats deblur-stats.qza \
–o-visualization deblur-stats.qzv
qiime tools view deblur-stats.qzv
9、构建进化树用于多样性分析
qiime phylogeny align-to-tree-mafft-fasttree \
–i-sequences rep-seqs.qza \
–o-alignment aligned-rep-seqs.qza \
–o-masked-alignment masked-aligned-rep-seqs.qza \
–o-tree unrooted-tree.qza \
–o-rooted-tree rooted-tree.qza
10、需要先准备一个metadata文件,文件说明参考:https://docs.qiime2.org/2019.7/tutorials/metadata/
11、计算核心多样性
qiime diversity core-metrics-phylogenetic \
–i-phylogeny rooted-tree.qza \
–i-table table.qza \
—p-sampling-depth 500 \
–m-metadata-file sample-metadata.tsv \
–output-dir core-metrics-results
分析结果包含:
-
α多样性
-
香农(Shannon’s)多样性指数(群落丰富度的定量度量,即包括丰富度
richness
和均匀度evenness
两个层面) -
Observed OTUs(群落丰富度的定性度量,只包括丰富度)
-
Faith’s系统发育多样性(包含特征之间的系统发育关系的群落丰富度的定性度量)
-
均匀度(或 Pielou’s均匀度;群落均匀度的度量)
-
β多样性
-
Jaccard距离(群落差异的定性度量,即只考虑种类,不考虑丰度)
-
Bray-Curtis距离(群落差异的定量度量)
-
非加权UniFrac距离(包含特征之间的系统发育关系的群落差异定性度量)
-
加权UniFrac距离(包含特征之间的系统发育关系的群落差异定量度量)
β多样性分析结果-PCoA:
12、Alpha多样性组间显著性分析和可视化
qiime diversity alpha-group-significance \
–i-alpha-diversity core-metrics-results/faith_pd_vector.qza \
–m-metadata-file sample-metadata.tsv \
–o-visualization core-metrics-results/faith-pd-group-significance.qzv
qiime diversity alpha-group-significance \
–i-alpha-diversity core-metrics-results/evenness_vector.qza \
–m-metadata-file sample-metadata.tsv \
–o-visualization core-metrics-results/evenness-group-significance.qzv
13、绘制稀疏曲线
qiime diversity alpha-rarefaction \
–i-table table.qza \
–i-phylogeny rooted-tree.qza \
—p-max-depth 1000 \
–m-metadata-file sample-metadata.tsv \
–o-visualization alpha-rarefaction.qzv
--p-max-depth
参数的值应该通过查看上面创建的table.qzv
文件中呈现的“每个样本的测序量”信息来确定。一般来说,选择一个在中位数附近的值似乎很好用。
14、物种组成分析
下载物种注释数据库制作的分类器:
wget \
-O “gg-13-8-99-515-806-nb-classifier.qza” \
“https://data.qiime2.org/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza”
物种注释和可视化
qiime feature-classifier classify-sklearn \
–i-classifier gg-13-8-99-515-806-nb-classifier.qza \
–i-reads rep-seqs.qza \
–o-classification taxonomy.qza
qiime metadata tabulate \
–m-input-file taxonomy.qza \
–o-visualization taxonomy.qzv
生成物种组成柱状图:
qiime taxa barplot \
–i-table table.qza \
–i-taxonomy taxonomy.qza \
–m-metadata-file sample-metadata.tsv \
–o-visualization taxa-bar-plots.qzv
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/28259.html