QIIME 2教程. 09數據導入Importing data(2020.2)

前情提要

  • NBT:QIIME 2可重複、交互式的微生物組分析平臺

  • 1簡介和安裝Introduction&Install

  • 2插件工作流程概述Workflow

  • 3老司機上路指南Experienced

  • 4人體各部位微生物組分析Moving Pictures,Genome Biology:人體各部位微生物組時間序列分析

  • 5糞菌移植分析練習FMT,Microbiome:糞菌移植改善自閉症

  • 6沙漠土壤分析Atacama soil,mSystems:乾旱對土壤微生物組的影響

  • 7帕金森小鼠教程Parkinson’s Mouse,Cell:腸道菌群促進帕金森發生ParkinsonDisease

  • 8差異丰度分析gneiss

QIIME 2用戶文檔. 9數據導入

Importing data

原文地址:https://docs.qiime2.org/2020.2/tutorials/importing/

為了使用QIIME 2,輸入數據必須存儲在<code>QIIME 2對象(即qza文件)/<code>中。這是實現支持分佈式和自動來源跟蹤、以及語義類型驗證和數據格式之間的轉換所必須(有關QIIME 2對象的更多詳細信息,請參閱《1簡介和安裝》中核心概念部分)。本教程演示如何將各種數據格式導入到QIIME 2對象中,以便使用QIIME 2開展分析。

注:本教程並沒有描述QIIME 2中當前支持的所有數據格式。這是一項正在進行的工作,描述了一些最常用的可用數據格式。我們還積極支持其他數據格式。如果您需要導入的數據格式不在這裡介紹,請發到QIIME 2論壇尋求幫助。

導入通常與初始化數據一起進行(例如,從測序儀獲取的原始序列),但也可以在分析流程的任何步驟中執行導入。例如,如果合作者向您提供<code>.biom/<code>格式的特徵表,您可以將其導入到QIIME 2對象中,以執行對特徵表進行操作的“下游”統計分析。

可以使用任何QIIME 2接口完成導入。本教程將重點介紹使用QIIME 2命令行界面(q2cli)使用<code>qiime tools import/<code>方法導入數據。下面的每一節簡要描述了一種數據格式,提供了下載示例數據的命令,並演示瞭如何將數據導入到QIIME 2對象中。

啟動工作環境並創建工作目錄

<code># 定義工作目錄變量,方便以後多次使用
wd=~/github/QIIME2ChineseManual/2020.2
mkdir -p $wd
# 進入工作目錄,是不是很簡介,這樣無論你在什麼位置就可以快速回到項目文件夾
cd $wd

# 方法1. 進入QIIME 2 conda工作環境
conda activate qiime2-2020.2
# 這時我們的命令行前面出現 (qiime2-2020.2) 表示成功進入工作環境

# 方法2. conda版本較老用戶,使用source進入QIIME 2
source activate qiime2-2020.2

# 方法3. 如果是docker安裝的請運行如下命令,默認加載當前目錄至/data目錄
docker run --rm -v $(pwd):/data --name=qiime -it qiime2/core:2020.2

# 創建本節學習目錄
mkdir qiime2-importing-tutorial
cd qiime2-importing-tutorial/<code>

導入帶質量值的FASTQ測序數據

Sequence data with sequence quality information (i.e. FASTQ)

使用QIIME 2,可以導入不同類型的fastq數據:

  • 採用地球微生物組計劃(EMP)標準方法產生的FASTQ格式數據

  • CASAVA 1.8多樣本混合格式的FASTQ數據

  • 任何其他類型的fastq數據

EMP標準混樣單端數據

“EMP protocol” multiplexed single-end fastq

此類數據標準包括兩個文件,擴展名均為<code>fastq.gz/<code>,

  1. 一個是barcode文件,

  2. 另一個是樣品混樣測序數據文件。

此部分的數據己經在《4人體各部位微生物組分析》中下載過,可直接鏈接過來,或使用如下命令下載

<code># 建樣品目錄
mkdir -p emp-single-end-sequences

# 方法1. 鏈接之前第4節中的文件
ln ../qiime2-moving-pictures-tutorial/emp-single-end-sequences/*.gz emp-single-end-sequences/

# 方法2. 從頭下載
# 下載 barcode文件
wget -c \\
-O "emp-single-end-sequences/barcodes.fastq.gz" \\
"https://data.qiime2.org/2019.7/tutorials/moving-pictures/emp-single-end-sequences/barcodes.fastq.gz"

# 下載序列文件
wget -c \\
-O "emp-single-end-sequences/sequences.fastq.gz" \\
"https://data.qiime2.org/2019.7/tutorials/moving-pictures/emp-single-end-sequences/sequences.fastq.gz"/<code>

導入EMP單端測序文件命令格式

<code># 25M,8s
time qiime tools import \\
--type EMPSingleEndSequences \\
--input-path emp-single-end-sequences \\
--output-path emp-single-end-sequences.qza/<code>

輸出對象:

  • <code>emp-single-end-sequences.qza/<code>:

    導入的EMP單端序列。

    查看 | 下載

EMP混樣雙端數據

“EMP protocol” multiplexed paired-end fastq

此類數據標準包括三個文件,擴展名均為<code>fastq.gz/<code>,

  1. 一個是<code>fastq.gz/<code>的正向序列文件;

  2. 一個是<code>fastq.gz/<code>的反向序列文件;

  3. 一個是barcode文件,與序列對應。

此部分的數據己經在 《6沙漠土壤分析Atacama soil》未更新 中下載過,可直接硬鏈過來,或使用如下命令下載

<code># 建樣品目錄
mkdir -p emp-paired-end-sequences

# 方法1. 鏈接之前第4節中的文件

ln ../qiime2-atacama-tutorial/emp-paired-end-sequences/*.gz emp-paired-end-sequences/

# 方法2. 從頭下載
# 下載序列正向和反向文件
wget -c \\
-O "emp-paired-end-sequences/forward.fastq.gz" \\
"https://data.qiime2.org/2020.2/tutorials/atacama-soils/1p/forward.fastq.gz"
wget -c \\
-O "emp-paired-end-sequences/reverse.fastq.gz" \\
"https://data.qiime2.org/2020.2/tutorials/atacama-soils/1p/reverse.fastq.gz"

# 下載barcode文件
wget -c \\
-O "emp-paired-end-sequences/barcodes.fastq.gz" \\
"https://data.qiime2.org/2020.2/tutorials/atacama-soils/1p/barcodes.fastq.gz"/<code>

導入EMP雙端序列為QIIME2對象

<code># 50M, 11s
time qiime tools import \\
--type EMPPairedEndSequences \\
--input-path emp-paired-end-sequences \\
--output-path emp-paired-end-sequences.qza/<code>

輸出對象:

  • <code>emp-paired-end-sequences.qza/<code>:

    導入的EMP單端序列。

    查看 | 下載

Casava1.8單端混樣數據

Casava 1.8 single-end demultiplexed fastq

格式描述

在Casava 1.8單樣本(單端)的格式中,有一個<code>fastq.gz/<code>文件的包含每個樣品的單端序列。樣品文件名包括標識符,看起來像<code>L2S357_15_L001_R1_001.fastq.gz/<code>。文件名中下劃線分隔的區域代表的意義如下:

  1. 在樣品編號;

  2. 標籤barcode序列或編號;

  3. lane編號;

  4. 序列方向(如僅有R1是由於單端序列)

  5. 子集編號。

下載並解壓示例數據

<code># 20M
wget -c \\
-O "casava-18-single-end-demultiplexed.zip" \\
"https://data.qiime2.org/2020.2/tutorials/importing/casava-18-single-end-demultiplexed.zip"

unzip -q casava-18-single-end-demultiplexed.zip/<code>

導入數據,因為樣品名包括在文件名中,可直接導入

<code># 20M, 6s
time qiime tools import \\
--type 'SampleData[SequencesWithQuality]' \\
--input-path casava-18-single-end-demultiplexed \\
--input-format CasavaOneEightSingleLanePerSampleDirFmt \\
--output-path demux-single-end.qza/<code>

輸出對象:

  • <code>demux-single-end.qza/<code>:

    導入的EMP單端序列。

    查看 | 下載

Casava 1.8雙端拆分後數據

Casava 1.8 paired-end demultiplexed fastq

格式同上面單端,只是每個樣本有一對文件。R1和R2代表正向和反向測序結果。

下載並解壓示例數據

<code># 9.3 M
wget -c \\
-O "casava-18-paired-end-demultiplexed.zip" \\
"https://data.qiime2.org/2020.2/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

unzip -q casava-18-paired-end-demultiplexed.zip/<code>

導入數據,因為樣品名包括在文件名中,可直接導入

<code># 9M, 6s
time qiime tools import \\
--type 'SampleData[PairedEndSequencesWithQuality]' \\
--input-path casava-18-paired-end-demultiplexed \\
--input-format CasavaOneEightSingleLanePerSampleDirFmt \\
--output-path demux-paired-end.qza/<code>

輸出對象:

  • <code>demux-paired-end.qza/<code>:

    導入的EMP單端序列。

    查看 | 下載

Fastq樣品文件清單格式

“Fastq manifest” formats

劃重點,這應該是普通用戶最常用的格式。而且導入方式也有更新,請以最新版為準

如果你不是EMP或CASAVA格式的數據,則需要先創建一個“清單文件(“manifest file)”,然後使用<code>qiime tools import/<code>命令,手動將數據導入到QIIME 2。

格式說明

首先,您將創建一個名為“清單文件”的文本文件,它將示例標識符映射到<code>fastq.gz/<code>或<code>fastq/<code>的絕對文件路徑(absolute filepaths)#Absolute_and_relative_paths),其中包含示例的序列和質量數據(即,這些是fastq文件)。清單文件還指示每個fastq.gz或fastq文件中的讀取方向。清單文件通常由您創建,它被設計為一種簡單的格式,不會拆分好的<code>fastq.gz/fastq/<code>文件的命名設置限制,因為這些文件沒有廣泛使用的命名約定。您可以隨意調用清單文件。同時,清單文件也是元數據格式兼容的,因此你可以清單文件作為樣本元數據(Sample Metadata)的起始。

清單文件是製表符分隔(即.tsv)的文本文件。每行的第一個字段是樣本名,第二個字段是絕對文件路徑,第三個字段可選的反應序列文件路徑。此格式與QIIME 2元數據格式]兼容。

<code>fastq.gz/<code>文件位置的絕對文件路徑可以包含環境變量(例如PWD)。下面的示例說明了一個簡單的fastq清單文件,用於兩個示例的雙端數據。

<code>sample-id forward-absolute-filepath reverse-absolute-filepath
sample-1 $PWD/some/filepath/sample0_R1.fastq.gz $PWD/some/filepath/sample1_R2.fastq.gz
sample-2 $PWD/some/filepath/sample2_R1.fastq.gz $PWD/some/filepath/sample2_R2.fastq.gz
sample-3 $PWD/some/filepath/sample3_R1.fastq.gz $PWD/some/filepath/sample3_R2.fastq.gz
sample-4 $PWD/some/filepath/sample4_R1.fastq.gz $PWD/some/filepath/sample4_R2.fastq.gz/<code>

在文件清單中,<code>fastq.gq/<code>文件絕對路徑必須準確,下面的示例說明了一個示例的fastq單端數據的清單文件。

<code>sample-id absolute-filepath
sample-1 $PWD/some/filepath/sample1_R1.fastq
sample-2 $PWD/some/filepath/sample2_R1.fastq/<code>

FastQ數據有四種常用格式變體,導入時必須將其指定為QIIME 2的類型。我們提供其中兩種導入的示例:<code>SingleEndFastqManifestPhred33V2/<code>和<code>PairedEndFastqManifestPhred64V2/<code>,因為他們是相似的

SingleEndFastqManifestPhred33V2

質量值33類型的單端數據

注:V2是為了區別於舊版csv清單文件格式的導入。建議以新教程為準,更合理。

在這個fastq清單格式的變體中,讀取方向必須都是正向或反向的。此格式假定用於所有<code>fastq.gz/fastq/<code>文件中位置質量分數的偏移量為33(注:質量值多為大寫字母)。

<code># 下載fastq單雙端樣本壓縮包zip文件,和文件清單文件mainfest
wget -c \\
-O "se-33.zip" \\
"https://data.qiime2.org/2020.2/tutorials/importing/se-33.zip"
wget -c \\
-O "se-33-manifest" \\
"https://data.qiime2.org/2020.2/tutorials/importing/se-33-manifest"

unzip -q se-33.zip/<code>

導入質量值不同編碼的兩類文件Phred33/64 (一般Phred33比較常見,只有非常老的數據才有Phred64格式或測序公司非正常設置的結果,建議轉換成了這個主流格式)

<code># 導入Phred33格式單端測序結果
qiime tools import \\
--type 'SampleData[SequencesWithQuality]' \\
--input-path se-33-manifest \\
--output-path single-end-demux.qza \\
--input-format SingleEndFastqManifestPhred33V2/<code>

輸出對象:

  • <code>single-end-demux.qza/<code>:

    導入標準fastq單端輸入文件。

    查看 | 下載

SingleEndFastqManifestPhred64V2

質量值64類型的單端數據

在這個fastq清單格式的變體中,讀取方向必須都是正向或反向的。此格式假定用於所有<code>fastq.gz/fastq/<code>文件中位置質量分數的分段偏移量為64。在導入過程中,QIIME 2會將phred 64編碼的質量分數轉換為phred 33編碼的質量分數。這種轉換將很慢,但只會發生一次(非主流,很多軟件如usearch都不支持,外部可以使用fastp、vsearch等程序轉換,QIIME2會自動轉換後再進行分析,查看文件質量值多為小寫字母的為64類型)。

PairedEndFastqManifestPhred33V2

質量值33類型的雙端數據,劃重點,此類型最為常用

在這種fastq文件清單格式的變體中,每個樣本ID必須有正向和反向讀取<code>fastq.gz/fastq/<code>文件。此格式假定用於所有<code>fastq.gz/fastq/<code>文件中位置質量分數的分段偏移量為33。

PairedEndFastqManifestPhred64V2

質量值64類型的雙端數據

在這種fastq文件清單格式的變體中,每個樣本ID必須有正向和反向讀取<code>fastq.gz/fastq/<code>文件。此格式假定用於所有<code>fastq.gz/fastq/<code>文件中位置質量分數的分段偏移量為64。在導入過程中,QIIME 2會將phred 64編碼的質量分數轉換為phred 33編碼的質量分數。這種轉換將很慢,但只會發生一次。

<code>wget -c \\
-O "pe-64.zip" \\
"https://data.qiime2.org/2020.2/tutorials/importing/pe-64.zip"
wget \\
-O "pe-64-manifest" \\
"https://data.qiime2.org/2020.2/tutorials/importing/pe-64-manifest"
unzip -q pe-64.zip

# 4s
time qiime tools import \\
--type 'SampleData[PairedEndSequencesWithQuality]' \\
--input-path pe-64-manifest \\

--output-path paired-end-demux.qza \\
--input-format PairedEndFastqManifestPhred64V2/<code>
  • <code>paired-end-demux.qza/<code>:

    導入標準fastq單端輸入文件。

    查看 | 下載

fasta格式序列

Sequences without quality information (i.e. FASTA)

QIIME 2目前支持導入QIIME 1 <code>seqs.fna/<code>文件格式,該格式由一個fasta文件組成,每條記錄只有兩行:<code>header/<code>和<code>sequence/<code>。每個序列必須正好一行,不能拆分多行。每條序列的ID必須遵循格式

在OTU聚類教程中可以找到導入和去冗餘此類數據的示例。

目前不支持其他fasta格式,如具有不同格式序列名的fasta文件或按樣本分離的fasta文件(即每個樣本一個fasta文件)。

代表性序列

Per-feature unaligned sequence data (i.e., representative FASTA sequences)

格式說明

未對齊的序列數據包含未對齊的DNA序列(即不包含-或.)的fasta格式文件)。序列可能包含未知的核苷酸特徵,如N,但某些QIIME 2功能不支持這類字符。有關fasta格式的更多信息,請參閱scikit bio fasta格式說明。

獲取示例數據

<code># 175 kb
wget -c \\
-O "sequences.fna" \\
"https://data.qiime2.org/2020.2/tutorials/importing/sequences.fna"/<code>

導入數據

<code># 5s
time qiime tools import \\
--input-path sequences.fna \\
--output-path sequences.qza \\
--type 'FeatureData[Sequence]'/<code>

輸出對象:

  • <code>sequences.qza/<code>:

    導入標準fastq單端輸入文件。

    查看 | 下載

對齊的fasta格式文件

Per-feature aligned sequence data (i.e., aligned representative FASTA sequences)

格式說明

對齊序列數據是從一個fasta格式的文件中導入的,該文件包含相互對齊的DNA序列。所有對齊序列的長度必須完全相同。序列可能包含未知的核苷酸特徵,如N,但某些QIIME 2功能不支持這類字符。有關fasta格式的更多信息,請參閱<code>scikit bio fasta/<code>格式說明。

獲取示例數據

<code>wget -c \\
-O "aligned-sequences.fna" \\
"https://data.qiime2.org/2020.2/tutorials/importing/aligned-sequences.fna"/<code>

可能有的人不瞭解對齊的fasta格式,如下:有<code>-/<code>字符,且等長

<code>>New.CleanUp.ReferenceOTU0 K3.H_3016
-CTGGACCGTGTCTCAGTT-CCAGTGTGGCTGATCATCCT---------CTCAGACCAGC
TACCGATCGTCGCC-TTGGTGGG-CTCTTA-CCC-C-GCCAACTAGCTAATCGGGCATCG
-G-CTCATTC-AATCGCGCAAGGTCCG-----AA----------------G-ATC-CCCT
>New.CleanUp.ReferenceOTU1 K3.Z_32919
-CTGGACCGTGTCTCAGTT-CCAGTGTGGCCGTTCATCCT---------CTCAGACCGGC
TACTGATCGTTGGT-TTGGTGGG-CCGTTA-CCC-C-ACCAACTGCCTAATCAGACGCAA
-A-CCCCTCT-TCAGGCGATAGCTTACAGGTAGAGGCTA-------------CCC-TTTC/<code>

導入數據

<code># 4s
time qiime tools import \\
--input-path aligned-sequences.fna \\
--output-path aligned-sequences.qza \\
--type 'FeatureData[AlignedSequence]'/<code>

輸出對象:

  • <code>aligned-sequences.qza/<code>:

    對齊的fasta序列。

    查看 | 下載

特徵表 Feature table data

你可以導入預處理的特徵進入QIIME 2分析

BIOM v1.0.0

關於BIOM格式說明,詳見 《BIOM:生物觀測矩陣——微生物組數據通用數據格式》,或BIOM v1.0.0 format specification英文格式說明。

下載數據並導入為QIIME2的qza格式

<code>wget -c \\
-O "feature-table-v100.biom" \\
"https://data.qiime2.org/2020.2/tutorials/importing/feature-table-v100.biom"

time qiime tools import \\
--input-path feature-table-v100.biom \\

--type 'FeatureTable[Frequency]' \\
--input-format BIOMV100Format \\
--output-path feature-table-1.qza/<code>

輸出對象:

  • <code>feature-table-1.qza/<code>:

    導入特徵表。

    查看 | 下載

BIOM v2.1.0

BIOM v2.1.0 格式詳細信息

<code>wget -c \\
-O "feature-table-v210.biom" \\
"https://data.qiime2.org/2020.2/tutorials/importing/feature-table-v210.biom"

time qiime tools import \\
--input-path feature-table-v210.biom \\
--type 'FeatureTable[Frequency]' \\
--input-format BIOMV210Format \\
--output-path feature-table-2.qza/<code>

輸出對象:

  • <code>feature-table-2.qza/<code>:

    導入的特徵表。

    查看 | 下載

系統發育樹

Phylogenetic trees

通常為newick格式。詳細說明見scikit-bio newick格式描述

<code>wget -c \\
-O "unrooted-tree.tre" \\
"https://data.qiime2.org/2020.2/tutorials/importing/unrooted-tree.tre"

time qiime tools import \\
--input-path unrooted-tree.tre \\
--output-path unrooted-tree.qza \\
--type 'Phylogeny[Unrooted]'/<code>

輸出對象:

  • <code>unrooted-tree.qza/<code>:

    導入的無根樹文件。

    查看 |

  • 下載

其它數據類型

Other data types

QIIME2支持多達58種數據格式,可用如下命令查看

<code>qiime tools import \\
--show-importable-formats/<code>

支持的68種格式如下:

  • AlignedDNAFASTAFormat

  • AlignedDNASequencesDirectoryFormat

  • AlphaDiversityDirectoryFormat

  • AlphaDiversityFormat

  • BIOMV100DirFmt

  • BIOMV100Format

  • BIOMV210DirFmt

  • BIOMV210Format

  • BooleanSeriesDirectoryFormat

  • BooleanSeriesFormat

  • CasavaOneEightLanelessPerSampleDirFmt

  • CasavaOneEightSingleLanePerSampleDirFmt

  • DADA2StatsDirFmt

  • DADA2StatsFormat

  • DNAFASTAFormat

  • DNASequencesDirectoryFormat

  • DeblurStatsDirFmt

  • DeblurStatsFmt

  • DifferentialDirectoryFormat

  • DifferentialFormat

  • DistanceMatrixDirectoryFormat

  • EMPPairedEndCasavaDirFmt

  • EMPPairedEndDirFmt

  • EMPSingleEndCasavaDirFmt

  • EMPSingleEndDirFmt

  • ErrorCorrectionDetailsDirFmt

  • FastqGzFormat

  • FirstDifferencesDirectoryFormat

  • FirstDifferencesFormat

  • HeaderlessTSVTaxonomyDirectoryFormat

  • HeaderlessTSVTaxonomyFormat

  • ImportanceDirectoryFormat

  • ImportanceFormat

  • LSMatFormat

  • MultiplexedPairedEndBarcodeInSequenceDirFmt

  • MultiplexedSingleEndBarcodeInSequenceDirFmt

  • NewickDirectoryFormat

  • NewickFormat

  • OrdinationDirectoryFormat

  • OrdinationFormat

  • PairedDNASequencesDirectoryFormat

  • PairedEndFastqManifestPhred33

  • PairedEndFastqManifestPhred33V2

  • PairedEndFastqManifestPhred64

  • PairedEndFastqManifestPhred64V2

  • PlacementsDirFmt

  • PlacementsFormat

  • PredictionsDirectoryFormat

  • PredictionsFormat

  • ProbabilitiesDirectoryFormat

  • ProbabilitiesFormat

  • QIIME1DemuxDirFmt

  • QIIME1DemuxFormat

  • QualityFilterStatsDirFmt

  • QualityFilterStatsFmt

  • SampleEstimatorDirFmt

  • SeppReferenceDirFmt

  • SingleEndFastqManifestPhred33

  • SingleEndFastqManifestPhred33V2

  • SingleEndFastqManifestPhred64

  • SingleEndFastqManifestPhred64V2

  • SingleLanePerSamplePairedEndFastqDirFmt

  • SingleLanePerSampleSingleEndFastqDirFmt

  • TSVTaxonomyDirectoryFormat

  • TSVTaxonomyFormat

  • TaxonomicClassiferTemporaryPickleDirFmt

  • UchimeStatsDirFmt

  • UchimeStatsFmt

可導入的文件類型有哪些呢?

<code>qiime tools import \\
--show-importable-types/<code>

也有多達41種:

  • DeblurStats

  • DistanceMatrix

  • EMPPairedEndSequences

  • EMPSingleEndSequences

  • ErrorCorrectionDetails

  • FeatureData[AlignedSequence]

  • FeatureData[Differential]

  • FeatureData[Importance]

  • FeatureData[PairedEndSequence]

  • FeatureData[Sequence]

  • FeatureData[Taxonomy]

  • FeatureTable[Balance]

  • FeatureTable[Composition]

  • FeatureTable[Frequency]

  • FeatureTable[PercentileNormalized]

  • FeatureTable[PresenceAbsence]

  • FeatureTable[RelativeFrequency]

  • Hierarchy

  • MultiplexedPairedEndBarcodeInSequence

  • MultiplexedSingleEndBarcodeInSequence

  • PCoAResults

  • Phylogeny[Rooted]

  • Phylogeny[Unrooted]

  • Placements

  • QualityFilterStats

  • RawSequences

  • SampleData[AlphaDiversity]

  • SampleData[BooleanSeries]

  • SampleData[ClassifierPredictions]

  • SampleData[DADA2Stats]

  • SampleData[FirstDifferences]

  • SampleData[JoinedSequencesWithQuality]

  • SampleData[PairedEndSequencesWithQuality]

  • SampleData[Probabilities]

  • SampleData[RegressorPredictions]

  • SampleData[SequencesWithQuality]

  • SampleData[Sequences]

  • SampleEstimator[Classifier]

  • SampleEstimator[Regressor]

  • TaxonomicClassifier

  • UchimeStats

不幸的是,目前沒有文檔詳細說明可以將哪些數據格式導入為哪種QIIME 2數據類型,但是希望這些格式和類型的名稱應該是不言自明的,足以弄清楚。如有任何疑問,請發佈至QIIME 2論壇尋求幫助!

https://docs.qiime2.org/2020.2/

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley,Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2.Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

譯者簡介


分享到:


相關文章: