ggplot2版聚类物种丰度堆叠图_ _ 頭條網

写在前面

随着研究的逐渐深入，我们对绘图的要求越来越高，各种之前使用的较少的图形如今追求热度和新颖程度，都开始逐渐在大文章中显现。如下图。

这是最近刚发表于Nature Ecology & Evolution中的图1b。如何绘制呢？

Thorsten Thiergart, Paloma Durán, Thomas Ellis, Nathan Vannier, Ruben Garrido-Oter, Eric Kemen, Fabrice Roux, Carlos Alonso-Blanco, Jon Ågren, Paul Schulze-Lefert & Stéphane Hacquard. Root microbiota assembly and adaptive differentiation among European Arabidopsis populations. Nature Ecology & Evolution4, 122-131, doi:10.1038/s41559-019-1063-3 (2020).

这次的聚类加物种丰度展示让我们学习一波。之前推出了用R语言的plot绘制的教程。

R语言绘制带聚类树的堆叠柱形图

但修改细节仍比较麻烦。今天更新基于ggplot2系统的教程。

加载依赖关系

这里的ggtree需要使用19年7月以后的版本，因为这以后的版本才支持将聚类结果转化为树结构。

如果你的Bioconductor版本较旧，可能一直会安装旧版ggtree。升新方法如下：

<code>## 先卸载先前的安装控制程序
remove.packages(c(

"BiocInstaller"

"BiocManager"

"BiocVersion"

))

## 再安装新版程序
install.packages(

"BiocManager"

)
BiocManager::install(update=

TRUE

, ask=

FALSE

)/<code>

<code>library(

"ggplot2"

)
library(

"ggdendro"

)
# library(remotes)
library(phyloseq)
library(tidyverse)
library(ggtree)
library( ggstance)
# library(amplicon)
vegan_otu =

function

(physeq)

{
OTU = otu_table(physeq)

(taxa_are_rows(OTU)){
OTU = t(OTU)
}

return

(as(OTU,

"matrix"

))
}

vegan_tax

function

(physeq)

{
tax

return

(as(tax,

"matrix"

))
}/<code>

导入数据

<code># 从R数据文件中读入
# ps = readRDS(

"data/ps_liu.rds"

)

# 从文件读取
metadata =

read

table

(

"http://210.75.224.110/github/EasyAmplicon/data/metadata.tsv"

, header=T, row.names=

, sep=

"\t"

, comment.

char

, stringsAsFactors = F)
otutab =

read

table

(

"http://210.75.224.110/github/EasyAmplicon/data/otutab.txt"

, header=T, row.names=

, sep=

"\t"

, comment.

char

, stringsAsFactors = F)
taxonomy =

read

table

(

"http://210.75.224.110/github/EasyAmplicon/data/taxonomy.txt"

, header=T, row.names=

, sep=

"\t"

, comment.

char

, stringsAsFactors = F)

# 提取两个表中共有的ID
# Extract only those ID

common between the two tables
idx = rownames(otutab) %

% rownames(taxonomy)
otutab = otutab[idx,]
taxonomy = taxonomy[rownames(otutab),]

# 使用amplicon包内置数据
# data(

"metadata"

)
# data(otutab)

# 导入phyloseq(ps)对象
ps = phyloseq(sample_data(metadata),otu_table(as.matrix(otutab), taxa_are_rows=TRUE), tax_table(as.matrix(taxonomy)))/<code>

ggtree绘制聚类树

<code># 样本间距离类型：Bray-Curtis
dist =

"bray"

# phyloseq(ps)对象标准化
ps1_rela = transform_sample_counts(ps, function(x) x / sum(x) )
# 导出OTU表
otu =

data

.frame(t(vegan_otu(ps1_rela)))
# 预览
otu[

]
#计算距离矩阵
unif = phyloseq::distance(ps1_rela , method=dist)
# 聚类树，method默认为complete
hc "complete")
# 对树分组
clus 3)
# 提取树中分组的标签和分组编号
d =

data

.frame(label = names(clus),
member = factor(clus))
# 提取样本元数据
map =

data

.frame(sample_data(ps))
# 合并树信息到样本元数据
dd = merge(d,map,

"row.names"

,all = F)
row.names(dd) = dd$Row.names
dd$Row.names =
dd[

]

# ggtree绘图 #----
p = ggtree(hc) %geom_tippoint(size=

, shape=

, aes(fill=factor(Group), x=x)) +
# geom_tiplab(aes(label=Group), size=

, hjust=.

) +
geom_tiplab(aes(color = Group,x=x*

1.2

), hjust=

)
# theme_dendrogram(plot.margin=margin(

))# 这是聚类图形的layout
p/<code>

物种组成数据

<code># 指定物种组成的选项
i = ps # 指定输入数据
j =

"Phylum"

# 使用门水平绘制丰度图表

rep

# 重复数量是

个
Top =

# 提取丰度前十的物种注释
tran = TRUE # 转化为相对丰度值/<code>

<code># 按照分类学门(j)合并
psdata = i %>% tax_glom(taxrank = j)

# 转化丰度值

(tran ==

TRUE

) {
psdata = psdata%>% transform_sample_counts(function(x) {x/sum(x)} )
}

#--提取otu和物种注释表格
otu = otu_table(psdata)
tax = tax_table(psdata)
tax[

]

#--按照指定的Top数量进行筛选与合并

for

:dim(tax)[

]) {

(row.names(tax)[i] %

% names(sort(rowSums(otu), decreasing =

TRUE

)[

:Top])) {
tax[i,j] =tax[i,j]
}

else

{
tax[i,j]=

"Other"

}
}
tax_table(psdata)= tax

##转化为表格
Taxonomies % psmelt

/<code>

整理成facet需要的格式

这里的格式也很简单，就是需要一列“id”，这里我们将样本名修改为id，即可

<code>

colnames(Taxonomies)[1] =

"id"

Taxonomies

$OTU

colnames(Taxonomies)[1] =

"id"

/<code>

保证颜色填充独立性

因为我们颜色填充有好几种方式，所以需要对每种颜色填充保重独立性，使用ggnewscale。

<code>library(ggnewscale)
p p/<code>

分面组合树和柱图

<code>p3

facet_plot

(

panel

'Stacked Barplot'

data

Taxonomies,

geom

geom_barh,mapping

aes(x

Abundance,

fill

as.factor(Phylum)),color

"black"

stat

'identity'

)

/<code>

修改配色

<code>

colbar

select(Taxonomies, one_of(j))))[

]
colors = colorRampPalette(c(

"#CBD588"

"#599861"

"orange"

"#DA5724"

"#508578"

"#CD9BCD"

"#AD6F3B"

"#673770"

"#D14285"

"#652926"

"#C84248"

"#8569D5"

"#5E738F"

"#D1A33D"

"#8A7C64"

"black"

))(colbar)
p3 + scale_fill_manual(values = colors)/<code>

ggtree调整布局

修改layout，设置中空等。

<code>p = ggtree(hc,layout=

"fan"

, branch.length =

"none"

, ladderize = FALSE) %

geom_tippoint

(

size

shape

21,

aes

(

fill

factor(Group),

x))

geom_tiplab

(

aes

(

color

Group,x

x*1.2),

hjust

xlim

(

-4

)

/<code>

添加样本其他信息

如添加样品测序量柱状图、数值标签

<code>

p/<code>

<code>head(dd)
dd$sequencenum = sample_sums(ps)
dd
data = data.frame(id = row.names(dd),sequencenum = dd$sequencenum )
head(data)
# p3
#---------添加序列
p2

facet_plot

(

panel

'Number Barplot'

data

geom

geom_barh,mapping

aes(x

sequencenum

fill

Group),stat

'identity'

)

/<code>

<code>facet_plot(p2, panel=

'Stacked Barplot'

data

=dd, geom=geom_text, mapping=aes(x=sequencenum+

, label=sequencenum))/<code>

树+柱+堆叠图组合

<code>p3

facet_plot

(

panel

'Abundance Barplot'

data

Taxonomies,

geom

geom_barh,mapping

aes(x

Abundance,

fill

as.factor(Phylum)),color

"black"

stat

'identity'

)

/<code>

撰文：五谷杂粮

责编：刘永鑫中科院遗传发育所

10000+：菌群分析宝宝与猫狗梅毒狂想曲提DNA发Nature Cell专刊肠道指挥大脑

系列教程：微生物组入门 Biostar 微生物组宏基因组

专业技能：学术图表高分文章生信宝典不可或缺的人

写在前面

加载依赖关系

导入数据

ggtree绘制聚类树

物种组成数据

整理成facet需要的格式

保证颜色填充独立性

分面组合树和柱图

修改配色

ggtree调整布局

添加样本其他信息

树+柱+堆叠图组合

相關文章:

美国费城，遗体被堆放在皮卡上等待收尸，死者的尊严未得到保护

东莞明玮:时隔两年再出新品，明玮悍将450重磅直击瓦线行业痛点！

CNS级别的科研插图是怎么画出来的？他们都私藏了这些软件...

铠侠看淡3D XPoint前景，闪存仍将长期主导

豪森股份科创板上市受理 氢燃料电池设备营收1452万元

继长江存储之后！三星研制超160层V-NAND快闪存储器

使用堆叠柱形图完成颜色固定，分类堆叠并自定义提示信息

新颖别致的积墨山水，龚贤的画作，如何展现艺术美？

是绘画还是摄影？这些图片里的天空太惊艳了！

比卫衣时髦，比毛衣显瘦，穿烟管领的你，美得真高级

射频和微波器件及模块封装技术介绍

美国费城，遗体被堆放在皮卡上，死者尊严受辱引众议

第二次世界大战直刀（多图）

如何拍摄出惊艳的微距作品，使用这些技巧，让花朵在水滴里盛开

电子行业资讯早报2020.4.15

隈研吾新作‘OMM现代博物馆’，‘堆叠木盒’建成

堆积的叶片

清凉夏日，从衣橱“断舍离”开始

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

#战疫必胜#“症和状”都有了，我与新冠擦肩而过

T1提议中韩友谊赛，但LPL队伍都不想参加？理由其实很简单

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳

2020最佳韩剧追起来~《爱的迫降》仅排名第二，TOP 1绝对实至名归

搞笑GIF开心一刻：我正在睡觉，谁敢打扰我

备考消防的几大错觉，你有这个情况吗？

“顶流”李敏镐哑火，渣男出轨剧出圈，韩剧观众也长大了？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

应急科普丨“五一” 期间气温回升 谨防森林火灾隐患

搞笑GIF开心一刻：拍照啦，赶紧看镜头

工程发承包、工程造价条款，或迎来大调整

豪森股份科创板上市受理氢燃料电池设备营收1452万元

应急科普丨“五一” 期间气温回升谨防森林火灾隐患