余光创团队在The Innovation上发表微生物组数据分析新工具成果

发布时间:2023-06-30 浏览次数:

近日,余光创团队在The Innovation(IF=32.1)上以article形式发表了题为:MicrobiotaProcess: A comprehensive R package for deep mining microbiome的研究成果,南方医科大学珠江医院徐双斌博士后为本文第一作者,基础医学院余光创教授为本文独立通讯作者。

微生物组学研究已经成为了肠道、土壤与海洋等环境微生物研究的常用方法。下游数据探索分析是其关键步骤之一。然而,微生物组学数据经上游生信分析产生多种不同格式的文件,且下游数据分析复杂,常需使用不同编程语言的平台或者不同使用语法的软件。仍缺乏灵活、全面、可使用统一且用户友好的语法来简化微生物组学的下游分析,这些问题极大阻碍了微生物组的可重复分析。

针对这些基础性问题,余光创课题组开发了MicrobiotaProcess软件包。其团队开发的MicrobiotaProcess中定义了MPSE数据结构。该数据结构有效整合了微生物学的多种不同格式数据,同时也可整合下游分析结果,以及外部相关数据。该数据结构提高了对微生物组数据的有效管理,可促进微生物组研究领域的交流共享与可重复分析。在此基础上,该软件基于tidy framework开发了一系列微生物组学分析功能模块,以方便用户自由高效可重复地探索微生物组学数据析。基于这样的设计模式,MicrobiotaProcess可与R中的tidyverse计算生态以及Bioconductor平台的SummarizedExperiment计算生态进行互通,进一步拓展该软件的应用。与此同时,基于团队之前发表的ggtree,ggtreeExtra,treeio等工作,MicrobiotaProcess提供了多种可视化方法,方便用户快速呈现不同数据整合的清晰、有意义的可视化结果,进而为相关的生物学问题探索提供帮助。因此,该软件的开发将可有效促进了微生物组学数据的管理与可重复分析,为学科发展提供了高效互通的计算生态。


附图 MicrobiotaProcess的功能模块以及其与R计算生态的互通性示意图


全文链接:https://doi.org/10.1016/j.xinn.2023.100388