今年8月中旬,小锐与大家分享了2018年春夏期间,锐翌基因与合作伙伴发表SCI文章19篇,累计影响因子高达78.004
今天,小锐又要和大家分享一个好消息,锐翌新文再添一笔,我们的综述性文章《人体肠道宏基因组生物信息分析方法》发表于2018年第11期《微生物学报》杂志上(DOI:10.13343/j.cnki.wsxb.20180110),文中分享了我们在宏基因组分析方面积累的经验及对未来的展望,为生信分析的小伙伴们贡献一份饱满的干货!
微生物学报
《微生物学报》创刊于1953年,是由中国科学院微生物研究所、中国微生物学会主办的,以微生物学和应用基础研究以及高技术创新为主的综合性学术刊物,反映微生物学研究领域中最新成果,促进国内外学术交流。
《微生物学报》是我国微生物学领域综合性学报级期刊和国家自然科学核心期刊。 被国内外一些著名的文摘刊物和数据库收录,是我国最早被世界最大医学文献数据库“ MEDLARS”作为医学主题词标引的五个中文期刊之一,该刊发行和交换到40多个国家和地区。多次被评为优秀科技期刊,深受国内外广大读者的好评。
![]() |
我们的文章
![]() |
接下来,小锐给大家简单介绍一下《人体肠道宏基因组生物信息分析方法》的内容(等不及想要细啃干货的小伙伴可戳文末“阅读原文”),该综述由上海锐翌生物科技有限公司郑智俊、黄云、秦楠撰写,全面系统地概括了宏基因组生物信息常规分析方法和常用分析软件,包括:
♥宏基因组物种注释数据库和序列比对软件,如NCBI、HMP、GOLD等数据库和SOAP、BWA和bowtie等软件。
♥肠型的分类方法与可视化操作方法;流行的肠型的计算方法有两种,一种是基于样品间的 Jensen-Shannon距离,利用围绕中心点划分算法(PAM)进行聚类,或是直接基于物种丰度,利用狄利克雷多项混合模型(DMM)进行肠型分类,可视化主要是使用 R 软件的‘ade4’包的类间分析、主成分分析或主坐标分析进行操作。
![]() |
肠型示意图
♥样本多样性分析,包括分别描述单个样本和样本间差异的阿尔法多样性与贝塔多样性分析,常用分析方法分别是Shannon-Wiener 指数、系统发育多样性全树分析、Simpson 指数和Bray-Curtis 测量方法、加权/未加权的 UniFrac方法。
♥宏基因组组装与基因集构建,常用基因预测软件有MetaGeneMark,Glimmer-MG,MetaGene等。
♥差异基因分析,包括Wilcoxon 秩和检验、 Mann-Whitney U 检验和 Wilcoxon signed-rank检验等。
♥物种丰度计算,目前有两种较为常用的计算物种多样性的方法,一种是将测序所得到的宏基因组序列与全基因组序列进行比对,经计算后得到物种丰度表,另一种是用 MetaPhlAn2或 mOTU软件将测序得到的宏基因组序列比对到标记序列
♥宏基因组功能分析的主要参考数据库,包括包括京都基因与基因组百科全书 (KEGG)数据库、EggNOG 数据库、GO 数据库等。
♥基因之间的关联分析方法如斯皮尔曼等级相关系数和皮尔逊相关系数。
♥MGS和CAG分析,当样品数量足够多时,应用这两种分析方法可以找到一些新物种。
♥医学分类器,利用markers标记物可以构建疾病监测和诊断模型,分类常用算法包括Logistictic 回归、 Support Vector Machine(SVM)、 Random Forest、人工神经网络、朴素贝叶斯等,分类评价指标主要包括准确率、错误率、灵敏度、特异度、精度、MCC、 ROC等。