2018-04-16浏览量:569

多重关联分析工具HallA

HallA(Hierarchical All-against-All association)是一个分析多维度、异质性数据的多重关联分析工具,在微生物研究中,它是可用于转录组与宏基因组关联分析的一个重要工具。今天我们就来具体学习下这款软件的使用方法。

1. 安装HallA软件  

1.1 依赖的软件

① Python (version >= 2.7)

② Numpy (>= 1.9.2)

③ SciPy (>= 0.17.1)

④ Scikit-learn (>=0.14.1)

⑤ MinePy (>=1.1.0)

⑥ Pandas (>=0.18.1)

⑦ Matplotlib (>= 1.5.1)

1.2 安装

 Step 1: 下载 HallA软件并解压

(下载地址:https://bitbucket.org/biobakery/halla/get/default.tar.gz)

 tar xzvf biobakery-halla-<versionid>.tar.gz

cd biobakery-halla-<versionid>/

 Step 2: 安装HAllA:

python setup.py install

Step 3:安装HallA依赖软件

安装1.1中依赖的软件并添加到环境变量中。

 2. 运行HallA软件  

2.1 数据来源

本测试的数据源自公开发表数据库 (Morgan et al., Genome Biology 2015) 子集,主要包括两部分:1)人类肠道微生物(64 taxa)的16S rRNA扩增子序列,2)Affymetrix微矩阵的204个溃疡性结肠炎患者的结肠RNA表达基因(100 genes)。本研究的目的是探索人类基因和微生物分类与回肠切除术后的炎症复发的联系。

下载配对的两个数据集,分别是:

otu_299.txt 

(https://bitbucket.org/biobakery/biobakery/raw/tip/demos/biobakery_demos/data/halla/input/otu_299.txt)

gene_200.txt

 (https://bitbucket.org/biobakery/biobakery/raw/tip/demos/biobakery_demos/data/halla/input/gene_200.txt)

 2.2 运行HallA

halla -X otu_299.txt -Y gene_200.txt -o pouchitis_output -m spearman --header -q 0.05

参数说明:

-X ,-Y 输入文件,

-o 输出文件夹,

-m 选择检测方式(spearman :Spearman's rank correlation斯皮尔曼等级相关系数,Normalized Mutual Information (NMI)归一化信息),

--header使用两个数据集的头来查找常见列(样本)并重新排序,

-q FDR值

输出文件主要有三个:

  • associations.txt:描述不同集群之间的关联;

  • similarity_table.txt:第一个数据集与第二个数据集中成对特征的相似性得分;

  • hypotheses_tree.txt:包含了在HAllA运行期间执行的所有测试的全面报告。

 3. HAllA 结果的可视化

Hallagram是HAllA中把三个输出文件可视化的工具,其具体使用方法可使用hallagram –h查询参数帮助;

、cd synthetic_output

hallagram similarity_table.txt hypotheses_tree.txt associations.txt --outfile hallagram.png

结果如图所示:

同时可以用hallagram修改参数,使图形更加美观:

cd pouchitis_output

hallagram similarity_table.txt hypotheses_tree.txt associations.txt --outfile hallagram.pdf --outfile hallagram.png --similarity Spearman --axlabels "Microbial OTUs" "Host transcripts" --strongest 30

 参数说明:

  •  --similarity 使用选择计算相似性的方法

  • --axlabels 添加X轴Y轴的标题

  • --strongest 30选取相似性得分最高的前30个 

修改后的效果图如下:

下一篇

版权所有 上海锐翌生物科技有限公司 沪ICP备16022951号