2018-08-20浏览量:766

微生物丰度表查看利器-csvkit

相关分析 

近年来,微生物组研究成果频繁出现在《Nature》、《Science》等顶级期刊上,成为国际研究的热点。微生物研究的相关分析,大多数都是基于物种丰度表和基因丰度表。很多操作也多是在Linux系统中,在分析过程中,我们有时候想看看各样品的丰度情况,一般是用cat、less等命令。比如用less -S命令查看门水平的丰度表:

看到上表的时候,简直要看花眼才能找到自己想要的信息。这个时候是无比怀念Excel那种整整齐齐的展现形式。

其实,Linux也有很方便的命令可以查看,可以用column命令,比如:

上表看着就舒服多了,那么还有没有更优秀的命令或者软件呢,也是有的。有一款软件csvkit,同样的表格,我们来看看展示效果:

csvkit是一个处理CSV文件的软件,可以直接通过pip install csvkit安装。集成了csvlook、csvcut、csvstat、csvgrep等很多实用的小工具。csvlook用来查看数据,用表格的形式展示出来。csvcut则可以查看列名,选取列,剔除列等。如查看列名:

在提取列内容的时候,既可以用列序号作为索引,也可以用列名称作为索引。比如按列序号、名字分别提取前2列内容:

csvstat可以对指定1列或者多列做简单地统计分析,可以统计的内容包括唯一值、最小值、最大值、总计、均值、中位值、标准差等。

csvgrep可以筛选指定1列或多列,包含指定字符的文件内容,如提取第1列包含“p__A”字符的第1、2列内容:

csvgrep可以筛选指定1列或多列,包含指定字符的文件内容,如提取第1列包含“p__A”字符的第1、2列内容:

下一篇

版权所有 上海锐翌生物科技有限公司 沪ICP备16022951号