900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > HiCPlotter:Hi-C数据可视化工具

HiCPlotter:Hi-C数据可视化工具

时间:2018-08-09 14:09:40

相关推荐

HiCPlotter:Hi-C数据可视化工具

HiCPlotter是一款命令行工具,用来展示Hi-C的交互矩阵。除了基本的用热图展示交互矩阵外,还支持添加基因结构,chip_seq等二维数据的注释信息,网址如下

/kcakdemir/HiCPlotter

对于交互矩阵,支持多种格式

1. 通用格式

Hi-C交互矩阵以bin为单位,每行和每列都代表一个bin, 对应单元格的数值反映两个bin之间相互作用的频率。通用格式如下所示

Bin1 Bin2 Bin3 Bin4 Bin5 Bin6

7.85957 4.80329 11.4766 9.57416 4.5288 8.55022

8.61621 4.98956 2.35654 5.69483 11.1187 10.1322

4.06803 4.07801 7.98047 2.59144 6.3851 7.74306

4.52869 2.70624 8.94544 4.29185 8.29491 8.38257#开头的行以及第一行都被当做是注释信息,会被忽略掉。

2. HiC-Pro专用格式

HiC-Pro为了解决传统的交互矩阵太大的问题,专门制定了一种新的格式,如下所示

1050 1586 1

1050 1589 1

1050 1590 1 (jumps to 1612)

1050 1612 2共三列,前两列对应bin的编号,第三列的数字代表两个bin之间交互作用的频率,不存在相互作用的bin就不会记录在该文件之中。除了这个文件,还需要下列文件

chr1 20960000 20980000 1049

chr1 20980000 21000000 1050

chr1 21000000 21020000 1051

chr1 21020000 21040000 1052

chr1 21040000 21060000 1053

chr1 21060000 21080000 1054

chr1 21080000 21100000 1055给出了每个bin编号对应的染色质位置,通过这两个文件就可以完整描述描述染色质交互信息了。

软件的基本用法如下

python 、\

HiCPlotter.py \

-f matrix.txt \

-n hES \

-chr chr21 \

-r 40000 \

-o default1 \-f参数指定输入的Hi-C交互矩阵,-n指定交互矩阵热图的标题名称,-chr指定要画的染色质的名称,-r指定对应的分辨率,-o指定输出文件的前缀, 结果示意如下

对于HiC-Pro的输出格式,用法如下

python \

HiCPlotter.py \

-f matrix.txt \

-tri 1 \

-bed bin.bed \

-chr chr7 \

-o Example \

-r 40000 \

-n hES-tri 1声明输入的交互矩阵的格式是HiC-Pro的输出格式,-bed指定bin编号对应的染色质位置文件,其他参数和基本用法相同。

该软件支持同时可视化多个交互矩阵,用法如下

python \

HiCPlotter.py \

-f matrix1.txt matrix2.txt matrix3.txt \

-n name1 name2 name3 \

-chr chr6 \

-r 40000 \

-o example对应的-f和-n参数为空格分隔的多个参数,结果示意如下

除了上述基本用法,还可以添加注释信息,比如基因结构,对应chip_seq数据等,结果示意如下

此时需要输入各种注释信息对应的文件,对于不同的注释信息,要求的格式不同,更多的细节请参考官方文档。

·end·

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。