900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > FunRich数据库:一个主要用于基因和蛋白质的功能富集以及相互作用网络分析的独立的软

FunRich数据库:一个主要用于基因和蛋白质的功能富集以及相互作用网络分析的独立的软

时间:2019-04-24 08:27:52

相关推荐

FunRich数据库:一个主要用于基因和蛋白质的功能富集以及相互作用网络分析的独立的软

TCGA |文献阅读 |R语言 |数据库https://mp./mp/appmsgalbum?action=getalbum&album_id=1338487030963142656&__biz=MzA4NDAzODkzMA==#wechat_redirect|理论知识

今天给大家介绍一个工具FunRich,FunRich (Functional Enrichment analysis tool) 是一个主要用于基因和蛋白质的功能富集和相互作用网络分析的独立的软件工具,分析结果可以Venn图、Bar图、Column图、Pie和Doughnut等图表形式呈现,简洁清晰。用户不仅可以搜索默认的后台数据库,还可以加载自定义数据库,从而进行功能富集分析。我们前面介绍了TCGA数据库的各种数据下载与整理,获得的表达矩阵可以绘制热图,可以进差异分析,差异分析获得的差异表达基因,可以用于后续的KEGG ,GO等分析,我们这里就介绍FunRich工具,可能大家之前都用DAVID这个数据库,不妨试试FunRich这个工具,功能很强大。

一.软件下载

网址:/download

该软件下载后,无需安装,解压即可使用,是不是很方便。

二.软件首页

我们后面一一介绍。

三.导入数据

点击Add dataset ,粘贴我们的基因。我们也可以导入数据集(基因集),可以是我们差异分析获得的差异表达基因【参考文章:TCGA数据库:GDCRNATools包下载数据、处理数据以及差异分析,一文就会TCGA数据库基因表达差异分析】。点击OK后,页面左侧显示输入的基因集,可以在上方对新的基因集进行命名,若不命名,自动显示为new set,new set2等,可以连续导入几个数据集。这里我们以limma包和edgeR包差异的分析结果为例。

点击Apply,我们可以看到,有些基因在数据中没有

点击OK后,如图,我导入了890个基因,数据集里面的基因名和数据库自带的背景数据集基因名可能会不符,只有761个。

点击Manage会显示符合的基因列表,可以复制下来。通过Excel中的VLOOK-UP函数与自己原基因列表比较找到不符合的基因,通过其他数据库,找到另外的基因名,再重新导入,也可以忽略。这里就忽略了。我们还可以点击Remove可以删除掉这个数据集,当然,这里就不移除了。

同样的方式,我们导入limma分析的差异基因,这样就有2个数据集啦。

四.分析

1.韦恩图绘制

点击Venn Diagram中的Venn,选择要分析的基因列表

点击OK,我们就可以得到一个图啦

鼠标放在数字上,点右键,点击show genes,可显示对应的基因列表。也可以导出为Excel文件。如果想进一步分析,点击use as a new dataset,会出现一个名为selected的新的基因集,点击OK。

作为新的数据集后,会在左侧显示数据集。

对于图的美化可以在Edit color里可以自己选择自己喜欢的颜色进行修改。这个图可以通过点击Save venn中的Save直接保存。

2. 功能富集分析(Gene enrichment)模块:

点击Analysis,选择要分析的数据集,可以进行GO分析,Pathway分析和结合的转录因子分析等,大家可以自己一一试一下,在这个页面还可以选择要显示富集的前多少个功能,如这里选择前6个,点击OK。

结果如下:会显示前6个富集的细胞组分,基因富集所占的百分比和p值,右侧是每个组分的列表。

在Chart Type中选择显示的图的类型,如我们选择Column chart,可显示柱状图。这个图可以通过Save chart保存。

点击Compare,可以比较上传的数据集的功能,如我们比较两个limma和edgeR包分析的差异基因数据集的细胞组分:

结果如下:

也可以比较分子功能:

点击Fold会进行两个数据库差异功能基因变化的倍数,可以选择输入的数据库比较,也可以与背景数据库比较。如我们这里在上面的复选框和下面的复选框分别选择我们输入的两个数据集进行分子功能的比较,点击OK。

假设我们选择与背景数据库进行生物学过程的比较。

结果如下:

横坐标是生物学过程,纵坐标是变化的倍数,同样右侧会有基因列表,这里不展示。所有分析结果的列表都可以通过Export result按钮以Excel表格的形式下载。

3.互作分析模块

在Interaction菜单中,点击Interaction工具按钮,选择进行互作分析的数据集。点击OK。

结果如下,看上去不是那么的好,比较是演示数据嘛。

会出现互作网络图,下面是对图的注释,右侧是通路名和包含的基因个数和具体有哪些基因的列表。图片和表格都可以下载。

假设我们勾选节点信息:

结果是这样的:

图片不美观,可以在Edit这里可以自己对互作网络图的格式进行编辑。同样可以导出数据,利用其它软件绘图,比如Cytoscape。

4.Heatmap模块

Heatmap也可作热图,可以用已上传的数据集,可以基于已存在人类蛋白质组学数据,也可以用在Select file临时上传新的数据集

上面是聚类热图。我们选择基于已存在的蛋白质组学数据,点击OK,出现的热图如下:

横坐标是基因名,纵坐标是在各个器官表达水平,红色代表高表达。蓝色代表低表达。这个热图也可以修改颜色,下载保存。

5.Vesiclepedia模块

在Vesiclepedia模块,点击load data可以下载外泌体中包含的内容物,包括蛋白、脂质、miRNA和mRNA的情况,以Excel表的形式保存。

以miRNA为例,点开下载的表格,可见的内容包括miRNA的名称,PubMed ID,样本来源,获取年限和对这个miRNA作用的简单描述,点击Pubmed ID可以连接到Pubmed发表的这篇文章,还可以超链接到Vesiclepedia数据库。如我们点击Vesiclepedia 117,在Vesiclepedia数据库我们不仅可以看到Vesiclepedia 117包含的miRNA,也可以找到其中的蛋白/mRNA。

下载的蛋白数据也差不多:

6.miRNA富集分析模块

这部分的功能也很强大,可以对miRNA功能进行富集分析,也可以找miRNA的靶基因,也可以找输入基因集的靶miRNA。如第一步所示,先需要上传一个miRNA的列表。这里我们也以前面TCGA数据库:GDCRNATools包下载数据、处理数据以及差异分析文章中分析的方法得到的差异miRNA进行分析。

富集分析方法与前面的功能基因是一致的,就不多说啦。重点看下面。

点击Find targets 可以出现miRNA的靶基因列表,左侧是每个miRNA所分别对应的靶基因,右侧是总的靶基因。

我们输入了100个miRNA,这100个miRNA 有5886个靶点。

点击Make datasets可以产生一个新的表格,如下图,各列可以通过点击列名进行排序,然后复制下来。点击Export to file表格可以下载为Excel格式。

除了可以通过miRNA预测靶基因以外,FunRich也可以通过基因找靶向的miRNA,点击Find miRNA,选择一个输入的基因集,点击OK。

与miRNA靶基因列表类似,左侧是每个基因对应的miRNA,右侧是所有的miRNA,同样,这个表格转为可以排序的新表格,也可以下载。

功能是不是很强大??有没有get到???

7.基因ID转换

在ID conversion 中,点击Convert,选择要转换的基因列表,选择转换成的gene ID格式,点击Convert,开始转换。

转换后:

同样可以导出:

记得引用文献:

1. Pathan, M., Keerthikumar, S., Chisanga, D.,et al. () A novel community driven software for functional enrichment analysis of extracellular vesicles data. J Extracellular Vesicles. 1:1321455.

2. Pathan, M., Keerthikumar, S., Ang, C.S., et al. () FunRich: a standalone tool for functional enrichment analysis. Proteomics.15, 2597-2601.

好了,数据库的使用介绍到这里,大家在多去探索探索。当然我们也可以通过R进行分析,这个只是满足不同人群的需求嘛,R进行分析后续介绍。

专栏

TCGA |文献阅读 |R语言 |数据库https://mp./mp/appmsgalbum?action=getalbum&album_id=1338487030963142656&__biz=MzA4NDAzODkzMA==#wechat_redirect|理论知识

FunRich数据库:一个主要用于基因和蛋白质的功能富集以及相互作用网络分析的独立的软件工具

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。