Venn Diagram,简称文氏图,又称为维恩图,是一种非常常用的图示手段,主要用于显示组与组之间重叠的程度。比如为了验证某一基因的功能学意义,在不确定其靶基因的情况下,可以先从公用数据库中,预测出可能的靶基因。但是这种预测靶基因的数据库目前来说比较多,如何才能获得一个相对准确的靶基因?相对可靠的办法是分析比较不同数据库预测的靶基因的一致性,然后从中找出所有数据库都能预测到的靶基因作为感兴趣的基因进行功能验证。这是生物信息学分析里面一个非常普遍的思路。
三个数据集的文氏图:
四个数据集的文氏图:
五个数据集的文氏图:
目前基于R绘制Venn Diagram(简称文氏图)的程序有四种:
1、 limma::vennDiagram
2、 gplots::venn
3、 venneuler
4、 VennDiagram
四种方法中第一和第四种方法相对比较常用。
另外,绘制文氏图需要特别注意以下几点:
1、 limma::vennDiagram及gplots::venn不能绘制彩色的文氏图,而VennDiagram绘制的文氏图相对更为美观。
2、 gplots::venn及VennDiagram绘制的文氏图是基于列表数据的,也即是必须先知道不同数据集的各自交叉子集数才能绘制文氏图。而limma::vennDiagram却是基于R对象的,这在不知道具体不同数据集的交叉子集数的情况下,也即探索不同数据集的交叉子集时,有着明显优势。
3、 由于limma (全称:Linear Models for Microarray Data)是Bioconductor中用于分析微阵列数据的非常重要及常用的程序包。因此,对于生物信息学研究者来说,采用limma::vennDiagram绘制文氏图更为多见。但是为了更加美观的文氏图,
可以通过limma::vennDiagram先得到不同数据集的交叉子集数,然后采用VennDiagram绘制更加美观的彩色文氏图。
附件中分别介绍了如何采用VennDiagram及limma::vennDiagram绘制文氏图的效果及相应的R编码。需要说明的是:由于VennDiagram绘制文氏图是基于已知的交叉子集数下绘制,但是在生物统计分析中,通常并不知道不同数据集的交叉子集数。所以最后采用实例分析如何采用limma::vennDiagram来绘制不清楚交叉子集数情况下的文氏图。
附件下载网址:
http://yunpan.cn/cLhiA3x5csU4J 访问密码 b8b1