全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
783 1
2023-09-13

图片绘制使用R语言中的RIdeogram包进行,数据分析使用TBtools完成。

1、首先在NCBI或者其他网站下载需要分析的物种基因组文件,包括全基因组序列,gff文件,cds序列文件。


2、使用TBtools中Sequence Toolkit菜单下Fasta Tools类目中的Fasta Stats 对染色体长度进行统计。将染色体长度信息,按照R包要求的数据格式进行整理:(第一列染色体名称,第二列 起始位置,第三列 结束位置,第四列 染色体填充颜色,第五列 物种名称,第六列 物种名字体大小,第七列 物种名颜色),将文件保存为chr_info.csv。

图1 染色体信息.png


3、使用TBtools中Comparative Genomics类目中OneStepMCScanX-SuperFast工具对两物种间的共线性关系进行分析(需要先在Plugin Store中进行该插件安装),将分析得到的共线性关系(geneLinkedRegion),按照R包要求的数据格式进行整理:(第一列物种1的染色体名称,第二列 物种1起始位置,第三列 物种1结束位置,第四列 物种2染色体名称 ,第五列 物种2起始位置,第六列 物种2结束位置,第七列 关系对的连线颜色,第八列 指定共线性物种)。将文件保存为gene_link.csv。第七列fill可更改颜色代码以突出某些共线性关系,由于线条是按先后顺序进行绘制的,因此要将这些需要突出的关系对至于表格中的最后面,以免被遮挡覆盖。第八列type的参数为1、2、3,根据步骤2中染色体信息表中物种的先后顺序进行排列,1代表第1个物种与第2个物种之间的关系,2代表第1个物种与第3个物种之间的关系,3代表第2个物种与第3个物种之间的关系。如果只是进行两物种之间的共线性分析,则无需type列。

共线性关系.png

4、在共线性关系文件(geneLinkedRegion)中,找到所需分析基因家族成员的关系对放置到第3步的文件的最后,并设置连线颜色代码。

5、使用R语言进行绘制

install.packages("RIdeogram") #安装R包RIdeogram

library("RIdeogram") #加载R包

A <- read.table("chr_info.csv", sep= ",", header = T) #读取染色体信息文件

B <- read.table("gene_link.csv", sep= ",", header = T) #读取共线性关系文件

ideogram(karyotype = A, synteny = B,output ="file name. svg") #绘制共线性图

convertSVG("name.svg ", device ="png",file = "file name",dpi = 600) #将svg文件转换为png

convertSVG("name.svg ", device="pdf",file = "file name") #将svg文件转换为pdf文件

D2X][]1EJA~]6U4NIB8[QMQ.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-9-13 11:36:56
谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群