1. 日本晴的基因ID转换
到目前为止,主要有两个团队对日本晴全基因组进行了注释,分别是The Rice Annotation Project (RAP)(https://rapdb.dna.affrc.go.jp/index.html)和Rice Genome Annotation Project (RGAP7,MSU)(http://rice.plantbiology.msu.edu/index.shtml)。由于存在两个团队同时对日本晴的全基因组注释进行维护,因此其注释的基因数量和基因的登录号也不相同。RAP格式为“Os-Chr-g-number”,MSU格式为“LOC_Os-Chr-g-number”。
1.1 RAP和MSU格式相互转换的方法
-
1.OryzaExpress:http://bioinf.mind.meiji.ac.jp/OryzaExpress/ID_converter.php
-
2.RAP-DB:https://rapdb.dna.affrc.go.jp/tools/converter/run
-
3.PlantGSEA:http://structuralbiology.cau.edu.cn/PlantGSEA/
最推荐使用OryzaExpress,因为其可以在MSU、RAP及基因探针三者之间进行转换。
1.2 水稻芯片和基因ID之间的转换
-
1.OryzaExpress:http://bioinf.mind.meiji.ac.jp/OryzaExpress/ID_converter.php
-
2.RICECHIP.ORG:http://www.ricechip.org/
-
3.AGRIGO:http://systemsbiology.cau.edu.cn/agriGOv2/
还是最推荐使用OryzaExpress。
2.日本晴基因的功能注释
2.1 GO注释及富集分析
(1)日本晴的GO注释可使用:
-
1.网站:
RAP-DB: http://rapdb.dna.affrc.go.jp MSU: http://rice.plantbiology.msu.edu
-
2.软件:Interproscan等
-
3.若是基因芯片,可以直接从affymtrix官网下载官方注释。
(2)日本晴的GO富集分析可使用:
-
1.网站:
华大的WEGO: http://systemsbiology.cau.edu.cn/agriGOv2 AGRIGO: http://systemsbiology.cau.edu.cn/agriGOv2/
-
2.软件:TBtools等
-
3.R-Bioconductor:clusterprofiler
2.2 KEGG注释及富集分析
(1)日本晴的KEGG注释可使用:
-
1.网站:
DAVID:https://david.ncifcrf.gov/
-
2.软件:Interproscan等
(2)日本晴的KEGG富集分析可使用:
-
1.网站:
DAVID:https://david.ncifcrf.gov/ AGRIGO: http://systemsbiology.cau.edu.cn/agriGOv2/
-
2.R-Bioconductor:clusterprofiler
需要注意的是:
-
(1)clusterprofiler不能用来做GO的富集分析,因为其20个物种中不包括水稻;
-
(2)clusterprofiler可以用来做KEGG的富集分析,organism = dosa;
R包做水稻的KEGG分析的代码:
library(clusterProfiler)
up=read.table("up-8-22.txt",header = F,sep = "\t")
upgene=as.character(up[,1])
# 对于GID
kk <- enrichkegg(gid_list,organism='osa',keyType = 'kegg',pvalueCutoff=0.05, pAdjustMethod='BH',qvalueCutoff=0.1)
# 对于RAP_ID
kk <- enrichkegg(rap_list,organism='dosa',keyType = 'kegg',pvalueCutoff=0.05, pAdjustMethod='BH',qvalueCutoff=0.1)
write.table(ekk,"kegg.txt",sep = "\t",quote = F,row.names = F)
barplot(ekk,showCategory = 15,title = "EnrichmentKEGG")