2019-01-16-日本晴水稻相关的实用tips

基因格式转换及下游分析

Posted by DL on January 16, 2019

1. 日本晴的基因ID转换

  到目前为止,主要有两个团队对日本晴全基因组进行了注释,分别是The Rice Annotation Project (RAP)(https://rapdb.dna.affrc.go.jp/index.html)和Rice Genome Annotation Project (RGAP7,MSU)(http://rice.plantbiology.msu.edu/index.shtml)。由于存在两个团队同时对日本晴的全基因组注释进行维护,因此其注释的基因数量和基因的登录号也不相同。RAP格式为“Os-Chr-g-number”,MSU格式为“LOC_Os-Chr-g-number”。

1.1 RAP和MSU格式相互转换的方法

  • 1.OryzaExpress:http://bioinf.mind.meiji.ac.jp/OryzaExpress/ID_converter.php

  • 2.RAP-DB:https://rapdb.dna.affrc.go.jp/tools/converter/run

  • 3.PlantGSEA:http://structuralbiology.cau.edu.cn/PlantGSEA/

最推荐使用OryzaExpress,因为其可以在MSU、RAP及基因探针三者之间进行转换。

1.2 水稻芯片和基因ID之间的转换

  • 1.OryzaExpress:http://bioinf.mind.meiji.ac.jp/OryzaExpress/ID_converter.php

  • 2.RICECHIP.ORG:http://www.ricechip.org/

  • 3.AGRIGO:http://systemsbiology.cau.edu.cn/agriGOv2/

还是最推荐使用OryzaExpress。

2.日本晴基因的功能注释

2.1 GO注释及富集分析

(1)日本晴的GO注释可使用:

  • 1.网站:

      RAP-DB: http://rapdb.dna.affrc.go.jp
      
      MSU: http://rice.plantbiology.msu.edu
    
  • 2.软件:Interproscan等

  • 3.若是基因芯片,可以直接从affymtrix官网下载官方注释。

(2)日本晴的GO富集分析可使用:

  • 1.网站:

      华大的WEGO: http://systemsbiology.cau.edu.cn/agriGOv2
    
      AGRIGO: http://systemsbiology.cau.edu.cn/agriGOv2/
    
  • 2.软件:TBtools等

  • 3.R-Bioconductor:clusterprofiler

2.2 KEGG注释及富集分析

(1)日本晴的KEGG注释可使用:

  • 1.网站:

      DAVID:https://david.ncifcrf.gov/
    
  • 2.软件:Interproscan等

(2)日本晴的KEGG富集分析可使用:

  • 1.网站:

      DAVID:https://david.ncifcrf.gov/
    
      AGRIGO: http://systemsbiology.cau.edu.cn/agriGOv2/
    
  • 2.R-Bioconductor:clusterprofiler

需要注意的是:

  • (1)clusterprofiler不能用来做GO的富集分析,因为其20个物种中不包括水稻;

  • (2)clusterprofiler可以用来做KEGG的富集分析,organism = dosa;

R包做水稻的KEGG分析的代码:

library(clusterProfiler)
up=read.table("up-8-22.txt",header = F,sep = "\t")
upgene=as.character(up[,1])

# 对于GID
kk <- enrichkegg(gid_list,organism='osa',keyType = 'kegg',pvalueCutoff=0.05, pAdjustMethod='BH',qvalueCutoff=0.1)

# 对于RAP_ID
kk <- enrichkegg(rap_list,organism='dosa',keyType = 'kegg',pvalueCutoff=0.05, pAdjustMethod='BH',qvalueCutoff=0.1)

write.table(ekk,"kegg.txt",sep = "\t",quote = F,row.names = F)
barplot(ekk,showCategory = 15,title = "EnrichmentKEGG")