2019-08-28-第四周 根据差异基因进行富集分析及解读

学转录组入门生信系列文章五

Posted by DL on August 28, 2019

来源:生信媛公众号。

第四周根据差异基因进行富集分析及解读。本周的学习简单来说可以分为两个阶段:

第一阶段:一代富集分析——GO和KEGG

1. 使用biomaRt包注释差异基因信息

  • FPKM的计算

  • 理解gene id

  • 转化ENSEMBL id到gene symbol及gene features

  • org.**.eg.db包的学习

2. 使用ClusterProfile包对差异基因进行富集分析

  • ClusterProfile学习

  • Over Representation Analysis简介

  • ORA算法简介

3. GO、KEGG分析及结果解读

  • 数据库解读

  • 构建orgdb

  • 富集结果解读

  • 作图及导出

4. ggplot2包初识

5. ggplot2模仿clusterProfiler作图

第二阶段:二代富集分析——GSEA

1. 输入文件的格式解读与构建

  • Expression dataset file (res, gct, pcl, or txt)

  • Phenotype labels file (cls)

  • Gene sets file (gmx or gmt)

  • Chip (array) annotation file (chip)

2. GSEA参数的选择与基因集的构建

  • Molecular Signatures Database学习

  • GSEA下载和界面操作

  • 参数的选择(通俗解读)

3. 常见报错原因解读

  • 结果解读

  • NES

  • FDR value

4. 生物学意义解析

  • 数据库的选择

  • 没有对应物种数据库时的选择