来源:生信媛公众号。
第四周根据差异基因进行富集分析及解读。本周的学习简单来说可以分为两个阶段:
第一阶段:一代富集分析——GO和KEGG
1. 使用biomaRt包注释差异基因信息
-
FPKM的计算
-
理解gene id
-
转化ENSEMBL id到gene symbol及gene features
-
org.**.eg.db包的学习
2. 使用ClusterProfile包对差异基因进行富集分析
-
ClusterProfile学习
-
Over Representation Analysis简介
-
ORA算法简介
3. GO、KEGG分析及结果解读
-
数据库解读
-
构建orgdb
-
富集结果解读
-
作图及导出
4. ggplot2包初识
5. ggplot2模仿clusterProfiler作图
第二阶段:二代富集分析——GSEA
1. 输入文件的格式解读与构建
-
Expression dataset file (res, gct, pcl, or txt)
-
Phenotype labels file (cls)
-
Gene sets file (gmx or gmt)
-
Chip (array) annotation file (chip)
2. GSEA参数的选择与基因集的构建
-
Molecular Signatures Database学习
-
GSEA下载和界面操作
-
参数的选择(通俗解读)
3. 常见报错原因解读
-
结果解读
-
NES
-
FDR value
4. 生物学意义解析
-
数据库的选择
-
没有对应物种数据库时的选择