2018-12-09-基因家族科研思路1

植物抗性基因家族思路解析

Posted by DL on December 9, 2018

本文参考了部分文献及《植物研究进展》、《植物科学最前沿》公众号的三篇文章。

本文主要以本人所做的水稻NBS-LRR基因家族的分析为例。

1. 基因家族的鉴定

  • 首先根据pfam数据库中NBS-LRR基因家族的的保守结构域NBS(PF00931)信息,利用HMMER软件构建种子序列,并对日本晴全基因组蛋白质序列进行搜索,如果存在该结构域,则判定为NBS-LRR候选基因;

  • 接着,使用PFAM、PANTHER、SUPERFAMILY等数据库对候选基因进行进一步确认;

  • 需要注意的是,对于部分在Pfam数据库里没有被收录的基因家族,我们只能在模式植物,如拟南芥中搜集已知的基因家族成员序列,然后在自己研究的物种中进行序列比对,从而对基因家族成员进行鉴定。(摘录于植物研究进展

2. 进行染色体定位和基因簇划分

  • 首先提取候选基因集的gene locus信息,使用MapInspect等绘图软件绘制其染色体定位信息;

  • gene cluster的划分原则:two or more NBS-LRR genes locus resided within 200 kb。

3. 构建系统进化树和加倍复制分析

  • 系统进化树的绘制可以使用MEGA7.0软件,为了方便对基因进行分类,应该选取日本晴中的NBS-LRR家族及拟南芥中的NBS-LRR家族一起来分析,图例如下: F1Hd4x.png

  • 利用MCScanX软件可以做共线性分析,如下: F1bpMF.png

4. 基因结构和motif分析

利用MEME绘制基因的外显子和内含子位置信息,以及基因序列上的motif信息,并将这些基因结构信息按照系统进化树的顺序进行展示。 F1bkI1.md.png

5. 水稻和拟南芥蛋白家族基因的同源性分析

拟南芥中NBS-LRR蛋白功能研究较为完善,进行水稻与拟南芥间NBS-LRR蛋白同源性分析有助于解析水稻中NBS-LRR蛋白的功能,具体信息见下图: F3ktN6.png

6. 蛋白家族启动子区域顺式作用元件分析

F3krDA.png

具体可以使用PLANTCARE来挖掘基因中的顺势元件。

7. 基因多重序列比对、GO注释

  • 多重序列比对可以使用CLUSTAL OMEGA软件;

  • GO注释可以使用水稻基因组注释文件或WEGO在线。

8. 基因家族启动子及表达模式分析(以毛竹bHLH为例)

由于那篇文章研究的基因家族是转录因子,所以可以对家族内基因启动子区域进行分析,这也是本文分析比较具有亮点的部分;bHLH基因家族所含有的顺式作用元件共可划分为3类:一是光周期响应原件;二是植物生长发育响应原件;三是生物/非生物胁迫响应原件。 F1H6DH.png

9. 基因在不同处理下的差异表达分析及可视化(和基因表达量数据的结合)

  • 结合相关的高通量测序数据,观察我们所获得的基因在其中的表达量的变化,可以使用heatmap图进行可视化展示: F1HjP0.md.jpg

10. qRT-PCR检测胁迫环境下NBS-LRR基因表达模式变化

基因家族的主体分析内容完成之后,还可以结合qPCR等基因表达数据进行进一步挖掘。