LiDing Blog

Thinking will not overcome fear but action will.

2021-03-14-GWAS操作笔记系列(二)

质控2-6:去掉亲缘关系近的个体

资料来源:公众号:育种数据分析之放飞自我 1.前言   这里,我们要对一些亲子关系的个体,进行一下过滤,计算类似IBS的结果。这里讲亲子关系的个体移除,不是必须要的,比如我们分析的群体里面有亲子关系的个体,想要进行分析,不需要做这一步的筛选。 2.计算pihat > 0.2的组合 plink --bfile HapMap_3_r3_10 --genome --m...

2021-03-13-GWAS操作笔记系列(二)

质控2-5:杂合率检验

资料来源:公众号:育种数据分析之放飞自我 1.前言   一般自然群体,基因型个体的杂合度过高或者过低,都不正常,我们需要根据杂合度进行过滤。偏差可能表明样品受到污染,近亲繁殖。我们建议删除样品杂合率平均值中偏离±3 SD的个体。   参数过滤和手动过滤:plink有个特点,所有的过滤标准,都可以生成过滤前的文件,然后可以手动过滤,也可以用参数进行过滤。 比如:–mi...

2021-03-12-GWAS操作笔记系列(二)

质控2-4:哈温平衡检验

资料来源:公众号:育种数据分析之放飞自我 1.前言 1.1 什么是哈温平衡?   哈迪-温伯格(Hardy-Weinberg)法则 哈迪-温伯格(Hardy-Weinberg)法则是群体遗传中最重要的原理,它解释了繁殖如何影响群体的基因和基因型频率。这个法则是用Hardy,G.H (英国数学家) 和Weinberg,W.(德国医生)两位学者的姓来命名的,他们于同一年(190...

2021-03-11-GWAS操作笔记系列(二)

质控2-3:MAF过滤

资料来源:公众号:育种数据分析之放飞自我 1.前言   上一次我们经过去掉缺失,去掉错误的性别信息,得到的文件为: 这里,我们根据最小等位基因频率(MAF)去筛选。 为什么要根据MAF去筛选? 最小等位基因频率怎么计算?比如一个位点有AA或者AT或者TT,那么就可以计算A的基因频率和T的基因频率,qA + qT = 1,这里谁比较小,谁就是最小等位基因频率...

2021-03-10-GWAS操作笔记系列(二)

质控2-2:性别质控

资料来源:公众号:育种数据分析之放飞自我 1.前言   这个章节,主要是人类性别的信息的质控,主要是根据性染色上SNP的比值,判断性别,然后把性别错误的个体去掉或者更改性别信息。 原理:检查性别差异。先验信息,女性的受试者的F值必须小于0.2,男性的受试者的F值必须大于0.8。这个F值是基于X染色体近交(纯合子)估计。不符合这些要求的受试者被PLINK标记为“PROB...

2021-03-09-GWAS操作笔记系列(二)

质控2-1:缺失质控

资料来源:公众号:育种数据分析之放飞自我 1.前言 –geno筛选个体;–mind筛选SNP   GWAS分析时,拿到基因型数据,拿到表型数据,要首先做以下几点: 查看自己的表型数据,是否有问题 查看自己的基因型数据,是否有问题   然后再进行建模,得到显著性SNP以及可视化结果。   清洗数据的时间占80%的时间,有句话这样讲:“Garbage ...

2021-03-08-GWAS操作笔记系列(一)

1-下载数据

资料来源:公众号:育种数据分析之放飞自我 1.前言   这里,总结一下GWAS的学习笔记,GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位,这次学习的教程是plink做GWAS,plink是个很好的软件,但是我之前做GWAS都是使用R包,听说plink和EMMAX做GWAS更快,更好,更容易写出pipeline。就利用...

2021-02-28-丁立的二月读书笔记

在阅读中探寻自己的迷执与迷途

2021.02.05 周五:   养成一种“历史感”很重要。什么是历史感?我理解,就是回到历史上每一个人、每一代人当时的处境里去,重新理解那些活过、挣扎过、死掉的人们在当时所面临的约束下所取得的成就。只有这样看,你才会看到一个真实的现代文明。人类文明的爆发,确实是在过去两百年,但是就像第五个包子你吃饱了,前四个包子并不是没有用一样。   一个人建立了这样的时空感之后,至少心胸会大一点。他...

2021-02-11-单细胞转录组100个关键词

第三部分——第41到第60个关键词

41.可视化单细胞亚群的标记基因的5个方法 参考内容1、参考内容2 42.Cell Ranger软件的相关知识及用法 原理介绍1、原理介绍2、用法介绍1、Cell ranger使用前注意事项、Cell Ranger使用初探、Cell Ranger流程概览、理解cellranger count的结果 43.两种给细胞亚群重命名的方法 levels(seurat_integra...

2021-02-10-单细胞转录组100个关键词

第二部分——第21到第40个关键词

21.标记基因的展示   个位数标记基因可以选择小提琴图和tSNE映射图,十几个标记基因可以选择气泡图,大量标记基因可以选择热图。 22.亚群细胞频率   10X scRNA-seq通常会取多个样本,例如不同发育时期/不同病例发展时期的样本分别开展检测。在分析阶段,各个样本的数据将会被汇总后统一进行细胞分群。那么,各个样本中各类细胞相对比例的变化(某类细胞占总体细胞的百分比)也是非常重...