LiDing Blog

Thinking will not overcome fear but action will.

2021-04-02-全基因组关联分析100个关键词

第二部分——第21到第40个关键词

本部分主要参考:[百迈客生物]、[生信菜鸟团]、[Freescience联盟]、[生信草堂] 21.SNP‐level missingness   这是样本中缺少特定 SNP信息的个体数量。具有高度缺失的SNP 可能导致误差。 22.Sex discrepancy(性别差异)   表型信息中的性别与根据基因型确定的性别之间的差异。这个差异可以验证实验室中的样品是否混淆。注...

2021-04-01-全基因组关联分析100个关键词

第一部分——第1到第20个关键词(偏向群体遗传学基础知识)

本部分主要参考:[百迈客生物]、[生信菜鸟团] 1.群体   是指生活在一定空间范围内,能够相互交配并生育具有正常生殖能力后代的同种个体群。群体与个体相对,是个体的共同体,不同个体按某种特征结合在一起,进行共同活动、相互交往,就形成了群体。 2.等位基因频率   等位基因频率是群体遗传学的术语,用来显示一个种群中基因的多样性,或者说是基因库的丰富程度。在一个群体中,等...

2021-03-31-三月份的文献精读

一、2014年——拉美混合人群的地理结构、表型变异和自我识别(PLoS Genet) 1.Title:   Admixture in Latin America: Geographic Structure, Phenotypic Diversity and Self Perception of Ancestry Based on 7,342 Individuals 2.Backgrou...

2021-03-31-丁立的三月读书笔记

在阅读中探寻自己的迷执与迷途

2021.03.01 周一:   然而,正如卡伦·霍妮所主张的那样,这样一来这个人的能量将不会用在实现真实的自己的可能性上面,而是会把能量完全用在证明“自己的完美”上面,这会转化为对自己不切实际的过高要求,继而会妨碍这个人本来拥有的能力的发展。   心理学上有一个“耶克斯—多德森定律(Yerks—Dodson Law)”。太想做一件事时,会产生出过度的紧张,这会降低行动的执行水平。人们常...

2021-03-20-GWAS学习笔记系列(一)

01-分析路线图和02-表型数据清洗

资料来源:公众号:育种数据分析之放飞自我 一、GWAS分析的Outline 按照作者邓飞的理解,GWAS主要分为如下四个部分: 1.数据清洗 1.1 表型数据清洗 删除异常值 查看数据分布 数据可视化 1.2 基因型数据清洗 MAF Call rate HWE 2.关联分析 2.1 一般线性模型 2.2 混合线性模型 3.结果可...

2021-03-19-GWAS操作笔记系列(三)

关联分析3-5:GLM模型进行GWAS分析+数值+因子+PCA协变量

资料来源:公众号:育种数据分析之放飞自我 本篇主要是介绍一般线性模型(LM)中的linear参数,考虑数值+因子+PCA协变量,然后将结果与R语言编程结果比较。 plink做GWAS只有两个模型可以用:GLM和logistic,前者分析数量性状,后者分析二分类性状。而现在GWAS更多使用LMM模型,这个模型plink没法做,以后几篇介绍GEMMA的操作方法。 1...

2021-03-18-GWAS操作笔记系列(三)

关联分析3-4:GLM模型进行GWAS分析+数值+因子协变量

资料来源:公众号:育种数据分析之放飞自我 本篇主要是介绍一般线性模型(LM)中的linear参数,考虑数值+因子协变量,然后将结果与R语言编程结果比较。   GWAS分析时,无论是一般线性模型,还是广义线性模型,都要对协变量进行处理。数值类型的协变量(比如初生重数值协变量,PCA的值)直接加进去,因子协变量(比如不同的年份,不同的地点,场等)需要转化为虚拟变量。   如果一...

2021-03-17-GWAS操作笔记系列(三)

关联分析3-3:GLM模型进行GWAS分析+因子协变量

资料来源:公众号:育种数据分析之放飞自我 本篇主要是介绍一般线性模型(LM)中的linear参数,考虑因子协变量,然后将结果与R语言编程结果比较。 1.协变量文件整理   第一列为FID, 第二列为ID ,第三列以后为协变量(注意,只能是数值,不能是字符!) 这里协变量文件为:   这里第三列为性别,第四列为世代,本篇将世代作为因子,进行因子协变量的GWAS分析。 ...

2021-03-16-GWAS操作笔记系列(三)

关联分析3-2:GLM模型进行GWAS分析+数值协变量

资料来源:公众号:育种数据分析之放飞自我 本篇主要是介绍一般线性模型(LM)中的linear参数,考虑数值协变量,然后将结果与R语言编程结果比较。 1.协变量文件整理   第一列为FID ,第二列为ID ,第三列以后为协变量(注意,只能是数值,不能是字符!) 这里协变量文件为:   这里第三列为性别,第四列为世代,为了方便操作,我们将世代作为数值,直接进行协变量分析...

2021-03-15-GWAS操作笔记系列(三)

关联分析3-1:GLM模型进行GWAS分析

资料来源:公众号:育种数据分析之放飞自我 1.前言 之前的教程中,我们使用的是别人模拟的数据,数据类型是二分类数据,这里我们模拟一个数量性状的连续性状,做GWAS更有代表性。 我们先从没有协变量的一般线性模型(LM)开始,然后加入数据类型的协变量,然后加入因子类型的协变量(这里需要进行虚拟变量的转化),然后将数值协变量和因子变量放在一起作为...