LiDing Blog

Thinking will not overcome fear but action will.

2020-07-20-GWAS系列文章二

GWAS的分析基本流程及分析思路

参考资料:橙子牛奶糖的博客 1. 数据预处理(DNA genotyping、Quality control、imputation) QC的工作可以用PLINK完成,Imputation的工作可以用IMPUTE2完成。 2. 表型数据统计分析 逻辑回归(表型数据为二元) 线性回归(表型数据为连续性变量) ...

2020-07-13-基于Salmon+DESeq2的转录组分析流程

实践生物信息学系列文章一

参考资料:实践生物信息学 第一部分 使用Salmon对RNA-seq测序数据进行定量 1.1 整体流程 1.2 基因定量工具-Salmon的优势 定量时考虑到不同样品中基因长度的改变(比如不同isoform的使用) 速度快,需要的计算资源和存储资源小 敏感性高,不会丢弃匹配到多个基因同源区域的reads ...

2020-07-07-R Graphics Cookbook读书笔记2

第三章-条形图

参考资料:R Graphics Cookbook, 2nd edition 第三章 条形图(Bar Graphs)   条形图可能是最常用的数据可视化类型。它们通常用于显示不同类别(在x轴上)的数值(在y轴上)。举例来说,条形图可以很好地显示四种不同商品的价格。但是,条形图通常不适合显示随时间变化的价格(因为时间是一个连续变量)。   在制作条形图时,有一点需要意识到:条形图的...

2020-07-02-R Graphics Cookbook读书笔记1

第一章-R语言基础和第二章-快速浏览数据

参考资料:R Graphics Cookbook, 2nd edition 第一章 R语言基础 1.1 软件及依赖包的安装 install.packages("tidyverse") install.packages("gcookbook") 1.2 加载R包 library(ggplot2) library(dplyr) library(gcookbook) 1...

2020-06-23-GWAS系列文章一

GWAS入门前的Q&A

参考资料:Digital-LI 1.SNP的本质属性是什么?什么是allel frequency in population?   SNP是进化过程中随机产生的单点突变,并能稳定地在群体中遗传。其广义上讲是变异:most common type of genetic variation,平级的还有indel、CNV、SV。狭义上讲是标记:biological markers,应为...

2020-06-18-单细胞测序系列文章八

单细胞转录组数据处理之细胞亚群比例比较

来源:单细胞天地 这就是个性化分析阶段,这个阶段取决于自己的单细胞转录组项目课题设计情况,我们的介绍的各式各样的分析点,并不是通用的。比如如果要比较细胞亚群比例,就必须要有多个样本,如果是单个样本,可以看如下的教程: 我的课题只有一个10x样本肿么办? 两个样品的10x单细胞转录组数据分析策略 三个10X单细胞转录组样本CCA整合 多个单细胞转录组样本的数据整合...

2020-06-16-单细胞测序系列文章七

单细胞转录组数据处理之细胞亚群继续分群

来源:单细胞天地   其实理论上细胞亚群是可以无限划分的,因为世界上没有两个一模一样的细胞,关键是要把握一个度,什么样的差异可以判定为不同细胞亚群,什么样的差异是可以容忍的细胞类群内部异质性。   有一个策略就是找出主要因素和次要因素。主要因素划分为主要亚群,比如外周血里面的T,B细胞当然是不同亚群,但是T细胞里面还可以继续划分:CD4或者CD8的T细胞,甚至继续划分, 如下图所...

2020-06-14-单细胞测序系列文章六

单细胞转录组数据处理之细胞亚群注释

来源:单细胞天地   前面学习到单细胞转录组数据的降维聚类分群,基本上跑的都是标准代码,里面很多细节参数是需要自己慢慢摸索的。保证单细胞转录组表达矩阵质量ok啦,而且需要去除了各种混杂因素。   因为参数需要自己摸索和调整,所以其实拿到细胞亚群数量是因人而异的,取决于你前面降维的程度,分群的算法和参数。不过最重要的是拿到了不同细胞亚群后需要对它进行命名,给出生物学的解释。不同的人...

2020-06-12-单细胞测序系列文章五

单细胞转录组数据处理之降维聚类分群

来源:单细胞天地 1.降维聚类分群是一条龙分析 我们并不是开发单细胞数据处理算法,所以大概率上,大家其实会把降维聚类分群一起做了,在seurat3里面的代码是: sce <- NormalizeData(sce, normalization.method = "LogNormalize", scale.factor = 10000) sce <- FindVari...

2020-06-10-单细胞测序系列文章四

单细胞转录组数据处理之数据质控

来源:单细胞天地 一、过滤不合格细胞和基因 拿到表达矩阵后有一个很重要的质控过程,就是根据一些阈值来过滤不合格细胞和基因。细胞的不合格很容易理解, 可能是那个细胞检测到的基因数量太少,或者太多,也许是那个细胞的文库大小异常,都是需要谨慎考虑是否管理它。 基因的不合格,就需要大家对人类参考基因组的注释信息有所背景了。走RNA-seq定量流程,拿到的表达矩阵通常是取决于gt...