来源:生信媛公众号。
我们第一周目标有三个:
-
熟悉Linux环境
-
登录服务器
-
Linux基本命令
-
PATH的意义
-
-
学习conda管理环境
-
如何在conda中添加channel
-
如何用conda安装和卸载软件
-
如何创建新的环境和切换环境
-
-
数据准备
-
参考序列
-
注释信息
-
测序数据
-
首先,你需要有一个Linux环境,Windows10用户可以安装WSL,MacOS请在应用程序中搜索终端
-
Windows10配置WSL: https://linux.cn/article-9545-1.html
-
MacOS的环境配置: https://blog.csdn.net/orangleliu/article/details/47357339
然后,你需要学一些基础的Linux的命令操作,如下是鸟哥的Linux私房菜的对应链接
-
目录管理:http://linux.vbird.org/linux_basic/0210filepermission.php
-
vim使用说明: http://linux.vbird.org/linux_basic/0310vi.php
-
shell基础: http://linux.vbird.org/linux_basic/0320bash.php 中的10.1,10.2,10.3和10.4
-
再接着你需要用conda安装如下软件
-
sra-tools: 数据下载
-
fastqc: 查看数据质量
-
cutadapt, trimmomatic: 数据质控
-
star, hisat2: 数据比对
-
samtools: SAM/BAM文件处理
-
subread, htseq: 基因计数
-
conda的教程推荐看https://www.jianshu.com/p/edaa744ea47d
接着你得下载如下数据:
-
参考基因组序列: 在 http://www.ensembl.org/ 上下载 GRCh38的参考基因组序列
-
注释文件:在 http://www.ensembl.org/ 上下载 GRCh38 对应的注释GFF文件
-
SRR数据:编号为 SRR4820707,SRR4820708, SRR4820709,SRR4820710, SRR4820727, SRR4820728, SRR4820729, SRR4820730
第一周的视频如下:https://space.bilibili.com/249108235