2019-08-28-第一周 从环境配置开始

学转录组入门生信系列文章二

Posted by DL on August 28, 2019

来源:生信媛公众号。

我们第一周目标有三个:

  • 熟悉Linux环境

    • 登录服务器

    • Linux基本命令

    • PATH的意义

  • 学习conda管理环境

    • 如何在conda中添加channel

    • 如何用conda安装和卸载软件

    • 如何创建新的环境和切换环境

  • 数据准备

    • 参考序列

    • 注释信息

    • 测序数据

首先,你需要有一个Linux环境,Windows10用户可以安装WSL,MacOS请在应用程序中搜索终端

  • Windows10配置WSL: https://linux.cn/article-9545-1.html

  • MacOS的环境配置: https://blog.csdn.net/orangleliu/article/details/47357339

然后,你需要学一些基础的Linux的命令操作,如下是鸟哥的Linux私房菜的对应链接

  • 目录管理:http://linux.vbird.org/linux_basic/0210filepermission.php

  • vim使用说明: http://linux.vbird.org/linux_basic/0310vi.php

  • shell基础: http://linux.vbird.org/linux_basic/0320bash.php 中的10.1,10.2,10.3和10.4

  • 再接着你需要用conda安装如下软件

    • sra-tools: 数据下载

    • fastqc: 查看数据质量

    • cutadapt, trimmomatic: 数据质控

    • star, hisat2: 数据比对

    • samtools: SAM/BAM文件处理

    • subread, htseq: 基因计数

conda的教程推荐看https://www.jianshu.com/p/edaa744ea47d

接着你得下载如下数据:

  • 参考基因组序列: 在 http://www.ensembl.org/ 上下载 GRCh38的参考基因组序列

  • 注释文件:在 http://www.ensembl.org/ 上下载 GRCh38 对应的注释GFF文件

  • SRR数据:编号为 SRR4820707,SRR4820708, SRR4820709,SRR4820710, SRR4820727, SRR4820728, SRR4820729, SRR4820730

第一周的视频如下:https://space.bilibili.com/249108235