大家好,欢迎来到IT知识分享网。
Indel (Insertion and Deletion)分析简介
InDel 简介
InDel 是指基因组中小片段的插入或缺失序列,其长度在 1-50bp 之间。原因在于Illumina测序的reads(读长)大小为100bp左右,包括单端测序(single-end, 100bp),双端测序(paired-end,2 x 100bp)两种。因此在序列比对SNP calling时,能够检测到的可靠的Indel大多小于100bp,通常最大在50bp左右。 Small InDel 变异一般比SNP 变异少,同样反映了样品与参考基因组之间的差异,编码区的 InDel 会引起移码突变,导致基因功能的变化。
用GATK对RNA-seq做数据做 INDEL分析流程:
- 用STAR软件将数据比对到参考基因组(mapping to the reference)。
- 用picard的markduplicates命令进行data cleanup。
- 用GATK的SplitNCigarReads包处理cigar里含有N的reads。
- 碱基质量分数重校准(Base Quality Recalibration),就是利用机器学习的方式调整原始碱基的质量分数。
- Variant Calling,Filtering和Annotation。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/157515.html