暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

vcf格式数据处理-软件bedtools

罗大黑学生信 2021-07-11
2672

目录

1. 简介

2. 软件下载安装

3. 常用的情况


简介

        Bedtools一款用于对genomicfeatures进行比较、相关操作和注释的工具在2009年被开发出来。目前版本已经有三十多个工具/命令用以实现各种不同的功能,可以针对bed、vcf、gff等格式的文件进行处理。

软件下载安装

通过Github从源代码编译稳定版本的bedtools。

wget https://github.com/arq5x/bedtools2/releases/download/v2.30.0/bedtools-2.30.0.tar.gz


tar -zxvf bedtools-2.30.0.tar.gz


cd bedtools2
make


常用的情况

注意事项:BED文件的起始位置以0开始,终止位置以1开始。VCF文件的坐标是以1开始

#chrom  start  end
chr1 0 1


intersect

用各种不同的方式寻找重叠区域

bedtools intersect [OPTIONS] -a <FILE> \
-b <FILE1, FILE2, ..., FILEN>


任务:从bam 文件提取覆盖到panel (bed 文件)的序列。

cat NRAS.C-T.bed
1 115258667 115258801


bedtools intersect -a S2000332-L1.gencore.bam -b NRAS.C-T.bed >NRAS.C-T.gencore.bam


任务:从bam 文件提取覆盖到panel (bed 文件)的序列,并转为bed格式

bedtools intersect -a ../S2000332-L1.sort.bam -b NRAS.C-T.bed  -bed


bamtobed

将bam文件转换为BED格式

bedtools bamtobed -i NRAS.C-T.sort.bam >NRAS.C-T.sort.bed


bedtools bamtobed -cigar -i NRAS.C-T.sort.bam > NRAS.C-T.sort.bed


参数

描述

bamtobed

将bam文件转换为BED格式

bamtofastq

将bam文件转换为FASTQ格式

coverge

计算特定区间的覆盖

genomecov

从整个基因组计算覆盖深度

getfasta

从FASTA文件中提取序列

merge

合并重叠区间形成一个新的区间

sort

对区间进行排序





参考:

https://www.jianshu.com/p/f8bbd51b5199

https://www.jianshu.com/p/8eb9c8fd454b










文章转载自罗大黑学生信,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论