GATK 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
GATK 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
GATK 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
GATK 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
GATK 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !
授权协议 BSD-3-Clause
开发语言 Java 查看源码 »
操作系统 跨平台
软件类型 开源软件
所属分类 大数据
开源组织
地区 不详
投 递 者 诺墨
适用人群 未知
收录时间 2019-12-23

软件简介

GATK 是 Genome Analysis ToolKit 的缩写,是一款从高通量测序数据中分析变异信息的软件,是目前最主流的 snp calling 软件之一。GATK 设计之初是用于分析人类的全外显子和全基因组数据,随着不断发展,现在也可以用于其它的物种,还支持 CNV 和 SV 变异信息的检测。

项目同时提供了完整的分析流程 GATK Best Practices。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
暂无内容
2019/07/15 18:12

GATK之HaplotypeCaller

GATK的主要功能其实就是识别变异位点,其他功能都是锦上添花。所以这一次学习GATK寻找变异位点的工具。 在GATK的文档中,与变异位点识别相关的有9个工具,分别是: Name Summary ApplyRecalibration Apply a score cutoff to filter variants based on a recalibration table CalculateGenotypePosteriors Calculate genotype posterior likelihoods given panel data GATKPaperGenotyper Simple Bayesian genotyper used in th...

0
0
2020/01/05 17:28

GATK BQSR的意义与作用

欢迎关注"生信修炼手册"! BQSR 全称叫做 Base Quality Score Recalibration, 可以理解为碱基质量校正。对于变异位点的鉴定,碱基质量是非常重要的。比如测序识别到的一个位点,其碱基和参考基因组上的碱基不同,但是其质量值特别低,此时可以认为是一个测序错误,而不是一个SNP位点。 在测序的原始数据中,本身就提供了每个碱基对应的质量值,但是GATK官方认为测序仪提供的碱基质量值,是不准确的,存在误差的。 某个位点前后...

0
0
2020/06/29 17:05

GATK官方推荐的workflow语言-WDL

欢迎关注"生信修炼手册"! 在GATK4的best practice中,不再像以前那样给出每个步骤对应的代码,而是直接给出了官方使用的pipeline。这些pipeline采用WDL进行编写。 WDL是一种流程编写语言,没有太多复杂的逻辑和语法,入门简单。首先看一个hello world的例子 workflow myWorkflow {    call myTask } task myTask {    command {        echo "hello world"    }    output {        String out = read_s...

0
0
2020/05/30 22:55

GATK推荐的序列存储格式-uBAM

欢迎关注"生信修炼手册"! 二代测序平台产生的数据通常用fastq格式进行存储,fastq 存储了我们最关心的序列和碱基质量的信息。就测序而言,这样的信息当然是足够了。但是对于分析而言,还缺少了一点信息。 给你一个fastq文件,你最多可以看出来样本名,测序平台,测序读长等基本信息,如果想知道测序类型(是WES, WGS 还是RNA-seq), 样本的采样信息,样本的分组信息,这些信息从fastq 文件是无法得到的。这些实验相关的数据,称...

0
0
发表了博客
2020/08/03 14:25

下载GATK中存储的snp vcf文件

下载GATK中存储的snp vcf文件 写这篇文章的目的是为了以后不迷路,哈哈。我可是花了很长时间二次查找。 GATK是我们在找somatic snp时经常会用到的工具,它可以对可能存在小插入或者缺失的位点进行重新排列和校准! GATK里存储了很多版本的vcf文件 以下载hg38版本为例 网址为ftp://ftp.broadinstitute.org/bundle/hg38/ 我们可以在服务器上直接下载 wget -b -c ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38/10...

0
0
发表了博客
2019/08/14 19:22

GATK流程--利用Pegasus : bwa算法简介

一 Pegasus是一个Workflow Management System。 利用它,设计一个DAG图作为一连串任务的流程,方便的进行并行、串行,并可从错误中恢复。 二、更多信息 https://pegasus.isi.edu/about/ 三、GATK illumina NGS的原理 https://blog.csdn.net/u010608296/article/details/88831797 Gatk Best Practice:https://software.broadinstitute.org/gatk/best-practices/workflow?id=11165 ① 将Reads比对到参考基因组上:BWA BWA :Bur...

0
0
2018/12/02 11:19

我应该如何正确设置GATK VQSR的模型训练参数?

今天,只分享一个精选内容。全文3116字,阅读8分钟。 ----/ BEGIN /---- 变异的质控,是我们在得到变异数据之后,接下来最重要的一个步骤。通常我们都是使用GATK VQSR模块来完成这个事情,关于VQSR的基本原理我在这篇文章中有写,但暂时不算详细。下面是大家经常都会用到的VQSR基本命令(以GATK4为例): ## 首先是SNP mode time $gatk VariantRecalibrator \    -R $reference/Homo_sapiens_assembly38.fasta \    -...

0
0
2017/09/28 23:36

GATK中如何计算Inbreeding coefficient(近交系数)

这是我个人博客上一篇小短文,文章很短,预计2分钟可以读完,今天有同事问到了这个问题,因此就重新在这里分享出来。 关于近交系数是什么的定义,除了英文资料,中文上也给出了很清晰的定义,这里引用一下: 近交系数(inbreeding coefficient)是指根据近亲交配的世代数,将基因的纯化程度用百分数来表示即为近交系数,也指个体由于近交而造成异质基因减少时,同质基因或纯合子所占的百分比也叫近交系数,普遍以F或f来表示。 ...

0
0
发表于AI & 大数据专区
2019/11/11 22:19

最新版针对RNA-seq数据的GATK找变异流程

本文分享自微信公众号 - 小明的数据分析笔记本(gh_0c8895f349d3)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
2 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部