Question: DP and DP at site do not match using only 1 sample in VCF
0
gravatar for ajuiwl
13 months ago by
ajuiwl30
ajuiwl30 wrote:

I only used 1 sample with BWA and GATK4 germinal variants. The final VCF has variants like this:

1       230451938       .       G       A       18.25   PASS    AC=1;AF=0.500;AN=2;BaseQRankSum=0.967;ClippingRankSum=0.00;DP=20;ExcessHet=3.0103;FS=4.771;MLEAC=1;MLEAF=0.500;MQ=60.00;MQRankSum=0.00;QD=6.08;SOR=2.225 GT:AD:DP:GQ:PGT:PID:PL  0/1:1,2:3:10:0|1:230451938_G_A:46,0,10

How is it possible that both DP are not the same if I am using one sample?

This is the BAM by samtools tview. The position #230451938 is the first one.

  230451941 230451951 230451961 230451971
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
A      CATACATATGTACACATGTGTATATGTGTATACATACATATGTG
ATGTGT     catatgtacacatgtgtatatgtgtatacatacatatgtg
GTGTATACATA   ATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTAC     TGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACA    TGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGT        ATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATG       atacatatgtg
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
gtgtatacatacatatgtacacatgtgtatatgtgtatacatacatatgtg
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
gtgtatacatacatatgtacacatgtgtatatgtgtatacatacatatgtg
GTGTATACATACATATGTACACATGTGTATATGTGTATACATACATATGTG
gatk variant calling vcf • 333 views
ADD COMMENTlink modified 13 months ago • written 13 months ago by ajuiwl30
1
gravatar for finswimmer
13 months ago by
finswimmer12k
Germany
finswimmer12k wrote:

Hello ajuiwl ,

AFAIK the DP in the INFO column represents the total number if reads covering the site excluding those that are below a given quality treshold (like mapping quality). The DP in the Sample column is the total number of reads that support the genotypes that were called. GATK's HaplotypeCaller discards the mapping/alignment informations for the reads around the variant and do a denovo assembly for this region. After that it looks which haplotype is the most likely and will report the number of reads that build that haplotype. So there can be a discrepance between these two DP values.

fin swimmer

ADD COMMENTlink written 13 months ago by finswimmer12k
Please log in to add an answer.

Help
Access

Use of this site constitutes acceptance of our User Agreement and Privacy Policy.
Powered by Biostar version 2.3.0
Traffic: 1766 users visited in the last hour