vcf-merge
(tai parempi: bcftools merge
) yhdistää VCF-tiedostojen sarakepohjaisen pohjan ja ottaa jokaiseen muunnokseen periaatteessa uuden genotyyppisarakkeen. Vaikka tällainen toimii, siinä ei oteta huomioon kaikkia tietoja muunnelmista. Yhden VCF-tiedoston alueella voi olla matala peitto, mikä osoittaa poiston, mutta poisto on havaittavissa vain, kun otetaan huomioon muut näytteet, joilla on korkea peittoalue samalla alueella. On myös mahdollista, että INDEL-arvot voidaan määritellä eri tavoin eri näytteissä, mikä edellyttää ylimääräistä bcftools norm
-vaihetta vasemmalle normalisoimiseksi ennen yhdistämistä.
Oletetaan, että tämä sarakepohjainen yhdistäminen on mitä haluat (ja jos ei, niin bcftools concat
on ystäväsi rivipohjaisessa yhdistämisessä), on parempi uudistaa yhdistetty VCF-tiedosto suoraan monisarakkeisena tiedostona. Yksi tapa tehdä tämä on syöttää kaikki BAM-tiedostot samtools mpileup
-ohjelmaan genotyypin todennäköisyyksien luomiseksi, minkä jälkeen tulos syötetään bcftools call
-tietoon. Jotain seuraavanlaista:
samtools mpileup -uf ref.fa in1.bam in2.bam in3.bam | \ bcftools kutsu -mv -O z -o variant_ref_1-3.vcf.gz