Kysymys:
Työkalut, joilla luodaan kommentoitu taulukko muunnelmista VCF: stä
roblanf
2017-08-11 03:44:41 UTC
view on stackexchange narkive permalink

Ongelma: Minulla on VCF-tiedosto, viitegenomi ja joukko merkintöjä viitteelle (geenit, toistuvat alueet jne.) GFF- tai BED-tiedostoina.

Mitä haluaisin on työkalu, joka vie kaiken tämän syötteeksi ja tuottaa välilehdellä tai pilkuilla erotetun taulukon, joka sisältää mahdollisimman paljon tietoa. Lähdön potentiaaliset sarakkeet sisältävät:

  1. Vaihtoehdon tyyppi (SNV, rakenteellinen jne.)
  2. Muunnelman yksityiskohdat (esim. Vertailupohja, muunnospohja, kattavuus, sijainti jne.) )
  3. Varianttien päällekkäiset merkinnät
  4. Varianttien lähellä olevat merkinnät (esim. onko se vain ylävirtaan geenistä)
  5. Jos se esiintyy koodaavalla alueella, muuttaakö se aminohappo.

On monia työkaluja, jotka tekevät jotain tällaista . Mutta aloittelijalle (kuten minä) ei ole selvää, millä työkaluilla kannattaa aloittaa. Koska suurin osa työkaluista vaatii vain vähän vaivaa saadakseen työn aluksi, kysymykseni kuuluu:

Mikä työkalu on lähinnä kuvaamani tekemistä, luotettava ja todennäköisesti ylläpidetty tulevina vuosina.

Kolme vastused:
Cotton Seed
2017-08-14 09:20:38 UTC
view on stackexchange narkive permalink

Hail voi olla vaihtoehto sinulle.

Kasvava tiimi Broadissä kehittää sitä aktiivisesti. Se on testattu tarkasti (jatkuva integrointi, jatkuva käyttöönotto, virheraportit saavat regressiotestejä, bla bla bla bla).

Se on suunniteltu ratkaisemaan tämä ongelma (muun muassa). Se voi tuoda erilaisia ​​muotoja, mukaan lukien VCF, TSV, UCSC BED, JSON ja intervallitiedostot. (Meillä ei ole nimenomaista tukea GFF: lle, mutta voimme todennäköisesti käsitellä niitä yleisillä palveluilla. Jos ei, ota yhteyttä ja lisäämme tukea.) Se voi soittaa VEP: lle (ja pian Nirvana, Illuminan VEP-kirjoitus) . Sillä on yleiset mahdollisuudet tietojen muuntamiseen, suodattamiseen, puhdistamiseen ja kyselyihin.

Lisäksi olemme kuratoineet suuren joukon merkintäresursseja (tällä hetkellä ~ 22 tietokantaa merkinnöistä + VEP), jotka isännöivät julkisessa ämpärissä. Google-pilvessä ja rakensi interaktiivisen kyselyn rakennustyökalun valitsemaan käytettäviä resursseja. Ota yhteyttä, jos haluat meidän lisäävän resursseja. Voit lukea lisää siitä täältä.

Vastuuvapauslauseke: Työskentelen Hailin kanssa.

Olen jättänyt hyväksytyn vastauksen FEATnotatoriksi vain siksi, että tämä näyttää tekevän juuri sen, mitä kysyin kysymyksessä. Mutta halusin kiittää, kun kerroit minulle (meille?) Hailista, mikä kuulostaa varmasti erittäin hyödylliseltä. Aktiivinen kehitys ja avoimuus ominaisuuspyyntöihin on valtava plus.
dkainer
2017-08-11 11:50:41 UTC
view on stackexchange narkive permalink

Olen käyttänyt FEATnotatoria ja uskon, että se pystyy tarjoamaan kaikki haluamasi sarakkeet. Luotuja tiedostoja on paljon, mutta yhdistetyssä tuotoksessa on seuraavat sarakkeet:

  • kromosomi
  • sijainti
  • sarake_3
  • Consensus_Allele
  • merkinnän_allekirjoitus
  • Reference_Base
  • Alternate_Base
  • Transition / Transversion SNP_Type
  • ennenaikainen_STOP_Gained STOP_Lost
  • START_CODON
  • STOP_CODON
  • SPLICE_SITE
  • Geenien välinen
  • Gene_Body
  • Intron
  • Exon
  • Koodaus
  • UTR
  • Transcription_Start_Site
  • Lähin_geeni
  • Etäisyys

Tässä on muutamia esimerkkitulostietueita VCF: n, viittausgenomin ja GFF-merkintätiedoston käytöstä (anteeksi huonosta muotoilusta ... kenttiä on paljon!):

  Chr01 28177 TG NA TG-SIIRTO NA EI EI EI EI EI KYLLÄ EI EI EI EI EI EI EI EI Eucgr.A00211.v2.0 16054Chr01 44876 CG-geeni: Eucgr.A00211.v2.0 mRNA: Eucgr.A00211.1.v2.0 [introni] CG-SIIRTYMÄ NA EI EI EI EI EI EI KYLLÄ KYLLÄ EI EI EI EI NA NAChr01 46819 AG-geeni: Eucgr.A00211 .v2.0 mRNA: Eucgr.A00211.1.v2.0 CDS: Eucgr.A00211.1.v2.0.CDS.4 [AAA - K = > GAA - E (MISSENSE)] eksoni: Eucgr.A00211.1 .v2.0.exon.4 AG-SIIRTYMISPISTE EI EI EI EI EI EI EI KYLLÄ EI KYLLÄ KYLLÄ EI EI EI NA NA  
arupgsh
2017-08-11 12:39:25 UTC
view on stackexchange narkive permalink

snpEff on loistava työkalu VCF-tiedostojen merkitsemiseen ja voit lisätä mukautettuja viitesekvenssejä.

http://snpeff.sourceforge.net/

Opas mukautettujen merkintätiedostojen lisäämiseksi snpEffiin

https://gatkforums.broadinstitute.org/gatk/discussion/50/adding-genomic-annotations-using-snpeff-and-variantannotator

Tietokannassaan on joukko valmiiksi kuratoituja merkintätiedostoja.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.
Loading...