Minulla on eukaryoottinen genomi, jolle päivitetysti saatiin päivitetty sekvenssi kromosomille. Haluan kartoittaa RNAseq-lukemat genomista (ja suorittaa muita alavirran analyysejä) ja haluaisin käyttää mahdollisimman ajantasaista tietoa (joten kyseisen kromosomin 'uusi' sekvenssi).
Ennen lukemiskartoituksen tekemistä haluaisin kuitenkin päivittää genomini (GFF3) merkinnän vastaamaan tämän kromosomin 'uusia' koordinaatteja.
Haluan pohjimmiltaan siirtää tietoja vanhojen koordinaattien GFF3: sta saadaksesi uuden koordinaatit GFF3: n ja säilyttää mahdollisuuksien mukaan kaikki tiedoston tiedot / hierarkian (geeni, mRNA, eksoni jne.).
chrXX-lähdegeeni 222 5942. -. ID = geeni_1; nimi = geeni_1; pituus = 5720chrXX-lähde-mRNA 222 5942. -. ID = geeni_1,1; Vanhempi = geeni_1; Nimi = geeni_1,1; pituus = 5720chrXX-lähde eksoni 222 5794. -. ID = geeni_1.1.2; vanhempi = geeni_1.1chrXX-lähde eksoni 5889 5942. -. ID = geeni_1.1.1; vanhempi = geeni_1.1chrXX-lähde CDS 222 5794. - 1 ID = CDS: geeni_1.1.2; vanhempi = geeni_1.1; nimi = geeni_1.1chrXX-lähde CDS 5889 5942. - 0 ID = CDS: geeni_1.1.1; vanhempi = geeni_1.1; nimi = geeni_1.1
... tulisi päivittää muotoon ...
chrXX-lähdegeeni 333 6053. -. ID = geeni_1; nimi = geeni_1; pituus = 5720chrXX-lähde-mRNA 333 6053. -. ID = geeni_1.1; vanhempi = geeni_1; nimi = geeni_1,1; pituus = 5720chrXX-lähde eksoni 333 5905. -. ID = geeni_1.1.2; vanhempi = geeni_1.1chrXX-lähde eksoni 6000 6053. -. ID = geeni_1,1,1; vanhempi = geeni_1,1chrXX-lähde CDS 333 5905. - 1 ID = CDS: geeni_1.1.2; vanhempi = geeni_1.1; nimi = geeni_1.1chrXX-lähde CDS 6000 6053. - 0 ID = CDS: geeni_1.1.1; vanhempi = geeni_1.1; nimi = geeni_1.1
Yritin kokeilla (mutta en ole varma siitä on tapa tehdä se):
- Pura kaikkien ominaisuuksien sekvenssi, jotka päivitetään fastaksi (
bedtools getfasta
) - Yhdistä nämä sekvenssit päivitettyyn kromosomiin (
gmap
kanssa--nosplicing
, koska kartoittamamme sekvenssit vastaavat genomisia alueita). - Luo päivitetty GFF3-tiedosto. Tätä tehdessäni käytän yhtä lisäsääntöä: jos ominaisuus on kartoitettu toisessa kromosomissa, mutta päivitetyssä kromosomissa oli myös toinen kohdistus, priorisoi sama, joka vastaa samaa (päivitettyä) kromosomia.
Mikä olisi oikea tapa tehdä sellainen? Kaikki ehdotukset menetelmistä / työkaluista ovat tervetulleita!