Kysymys:
GRCh38-centromerien kartoitettavuus
719016
2017-08-14 13:33:43 UTC
view on stackexchange narkive permalink

Onko GRCh38-genomiviitteessä olevien centromerien kartoitettavuus samanlainen?

Sikäli kuin muistan GRCh38: n ilmestymisen, sentromerien sekvenssi määritettiin sekvensointidatan yhdistelmällä ja ohjelmistojen ennakointi.

Ottaen huomioon tavan, jolla sentromerien sekvenssi on määritetty, pitäisikö meidän odottaa, että Illumina 2x150bp (tai lyhyempi, 2x75bp) lukemat kartoitetaan suhteellisen tasaisesti kaikkiin sentromeerisekvensseihin?

Kaksi vastused:
gringer
2017-08-14 15:49:09 UTC
view on stackexchange narkive permalink

Epäilen sitä, ellet kysy, olisiko kartoitus yhtä huono kaikille sentromereille. Tässä on joitain toistuvia rakenteita (luultavasti ei sentromeerisiä), jotka olen löytänyt nanohuokosissa lukemalla "ihmisen" näytteen NA12878, jonka on tuottanut nanohuokoset-WGS-yhteenliittymä:

Repetitive human reads #1

Nämä rakenteet ovat johdonmukaisia, koska ne toistuvat useita kertoja, mutta sisäiset mallit voivat olla melko erilaisia. Tässä on muutama lisää:

Repetitive human reads #2

Koska sentromeerien on oltava ainutlaatuisesti yhdistettävissä yhteen kromosomiin, minulla olisi järkevää, jos sentromeerin sisäinen rakenne on ainutlaatuinen kullekin kromosomille.

On mahdollista, että käytössä on erittäin toistuvia rakenteita, jotka eivät kartoita toisiaan. Vaikka en ole kaivautunut liian syvälle ihmisen lukemiin, olen tarkastellut kootun jyrsijäparasiitin ( Nippostrongylus brasiliensis ) genomin viittä eniten kokoonpuristuvaa aluetta, enkä löytänyt niiden välillä sisäisiä yhtäläisyyksiä:

Nippo most-compressible regions

Yksi Illuminan kokoonpanon ongelmista on, että nämä erittäin toistuvat alueet romahtavat yhdeksi toistoksi (tai parhaimmillaankin) alue, joka on enintään kaksi kertaa fragmentin pituus). Sisäisillä toistoyksiköillä, joiden identiteetti on yli 98%, todellisen sekvenssin kokoaminen on erittäin vaikeaa, vaikka tarkat tiedot parillisesta lukemisesta. Vaikka tämä olisi mahdollista, lukemisen sijoittaminen voi olla mahdotonta, koska useat sisäiset yksiköt voivat olla identtisiä (tai vastaavasti erilaisia) sekvensoidun lukemisen kanssa.

user172818
2017-08-18 09:54:39 UTC
view on stackexchange narkive permalink

Pitäisikö meidän odottaa, että Illumina 2x150bp (tai lyhyempi, 2x75bp) -lukemat kartoitetaan suhteellisen tasaisesti kaikkiin sentromeerisekvensseihin? On pitkään todettu, että erilaiset kromosomit liittyvät erilaisiin sentromeerisekvensseihin. Joskus on mahdollista sanoa, mistä chr: stä luku on peräisin, sen järjestyksen perusteella.

GRCh38-centromeerit ovat hankalampia. Muistan, että sentromeeriset sekvenssit tuotettiin laskennallisesti Markerin ketjulla (tai vastaavalla), joka oli mallinnettu Venterin genomin mukaan. GRC pystyy erottamaan useimmat kromosomit, mutta ei kaikki. Jotkut alfaryhmät sijoitetaan 2 tai 4 kromosomiin. Alkuperäinen GRCh38 säilyttää kaikki 4 kopiota. Kun lataat GRCh38 kartoitusta varten, vain yksi kopio säilyy. lisäkopiot peitetään kovaäänisesti yhdessä chrY: n PAR: n kanssa.

Jos haluat tietää enemmän, katso tämä paperi ja tämä.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.
Loading...