Epäilen sitä, ellet kysy, olisiko kartoitus yhtä huono kaikille sentromereille. Tässä on joitain toistuvia rakenteita (luultavasti ei sentromeerisiä), jotka olen löytänyt nanohuokosissa lukemalla "ihmisen" näytteen NA12878, jonka on tuottanut nanohuokoset-WGS-yhteenliittymä:
Nämä rakenteet ovat johdonmukaisia, koska ne toistuvat useita kertoja, mutta sisäiset mallit voivat olla melko erilaisia. Tässä on muutama lisää:
Koska sentromeerien on oltava ainutlaatuisesti yhdistettävissä yhteen kromosomiin, minulla olisi järkevää, jos sentromeerin sisäinen rakenne on ainutlaatuinen kullekin kromosomille.
On mahdollista, että käytössä on erittäin toistuvia rakenteita, jotka eivät kartoita toisiaan. Vaikka en ole kaivautunut liian syvälle ihmisen lukemiin, olen tarkastellut kootun jyrsijäparasiitin ( Nippostrongylus brasiliensis ) genomin viittä eniten kokoonpuristuvaa aluetta, enkä löytänyt niiden välillä sisäisiä yhtäläisyyksiä:
Yksi Illuminan kokoonpanon ongelmista on, että nämä erittäin toistuvat alueet romahtavat yhdeksi toistoksi (tai parhaimmillaankin) alue, joka on enintään kaksi kertaa fragmentin pituus). Sisäisillä toistoyksiköillä, joiden identiteetti on yli 98%, todellisen sekvenssin kokoaminen on erittäin vaikeaa, vaikka tarkat tiedot parillisesta lukemisesta. Vaikka tämä olisi mahdollista, lukemisen sijoittaminen voi olla mahdotonta, koska useat sisäiset yksiköt voivat olla identtisiä (tai vastaavasti erilaisia) sekvensoidun lukemisen kanssa.