Jos ymmärrän kysymyksesi oikein, mielestäni pareittain kohdistamisen tapauksessa on olemassa yksinkertainen selitys.
Uskon, että tärkein oivallus on, että: ristiriidan tulisi aina olla parempi kuin aukko . *
Tämä seuraa biologisesti, koska insertio- / deleetio (indel) -nopeus on karkeasti 1/10 substituutioasteen nopeudesta (ts. yksittäisten nukleotidimuutosten esiintyminen), ainakin selkärankaisilla. (Tämä vaihtelee elämän puussa, mutta mielestäni korvausaste ylittää käytännössä aina indel-arvon.)
Ymmärrä miksi tämä on tärkeää, harkitse esimerkkiä:
ATG -AGATGT-G
Tämä on 'mahdoton tasaus' antamiesi todennäköisyyksien alapuolella, koska tässä on siirtyminen aukko-jäännös-tasauksesta jäännös-aukkoon.
Jos oletamme, että ristiriidat ovat todennäköisempiä biologisesti kuin indelit, oikean kohdistuksen tulisi olla:
ATGAGATGTG
Jälkimmäinen näyttääkin kuten parempi suuntaus.
Tämä seuraa myös monimutkaisempia esimerkkejä, joten tämä:
ATG - AAGATGTT-AG
Tästä tulee:
ATG-AAGATGTTAG
(Tai:
ATGA-AGATGTTAG
)
* Tarkoitan tarkkaan, että vaihdon pitäisi saada parempi tulos kuin indel (siihen liittyvien aukkojen avautumis- ja pidennysrangaistusten kanssa). Itse asiassa, jotta oletus olisi aina totta, ristiriitaisuuksien pitäisi silti olla huonompi kuin yksi indel. Tämä ei välttämättä ole aina oikea oletus, harkitse tätä esimerkkiä alla, onko todellinen kohdistustapaus 1) tai 2) vai jotain muuta? Vai onko itse asiassa maailmanlaajuinen kohdistus huono, ja tämä pitäisi jakaa kahteen paikalliseen kohdistukseen? Onko mahdollista biologista mutaatiotapahtumaa selittää tämän? Esitän nämä kysymykset vain osoittaakseni, että se ei ole mustavalkoinen, minulla ei ole selkeitä vastauksia
1)
CGTACGTAGAGGAATGCCCCCCCCC ------ --AGCAACGTAGCAT CGTACGTAGAGGAATG --------- TTTTTTTTAGCAACGTAGCAT
2)
CGTACGTAGAGGAATGCCCCCCCCCAGCAACGTAGCAT CGTACGTAGAGGAGAGETTTTTTT-AGCAACGTAGCAT