Tämä kysymys on jatkoa sivulle Kuinka kmer-laskurit määrittävät, mikä kmer on "kanoninen"?.
Tässä kysymyksessä saimme tietää, että kmer-laskentaohjelmat käyttävät 2- bit hash -toiminto edustamaan sisäisesti kanonisia km-käyttäjiä laskettaessa niitä.
Mietin nyt, kuinka voimme toteuttaa tällaisen funktion C / C ++: ssa tai pythonissa? Enemmän mielivaltaisesti, kuinka voin laskea kanonisen kmer-hash-arvon matemaattisen funktion avulla?
Kuinka muuntaisimme esimerkiksi 3-mer GAT
tai 21-mer
hash (GAT) == hash (ATC) hash (GAATACCATAGGATA) == hash (TATCCTATGGTATTC)