Kysymys:
Arvioi poly-A-pyrstöjen pituus satunnaisesti alustetuista RNAseq-tiedoista
ShanZhengYang
2017-11-24 03:21:47 UTC
view on stackexchange narkive permalink

Poly-A-pyrstö on siis pitkä adeniininukleotidiketju, joka lisätään messenger-RNA (mRNA) -molekyyliin RNA-prosessoinnin aikana molekyylin stabiilisuuden lisäämiseksi.

Projektissani minä haluaisi arvioida poly-A-pyrstöjen pituuden satunnaisesti alustetuista RNAseq-tiedoista.

Onko ideoita miten tämä voitaisiin tehdä? Onko tällä hetkellä algoritmeja / työkaluja?

Ehkä minun pitäisi mallintaa tämä jotenkin? Kaikki ehdotukset arvostettiin

Miksi sinulla on satunnaisesti alustettu RNAseq-data? Minkä organismien kanssa työskentelet (tai se on sekoitus tai simuloitu data)? Mitä olet etsinyt projektissasi? Onko poly-A-pyrstöpituuksilla ehkä tietokantaa?
@Llopis HeLa -solut. Mutta haluaisin tehdä tämän myös muutamille muille organismeille. "Onko poly-A-hännän pituuksia mahdollisesti tietokantaa?" Sen pitäisi olla dataan perustuva mittaus
Kaksi vastused:
Konrad Rudolph
2017-12-01 23:27:18 UTC
view on stackexchange narkive permalink

Ei voida tehdä. Jos olet jo sekvensoinut, pelkään, että rahat menevät hukkaan (ellei tietenkään ole hyviä tietoja jollekin muulle).

Illumina-vakiojohdin ei toimi hyvin homopolymeerien kanssa ja kutsuu näin ollen väärää poly (A) pituudet.

Narry Kimin laboratorio kehitti muun muassa tämän ongelman ratkaisemiseksi erityisen menetelmän - TAIL-seq. Se on kirjaston valmistelun protokolla, jossa käytetään biotiinilla merkittyjen pyrstöjen pudotusta (satunnaisen pohjustuksen sijaan), sekä oma basecalling-ohjelmisto, joka käyttää piikkejä kalibrointiin.

Varoita kuitenkin: protokolla on tiettävästi teknisesti haastava ja jotta voit käyttää sitä, tarvitset Illumina-koneen, joka antaa sinulle pääsyn raakakuvatiedostoihin ennen perussoittoa . Ajantasaiset Illumina-koneet eivät anna sinulle näitä tiedostoja. Joten sinun on löydettävä kone, joka käyttää vanhentunutta laiteohjelmistoa.

(Tämä on kopio [vastauksestani Redditiltä] (https://www.reddit.com/r/bioinformatics/comments/7f2k8r/estimate_the_length_of_polya_tails_from/dq9zbrw/); Huomasin tämän kysymyksen vasta täällä.)
Kiitos. Luultavasti poistan Reddit-kysymyksen pian, joten linkki rikkoutuu.
gringer
2017-11-24 04:12:06 UTC
view on stackexchange narkive permalink

Etsi vain polyA-traktaatteja sekvenssien lopusta ja laske ne, jos ne ovat suurempia kuin ~ 18 emästä. Olen tehnyt tämän MinION-cDNA-lukemilla kartoittamalla polyA-sovitinsekvenssin (pitkänomaisella polyA-sekvenssillä) lukemiin LAST-toiminnolla ja määrittämällä kohdistetun sekvenssin pituuden.

Valitettavasti, koska cDNA-sovitin päättyy TVN-sekvenssillä eikä TTT: llä, sovittimen sitominen ei välttämättä ole hyvä esitys todellisesta polyA-pituudesta. Odotan, että Illuminan sovittimilla on samanlaiset ongelmat, ellei jopa pahemmat (lukupituuksien rajojen takia).

PolyA-pituuksien luokittelemiseksi voidaan ehkä käyttää suoraa RNA-sekvensointia, mutta olen vielä tarkastelematta julkisia suoran RNA-aineistoja. Siinä tapauksessa, että olet kiinnostunut etsimään itseäsi, tässä on NA12878: n suora RNA-tietojoukko upealta nanohuokos-WGS-konsortiolta:

https://github.com/nanopore-wgs-consortium/ NA12878 / blob / master / RNA.md

Tässä on yhteenliittymän kaavio, joka esittää polyA-pituuden:

direct RNA polyA lengths

"> Saattaa olla mahdollista käyttää suoraa RNA-sekvensointia luokittelemaan paremmin polyA-pituudet, mutta en tunne mitään käytettävissä olevia julkisia tietojoukkoja." Tätä ei voida mitenkään päätellä omasta tietojoukostani?
Oletko tehnyt suoran RNA-sekvensoinnin MinION: lla?
Ei, mielestäni ymmärrän väärin viittausta "julkisiin tietojoukoihin"
Suora RNA-sekvensointi on hyvin uusi tekniikka, joka voidaan tehdä vain MinION-laitteella. Siitä ei ole vielä paljon tietoa käytettävissä.


Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.
Loading...