Kysymys:
Kuinka voin määrittää DEseq2: n suorittamaan vain vertailut, joista olen kiinnostunut?
Bob
2017-11-04 17:37:07 UTC
view on stackexchange narkive permalink

Suoritan tällä hetkellä suuren RNA-seq-analyysin hiirten PBMC: stä. Aineisto sisältää noin 6000 transkriptoottista profiilia, ja haluaisin käyttää DESeq2: ta tunnistamaan erilaisten ekspressoitujen geenien joukot eri olosuhteissa. Minulla on yhteensä 100 biologista stimulaatiota, ja jokaiselle stimulaatiolle minulla on 30 kontrollinäytettä ja 30 näytettä, joita on käsitelty kiinnostavalla molekyylillä (niin on: (30 kontrollia + 30 käsiteltyä) * 100 stimulaatiota = 6000 näytettä).

Haluan tunnistaa jokaiselle stimulaatiolle erilaisten ekspressoitujen geenien sarjat kontrollinäytteiden ja käsiteltyjen näytteiden välillä. En halua verrata näytteitä eri stimulaatioista. Haluaisin, että minulla olisi yhteensä 100 luetteloa eri tavoin ilmaistuista geeneistä.

Olen alkanut käyttää deseq2: ta näiden luetteloiden tunnistamiseen, mutta deseq2 viettää paljon aikaa vertailujen tekemiseen, joista en ole kiinnostunut (vertailut biologisten stimulaatioiden välillä).

Minulla on toistaiseksi taulukon sampleTable, joka näyttää tältä:

enter image description here

Käytän DEseq2: ta seuraavalla komennolla:

  DESeqDataSetFromHTSeqCount (sampleTable = sampleTable, hakemisto = hakemisto, design = ~ condition)  

Voisitko auta minua siinä? Kuinka voin määritellä deseq2: lle, ettei suoriteta vertailuja biologisten stimulaatioiden välillä, vaan pikemminkin kontrollin ja käsitellyn näytteen välillä jokaisessa stimulaatiossa?

En ole varma, voitko tehdä sen ... miksi et ole kiinnostunut kontrollin ja eri stimulaatioiden hoidon välillä?
üks vastaus:
Devon Ryan
2017-11-05 00:09:02 UTC
view on stackexchange narkive permalink

Voit määrittää tarkat vertailut results () -toiminnossa. Joten:

  dds = DESeqDataSetFromHTSeqCount (sampleTable = sampleTable, hakemisto = hakemisto, design = ~ condition) dds = DESeq (dds) res = tulokset (dds, kontrasti ("ehto", "hoito1") , "control1"))  

Huomaa, että -ehdon ei pitäisi olla " stimul001-control1 , stimul001-control2 jne. ", vaan sen sijaan" stimul001control , stimul001control , stimul001control , stimul001ttractment jne. ". Älä aseta miinusmerkkejä tasoihisi äläkä numeroi näytteitä niihin (ne eivät ole eri ryhmissä.

Viimeinen komento toistetaan jokaiselle vertailulle. Huomaa, että tämä tapahtuu on silti melko hidas näytteiden lukumäärän ja ryhmien lukumäärän vuoksi. Jos sinulla on niin monta näytettä, voit vain tehdä erillisen sampleTable jokaiselle vertailulle, jonka haluat tehdä. Jokainen sisältäisi vain vertailun kannalta merkitykselliset näytteet, eli 60 kussakin.

Vaihtoehtoisesti, jos haluat sovittaa kaikki ryhmät kerralla, on todennäköistä, että limma / voom osoittautuu paremmaksi. Se käyttää erilaisia matematiikka, joka sattuu olemaan nopeampaa suurten mallien kanssa.

BTW, jos hitaus tulee DESeqDataSetFromHTSeqCount () -kohdasta, voit pelastaa kaiken komentorivillä yhdeksi matriisiksi. pari python-riviä tai jopa join -komento voi tehdä sen riittävän nopeasti.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.
Loading...