Suoritan tällä hetkellä suuren RNA-seq-analyysin hiirten PBMC: stä. Aineisto sisältää noin 6000 transkriptoottista profiilia, ja haluaisin käyttää DESeq2: ta tunnistamaan erilaisten ekspressoitujen geenien joukot eri olosuhteissa. Minulla on yhteensä 100 biologista stimulaatiota, ja jokaiselle stimulaatiolle minulla on 30 kontrollinäytettä ja 30 näytettä, joita on käsitelty kiinnostavalla molekyylillä (niin on: (30 kontrollia + 30 käsiteltyä) * 100 stimulaatiota = 6000 näytettä).
Haluan tunnistaa jokaiselle stimulaatiolle erilaisten ekspressoitujen geenien sarjat kontrollinäytteiden ja käsiteltyjen näytteiden välillä. En halua verrata näytteitä eri stimulaatioista. Haluaisin, että minulla olisi yhteensä 100 luetteloa eri tavoin ilmaistuista geeneistä.
Olen alkanut käyttää deseq2: ta näiden luetteloiden tunnistamiseen, mutta deseq2 viettää paljon aikaa vertailujen tekemiseen, joista en ole kiinnostunut (vertailut biologisten stimulaatioiden välillä).
Minulla on toistaiseksi taulukon sampleTable, joka näyttää tältä:
Käytän DEseq2: ta seuraavalla komennolla:
DESeqDataSetFromHTSeqCount (sampleTable = sampleTable, hakemisto = hakemisto, design = ~ condition)
Voisitko auta minua siinä? Kuinka voin määritellä deseq2: lle, ettei suoriteta vertailuja biologisten stimulaatioiden välillä, vaan pikemminkin kontrollin ja käsitellyn näytteen välillä jokaisessa stimulaatiossa?