Olen suorittanut rikastusanalyysin geeniryhmälle. Lähtö on luettelo poluista ja niiden p-arvosta (polut valitaan, koska p-arvo < 0.05). Luettelo on edelleen melko pitkä, joten haluan vähentää sitä. Tätä tarkoitusta varten minulla on laskettu polkujen noppakerroin matriisissa $ p $ x $ p $, jossa $ p $ on luettelossa olevien reittien lukumäärä. Haluan sekä ne, jotka ovat erilaisempia (ne menevät vähemmän päällekkäin, heidän nopan kerroin on pienempi) että polut, jotka edustavat kaikkein samanlaisia reittejä (Joten jos on olemassa 5 reittiä, jotka ovat päällekkäisiä 0,8: n kanssa, ota vain yksi).
Kuinka voin valita eniten edustajapolkuja?
GO: lle on olemassa samanlainen työkalu, mutta se välittää merkityksettömän GO: n hylkäämisen, kun taas tässä kaikki alkupolut ovat jo merkittäviä.
Jos teen klusterin poluista nopan kerroinmatriisin avulla, en tiedä minne (tai miten) leikata.
Yritin käyttää reittejä korkeuden avulla. Mutta en ole varma korkeuden tulkinnasta.
Jotkut muut työkalut, joita olen nähnyt, käyttävät moniulotteista skaalauskaaviota, mutta en ole varma, auttaisivatko sen suorittaminen ja leikkaaminen tietyssä ensimmäisen ulottuvuuden kohdassa.