Miksi valita CNN-vaihtoehto soittajalle

Kysymys:

Miksi valita CNN-vaihtoehto soittajalle

Claudiu Creanga

2018-04-19 19:21:39 UTC

view on stackexchange narkive permalink

Google julkaisi soittajavariantinsa DeepVariant, joka voitti korkeimman SNP-suorituskyvyn palkinnon Precision FDA Truth -haasteessa (99,999% tarkkuudella).

linkitetyn github-repon avulla näemme, että DeepVariant on CNN, tarjoamme kuvia lukemista syötteenä ja kouluttamme hermoverkkoa stokastisella gradientin laskeutumisalgoritmilla.

Minulle tämä on järjetöntä. Miksi käyttää lukemien kuvia, kun sinulla on jo lukutiedot?

https://en.wikipedia.org/wiki/Law_of_the_instrument

Missä näit, että he tarvitsevat kuvia? [Asiakirjoissa] (https://github.com/google/deepvariant/blob/r0.6/docs/deepvariant-details.md) sanotaan, että tulo on bam-tiedosto, aivan kuten kaikki muutkin soittajat.

@terdon Kuvat (tietysti kasauksista) mainitaan [esipainoksessa] (https://www.biorxiv.org/content/early/2018/03/20/092890). Luulen, että he käyttävät myös Inception CNN: ää, jota käytetään voimakkaasti kuvankäsittelyssä. Luulen, että monet ihmiset unohtavat, että kuvat ovat vain matriiseja.

@terdon Näyttää siltä, että ensimmäinen versio oli kuvissa: `` Olemme tehneet useita parannuksia myös metodologiaan. Suurin muutos oli siirtyminen pois RGB-koodatuista (3-kanavaisista) pileup-kuvista ja sen sijaan edustaa kohdistettua lukutietoa monikanavaisen tensoridata-asettelun avulla. "Ja nyt he käyttävät jotain muuta. Kiitos!

Kuten @DevonRyan on jo sanonut, nämä eivät ole kuvia sinänsä. Koneen näkökulmasta kuva on vain joukko matriiseja (yksi kutakin värikanavaa kohden). Sanoisin, että tämä on vain esimerkki huonosta / sekavasta terminologian käytöstä.

Kaksi vastused:

Devon Ryan

2018-04-19 19:37:21 UTC

view on stackexchange narkive permalink

Se on pikemminkin "luettujen kuvien" sijasta lukujen todellisia kuvia. Todellisuudessa he ruokkivat kasaan, joka on vain kirjainten tai numeroiden matriisi (voit tietysti visualisoida tämän kuvana). Tämä on selvempää, jos katsot yhtä heidän esimerkkipython-muistikirjoistaan , CNN: t ovat suosittuja kuvankäsittelykentässä, mutta päivän lopussa kuvat ovat vain suuria arvomatriiseja, joten voit milloin tahansa Muunna syötteesi sellaiseen muotoon, jolloin CNN voi olla hyödyllinen (edellyttäen, että sinulla on riittävästi harjoitustietoja ja joitain grafiikkasuoritimia heittää asioita).

Minusta vastaus on hämmentävä: sanotko, että CNN * ei * syötetä kuvia? Koska tapa, jolla google kuvaa DeepVariantia, he todella luovat pileup-kuvatietoja ja asettavat ne CNN: nsä kautta.

Se ei ole kuva, se on "kuva". DeepVariant ovat tuolloin hieman epäselvät, vaikka päivän lopussa se on moniulotteinen arvomatriisi (sen suhde kuvaan on ilmeinen).

user172818

2018-04-20 03:47:30 UTC

view on stackexchange narkive permalink

Miksi käyttää lukemien kuvia, kun sinulla on jo lukutiedot?

Neuroverkot vievät yhden tai useita N-ulottuvuuksia ) syötteenä; he eivät voi ottaa mielivaltaisia tietoja. Lukujen ja niiden kohdistamisen syöttämiseksi verkkoon sinun on koodattava ne n-d-taulukkoina. Jos jätät toistaiseksi huomiotta "värit", suoraviivainen valinta on (windowLength, readDepth) 2D-matriisi, kuten näet kohdistusselaimessa - se on kuva. Tämän kuvan "värejä" kutsutaan usein "kanaviksi" tai "ominaisuuksiksi" syvällisessä oppimisessa (DL). Ne edustavat perustyyppejä ja peruslaatua deepVariantissa. Loppujen lopuksi saat syötteenä (windowLength, readDepth, nFeatures) 3D-taulukon. Tämä on luonnollisinta koodausta DL-tutkijoille.

Miksi valitsit CNN-vaihtoehdon soittajalle

Tämä johtuu siitä, että CNN on toistuvasti osoittautunut parhaaksi arkkitehtuuri tällaisille (korkeus, leveys, nChannels) 3D-matriiseille syötteenä. Luetut tasaukset ovat täsmälleen sitä.

Historiallisesti huomioiden, deepVariant rakennettiin ensin Googlen vanhentuneen DisBelief-kehyksen päälle, joka ottaa vain RGB-kuvia syötteeksi. Heidän oli puristettava kaiken tyyppinen tieto kolmeen värikanavaan. Nyt TensorFlow-toiminnolla kuvassa voi olla mielivaltainen määrä värikanavia. Tämä yksinkertaistaa toteutusta ja parantaa tarkkuutta. Tämän kuvan lisäksi deepVariant käyttää myös muita tietoja syötteenä.

ⓘ

Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.

about - legalese

Loading...