Miksi käyttää lukemien kuvia, kun sinulla on jo lukutiedot?
Neuroverkot vievät yhden tai useita N-ulottuvuuksia ) syötteenä; he eivät voi ottaa mielivaltaisia tietoja. Lukujen ja niiden kohdistamisen syöttämiseksi verkkoon sinun on koodattava ne n-d-taulukkoina. Jos jätät toistaiseksi huomiotta "värit", suoraviivainen valinta on (windowLength, readDepth) 2D-matriisi, kuten näet kohdistusselaimessa - se on kuva. Tämän kuvan "värejä" kutsutaan usein "kanaviksi" tai "ominaisuuksiksi" syvällisessä oppimisessa (DL). Ne edustavat perustyyppejä ja peruslaatua deepVariantissa. Loppujen lopuksi saat syötteenä (windowLength, readDepth, nFeatures) 3D-taulukon. Tämä on luonnollisinta koodausta DL-tutkijoille.
Miksi valitsit CNN-vaihtoehdon soittajalle
Tämä johtuu siitä, että CNN on toistuvasti osoittautunut parhaaksi arkkitehtuuri tällaisille (korkeus, leveys, nChannels) 3D-matriiseille syötteenä. Luetut tasaukset ovat täsmälleen sitä.
Historiallisesti huomioiden, deepVariant rakennettiin ensin Googlen vanhentuneen DisBelief-kehyksen päälle, joka ottaa vain RGB-kuvia syötteeksi. Heidän oli puristettava kaiken tyyppinen tieto kolmeen värikanavaan. Nyt TensorFlow-toiminnolla kuvassa voi olla mielivaltainen määrä värikanavia. Tämä yksinkertaistaa toteutusta ja parantaa tarkkuutta. Tämän kuvan lisäksi deepVariant käyttää myös muita tietoja syötteenä.