Hermosoluista hermoverkkoihin

Kun haluamme rakentaa lentävän koneen, paras ratkaisu ei ole lentokone, joka räpyttää siipiään ja joka on rakennettu luista, lihaksista ja höyhenistä.

Samaan tapaan keinotekoisten neuroverkkojen neuronit ovat useimmiten paljon yksinkertaisempia kuin oikeat hermosolut, ja niissä jätetään huomiotta oikeiden hermosolujen sisäiset toimintamekanismit varsinkin silloin, kun tavoitteena on toteuttaa tekoälyratkaisuja eikä simuloida biologisia järjestelmiä.

Tutustu Elements of AI -kurssiin!

Keinotekoisten neuroverkkojen ja ihmiskognition tutkimuksen sanasto on osittain päällekkäistä, mutta selitykset sanojen takana usein eroavat toisistaan.
Mikä oikeastaan on erilaista ja mikä jossakin määrin samanlaista?

Hermosolu ja perseptroni

Mikä on hermosolu? Vertaillaanpa biologisia hermosoluja ja niiden keinovastineita. Alla näet kuvan kahden motorisen hermosolun välisestä toiminnasta:

Ihmisen hermosolun osia ja hermosolujen välistä viestintää.

Huomaat pian, että biologisilla hermosoluilla ja koneoppimisneuroneilla on vain vähän yhteistä. Hermosolujen välinen viestintä on sähkökemiallista, kun taas keinoneuronit viestivät täysin numeroilla. Yhteistä niille on se, että ne molemmat ovat keskenään tiiviissä yhteydessä verkkorakenteessa.

Perseptronin toiminta: painokertoimet ja painotettu summa.

Perseptroni: keinohermosolu

Perseptroni on oppiva algoritmi. Se oppii syötteiden ja tulosteiden välisiä yhteyksiä: toimintaperiaate on saanut innoituksensa biologisten hermosolujen välisistä yhteyksistä. Perseptroni on luokittelija: sen avulla aineistoa voidaan lajitella kahteen luokkaan (esimerkiksi kissa tai ei-kissa).

Sukellus syvemmälle

Yksittäinen neuroni ei voi prosessoida kovin paljoa itsekseen. Painokertoimet, eli tietyt yhteydet pisteiden välillä, sekä koko verkon rakenne, ovat tärkeässä roolissa informaation kulkeutumisessa ja oppimisessa.

Perseptronista tulee monikerrosperseptroni — neuroverkko — yksinkertaisesti silloin, kun perseptroneja on verkkorakenteessa enemmän kuin yksi.

Neuroverkkojen syvyys syntyy lisäämällä uusia kerroksia syöte- ja tulostekerrosten väliin (juuri tähän viitataan, kun puhutaan syväoppimisesta). Joitakin kerroksia kutsutaan piilokerroksiksi, koska ne ovat syöte- ja tulostekerrosten välissä, eikä näissä kerroksissa aina suoraan määritellä, mitä piirteitä aineistosta pitäisi kyseisessä kerroksessa etsiä.

Neuroverkon rakenne voi olla millainen hyvänsä. Kerroksessa voi olla monta neuronia, ja neuronit voivat olla myös kerroksen sisällä vuorovaikutuksessa.

Informaatio voi liikkua suoraan neuronista seuraavaan (eteenpäin syöttävä, feed-forward) tai se voi palata verkossa takaisin (takaisinkytkeytyvä, recurrent). Yllä oleva kuva kuvaa yksinkertaistetusti molempia tapoja.

Takaisinkytkeytyviä neuroverkkoja (RNN) käytetään malleissa, joissa peräkkäinen informaatio, konteksti — eräänlainen lyhytaikainen muisti — on tärkeää, kuten konekäännöksissä.

Oppiminen päivittää yhteyksiä

Sekä ihmis- että keinotekoisissa neuroverkoissa oppiminen vahvistaa neuronien välisiä yhteyksiä.

Keinoneuroverkoissa näitä yhteyksiä kutsutaan painokertoimiksi. Painokertoimien muutos voi esimerkiksi tapahtua vastavirta-algoritmin (backpropagation) kautta. Kun malli tekee ennusteita, ennustevirheet virtaavat takaisin. Tämä päivittää neuronien välisiä yhteyksiä ja muuttaa painokertoimia.

Keinoverkkojen ja sinun välilläsi on tärkeä ero: toisin kuin keinotekoisten verkkojen, sinun ei tarvitse nähdä yksittäistä esinettä kovin montaa kertaa ennen kuin muistat nähneesi sen aiemminkin.

Toisaalta sanotaan usein, että ihmismuistin suhteen ongelma ei suinkaan ole varastointitila, vaan pikemminkin muistista haku! On täysin normaalia “unohtaa” ystävän nimi, vaikka tunnistaisitkin tämän kasvot. Jos keinoverkko tunnistaa kuvan, se varmasti kykenee noutamaan kaiken tiedon, joka sen yhteyteen on varastoitu.

Yleistyminen

Vanhan tiedon yleistyminen uuteen

Uudenlainen tuoli.

Tiedät, että yllä oleva esine kävisi istumiseen, vaikka et olekaan nähnyt sitä koskaan ennen. Ehkä jopa kutsuisit sitä tuoliksi. Käytät näin aiempaa tietoasi ja yleistät sen uuteen informaatioon.

Myös keinoneuroverkot taitavat yleistyksen periaatteet, mutta tiettyyn pisteeseen asti. Jos keinoverkko on saanut katsella vain nelijalkaisia jakkaroita oppiessaan tuolin käsitettä, se tuskin ymmärtää pallotuolin tuoliksi.

Jakkara
Pallotuoli