Eri keinoja oppia ja opettaa

Koneoppimismallit oppivat tunnistamaan ja luokittelemaan tietoja opetusdatan avulla. Opetusdata on todellisen luokitteludatan kanssa samankaltaista, mutta ei suinkaan samaa dataa (koska sehän olisi huijausta!).

Opetusdata on samankaltaista kuin luokiteltava data, mutta ei samaa dataa.

Otetaan esimerkiksi ohjelma, jota opetetaan tunnistamaan eri eläimiä. Opetuksen voi toteuttaa eri tavoilla:

Valvottu oppiminen

Valvotussa oppimisessa datayksiköillä on annetut luokat.

Opetusdata voi sisältää esimerkkejä oikeista pareista (esimerkiksi kuvia koirista, joihin on liitetty nimike ‘koira’ ym.). Tätä kutsutaan valvotuksi oppimiseksi, koska tiedämme, että opetusdata sisältää oikeita esimerkkejä.

Valvottu oppiminen muistuttaa tuttujen sanojen opettelua vieraalla kielellä: esimerkiksi silloin, kun joku kertoo, että ‘hund’ on ‘koira’ ruotsiksi.

Opetusdata voi myös olla raakadataa, ja voimme antaa ohjelman käsitellä sitä itse. Tästä voidaan jatkaa kahdella tavalla:

Valvomaton oppiminen

Ohjelma voi keksiä merkitsevät piirteet itse (etsimällä säännönmukaisuuksia aineistosta) ja luokitella asiat kokonaan itse.

Jos kaikki koirat ja kissat opetusdatassa ovat valkoisia, mutta hevoset ovat ruskeita, on todennäköistä, että ohjelma päätyy lajittelemaan eläimet värin mukaan eläinlajin sijaan. Tätä me emme halunneet!

Jotta tällä lähestymistavalla saadaan realistinen lopputulos, ohjelmalla pitää olla valtavat määrät monimuotoista dataa.

Voidaan ajatella, että ihminen oppii suurimman osan asioista valvomatta. Vauvat oppivat jäsentämään ja tuottamaan lauseita ihan itse: kukaan ei ensin selitä kielioppi- tai ääntämissääntöjä vauvoille, ja silti he oppivat puhumaan.

On toki totta, että ihmisvauvat viettävät suurimman osan ajastaan seurailllen itsenäisesti aikuisen esimerkkiä, toisin kuin keinoneuroverkot.

Vahvistusoppiminen

Ohjelma voi myös oppia yrityksen ja erehdyksen kautta. Tätä kutsutaan vahvistusoppimiseksi. Jos esimerkkiohjelmamme erehtyisi vaikkapa laittamaan kissan kenneliin, syntyisi paljon murinaa ja sähinää. Tämä palaute saisi ohjelman välttämään saman tempun toistamista.

Jos jaat jotakin sosiaalisessa mediassa ja saat paljon tykkäyksiä, on se sinulle kannustus tehdä sama uudestaan. Tämä on vahvistusoppimista (psykologian käsitteissä operanttia ehdollistumista)!