Tutkijat kehittivät koneoppimisalgoritmin, joka oppi räppäämään
Kun verrattiin räppiriimien pituuksia ja esiintymistiheyttä, rap-lyriikkaa tuottava algoritmi DeepBeat oli 21% tehokkaampi kuin ihmisräppärit.
Uutinen perustamisesta oli yksi lähtölaukaus. Ajattelin, että ELLIS-instituutti tuo Suomeen ja Aaltoon muitakin osaajia sekä myönteistä tekoälypöhinää. Lisäksi olimme perheenä päättäneet, että on aika palata Sveitsistä Suomeen.
Vuoden 2018 väitöskirjassani tutkin historiallisten aineistojen linkittämistä, ja miten niistä voidaan muodostaa sukupuita. Vaikka väitöskirjassani hyödynnettiin koneoppimista ja tekoälymenetelmiä, se sisälsi kuitenkin paljon manuaalista työtä. Piti siivota dataa ja saada se tiettyyn formaattiin. Suuret kielimallit auttavat automatisoimaan monia prosesseja. Sille voi antaa raakadataa ja pyytää sitä löytämään yhteyksiä.
Koen, että tekoäly ja kielimallit tulevat muuttamaan meidän yhteiskuntaamme valtavasti. Haluan olla muovaamassa tätä muutosta mahdollisimman positiiviseen suuntaan. Haluan myös olla mukana kasvattamassa seuraavan sukupolven tekoälyasiantuntijoita. Siksi olen kiinnostunut opettamisesta. Vedin jo muutama vuosi sitten yhden kurssin vapaa-ajalla.
Työskentelen päätoimisesti Googlen DeepMindilla neljänä päivänä viikossa. Päivän viikossa olen vierailevana professorina (adjunct professor) Aallossa sekä ELLIS-instituutissa. Myös Googlella tutkin suuria kielimalleja, mutta akateemisella puolella minun on tarkoitus keskittyä enemmän poikkitieteellisiin sovelluksiin, kuten tekoälyn hyödyntämiseen yhteiskuntatieteellisillä sekä humanistisilla aloilla. Tällä alueella on paljon tehtävää, koska kielimalleja kehittävät yritykset harvemmin keskittyvät niiden soveltamiseen esimerkiksi historiantutkimukseen.
Eric MalmiAjattelin, että ELLIS-instituutti tuo Suomeen ja Aaltoon muitakin osaajia sekä myönteistä tekoälypöhinää.
Pääsen pian opettamaan seminaarikurssia suurista kielimalleista. Se on erikoiskurssi maisteri- ja tohtoriopiskelijoille ja keskittyy tekniseen puoleen ja viimeaikaisiin julkaisuihin. Kurssi on suunnattu opiskelijoille, jotka ovat jo käyneet koneoppimisen kursseja.
Se julkaistiin Aallossa kymmenisen vuotta sitten. -generaattoria on käyttänyt yli miljoona ihmistä, ja se pyörii edelleen. Jos on tullut käyttökatkos, olen saanut paljon turhautuneita viestejä. Olen myös tehnyt yhden jatkotutkimuksen lyriikoiden generoimisesta tekoälyn avulla.
Harrastelijaräppärit käyttävät generaattoria oman luovan prosessin tukemiseen. He saavat sieltä ideoita, mikä voisi olla sopiva laini eli rivi. He eivät vain paina nappia ja ota ideaa, vaan pallottelevat ideoita ja etsivät sitä, mikä voisi rimmata oman tekstin kanssa.
Googlella ensimmäinen haastattelija mainitsi, että oli lukenut uutisartikkelin räppigeneraattoristani. En usko, että se vaikutti palkkaamiseen, mutta minulle se antoi itsevarmuutta haastatteluun. Ja kun siirryin Googlella Gemini-tiimiin, ensimmäinen projektini oli Geminin lyriikkaominaisuuksien parantaminen. Räppialgoritmi oli siis käänteentekevä sivuprojekti urallani, koska sitä kautta päädyin tutkimaan kielimalleja Googlella. Sillä tiellä olen edelleen.
En näe, että tekoälyä kehitettäisiin korvaamaan ihmistä, vaan tukemaan luovuutta ja älykkyyttä. Tekoäly voi olla keskustelukumppani, monen alan asiantuntija, jota monella ihmisellä ei muuten olisi.
Tekoälyn voi nähdä mahdollisuutena ihan samalla tapaa kuin esimerkiksi syntetisaattorin. Alkuvaiheessa osa muusikoista pelkäsi syntetisaattorin korvaavan heidät, mutta se on tarjonnutkin uudenlaisia mahdollisuuksia ilmaista itseään. Vastaavasti tekoäly luo uusia mahdollisuuksia ilmaista itseään esimerkiksi vibe- eli tekoälyavusteisen koodaamisen kautta ilman että tarvitsee harjoitella koodaamista vuosikausia.
Eric MalmiRäppialgoritmi oli käänteentekevä sivuprojekti urallani, koska sitä kautta päädyin tutkimaan kielimalleja Googlella.
Tutkijalla uteliaisuus uusiin asioihin ja halu päästä pintaa syvemmälle. Opettamisen kannalta tärkeää on kyky asettaa itsensä toisen asemaan ja pyrkimys nähdä ongelma toisen näkökulmasta, jolloin voi suhteuttaa viestin sille henkilölle sopivaksi.
Vedän Google DeepMindilla tutkijataustaista ryhmää, joka keskittyy Gemini-mallien kouluttamiseen. Tarkemmin ottaen toiset ryhmät koettavat esikoulutusvaiheessa saada kaiken mahdollisen tiedon kielimallin sisään, ja jälkikoulutusvaiheessa me koetamme saada ne mallit mahdollisimman hyödyllisiksi ihmisille. Sen avulla ne antavat hyödyllisiä vastauksia ja pystyvät keskustelemaan.
Viime aikoina on tutkittu esimerkiksi sitä, miten kielimallit saadaan antamaan parempia vastauksia antamalla niille lisää miettimisaikaa. Sovelsimme tätä Google DeepMindilla hiljattain shakkiin ja muihin lautapeleihin. Kielimallit ovat perinteisesti olleet tosi huonoja pitkällistä päättelyä vaativissa peleissä, mutta me onnistuimme kehittämään suurmestaritason kielimallipohjaisen shakkitekoälyn. Se ei ole vielä ihmistä parempi, mutta minä esimerkiksi en pärjää itse sille ollenkaan, vaikka olen pelannut shakkia SM-tasolla nuorena.
Monet eivät uskoneet, että kielimalleilla on edes mahdollista saada aikaan pitkälle menevää päättelyä. Kriitikot ovat toitottaneet, että mallit eivät osaa pelata edes laillisia siirtoja.
Minua pyydettiin vetämään tätä 15 hengen shakkiprojektia, joka oli teknisesti tosi kiehtova ongelma. Kun hävisin itse ensimmäistä kertaa kielimallillemme tuli tunne, että olemme onnistuneet luomaan jotain itseä suurempaa. Pääsin myös esittelemään sitä Google DeepMindin toimitusjohtajalle.
Eric Malmi
Vieraileva professori (adjunct professor)
Aalto-yliopisto
eric.malmi@aalto.fi
Kun verrattiin räppiriimien pituuksia ja esiintymistiheyttä, rap-lyriikkaa tuottava algoritmi DeepBeat oli 21% tehokkaampi kuin ihmisräppärit.
Sukupuualgoritmi etsii automaattisesti lasten todennäköisimmät vanhemmat ja piirtää näin muodostuneita sukupuita.
Suomen ELLIS-instituutti on merkittävä tutkimuskeskittymä European Laboratory for Learning and Intelligent Systems-verkostossa, joka edustaa eurooppalaista tekoälyn ja koneoppimisen huippututkimusta.