ÄûÃʵ¼º½

Uutiset

Lauri Järvilehto: Tekoäly alkaa hallusinoida, jos se ei osu oikeaan tietoon

Lauri Järvilehto on työelämäprofessori, joka tutkii ihmismielen ja tekoälyratkaisujen keskinäistä suhdetta. Haastattelussa hän avaa tekoälyn päättelykykyä, reflektiivisyyttä ja luotettavuutta.
Lauri Järvilehto
Kuva: Lauri Järvilehto

Lauri Järvilehto, mitä tutkit ja mikä on roolisi Aallossa?

Olen työelämäprofessorina Aallon tuotantotalouden laitoksella kahtena päivänä viikossa. Nyt teen tutkimusta ihmismielen ja tekoälyn suhteesta pääasiassa kirjallisuuslähtöisesti, mutta olisi kiinnostavaa testata ihmisen ja tekoälyn suoriutumista etenkin päättelytehtävissä. Vielä kaksi vuotta sitten tekoäly ei pärjännyt niissä ollenkaan. Nyt se alkaa järkeillä esimerkiksi yliopistotason matematiikan tehtävissä, eikä vaan papukaijamaisesti toisinna harjoitusaineistoa.

Tekoäly ei kuitenkaan vielä pärjää arkipäättelyssä. Kuvittele seuraava tehtävä: Jos lämpimälle pannulle laitetaan viisi jääkuutiota minuutin välein, kuinka monta kuutiota pannulla on neljän minuutin päästä? Tekoäly vastaa 20. Jos kysyy ihmiseltä, vastaus on nolla, koska ne ehtivät sulaa.

Mitä on tekoälyn hallusinointi?

Jos pyydän tekoälyä vaikka hakemaan tietoa uudesta Konemieli-kirjastani, se saattaa alkaa hallusinoida, koska se ei osu tietoon. Se ei pysty varmistamaan minkään sanajoukon todennäköisyyttä ja alkaa tuottaa tekstiä, joka ei täsmää todellisuuden kanssa.

Tekoälyjärjestelmä hallusinoi oikeastaan aina, koska sillä ei ole minkäänlaista tiedollista tai aistimekanismia tiedon varmentamiseksi.Se vain suoltaa ulos sanajoukkoja, jotka perustuvat niiden tilastolliseen yleisyyteen harjoitusaineistossa. Jos harjoitusaineistossa on epätotuudenmukaisuuksia, ne saattavat lipsahtaa myös tekoälyn tuottaman aineiston osaksi.

Tekoälytyökaluja on saatu luotettavammiksi kehittämällä niiden taustalla vaikuttavia tilastollisia menetelmiä, mutta ne eivät koskaan ole 100% luotettavia. Hiljattain tuli sellainen tutkimustulos, että jos eri tekoälyt arvioivat toistensa tuloksia, lopputulos on yleensä paljon parempi.

Miten DeepSeek pärjää suhteessa muihin tekoälyjärjestelmiin?

Matemaattinen arkkitehtuuri voi pikkuhiljaa synnyttää varmennusmekanismin. Päättelymalli voi hetkeksi pysähtyä, kun sillä on epäilys jonkin asian todenmukaisuudesta, ja siitä voi syntyä itseään korjaava prosessi. Itsekriittiset huomiot siis pikku hiljaa kaventavat virhemarginaalia. Juuri näin DeepSeek toimii, ja se voi olla sen läpimurron syy.Se höpöttää tyyliin: “Tässä on tämmönen juttu mitä vois miettiä, odotas nyt, ei se mennytkään näin... “

Mutta edes DeepSeek ei pysty arkipäättelyyn tai reflektiivisyyteen, koska elämänviisautta ei osata ohjelmoida.

Tekoälyn hallusinaatioprosentti on 1,3-90 prosenttia. Vaihteluväli johtuu käyttötarkoituksesta ja syötteestä. Reilun prosentin hallusinointiin voi päästä esimerkiksi pyytämällä tekoälyä tiivistämään yhden tai useamman artikkelin. Mutta jos esimerkiksi ChatGPT 4: ltä kysyi aikaisemmin norsusta, joka ui Englannin kanaalin yli, 90% tapauksissa se alkoi kertoa jotain ihmeellistä lorua Kami-nimisestä norsusta vuonna 1936. Kyseinen Kami ui fanfaarien saattelemana pitkän uimaurakkansa jälkeen Doverin satamaan ja otettiin vastaan riemuiten. Suurin osa kielimalleista ei enää mene tähän halpaan, mutta DeepSeekin vastaus on vielä usein ihan huuhaata.

Voitko kuvata lyhyesti tekoälyn ja ihmismielen välistä suhdetta?

Kielimallin toiminta on hyvin lähellä ihmisen hermoverkostoa. Empiirissä tutkimuksissa on nähty, että ihmisillä on kognitiivisia vinoumia ja ajattelu perustuu paljolti heuristiikkoihin eli opittuihin tapoihin. Esimerkiksi 89% yliopisto-opiskelijoista vastaa väärin tähän tehtävään:

Linda on 31-vuotias sinkku, puhelias ja erittäin fiksu. Hänen pääaineensa oli filosofia, ja opiskelijana hän oli huolissaan syrjinnästä ja sosiaalisista kysymyksistä. Opiskellessaan hän osallistui ydinvoiman vastaisiin mielenosoituksiin. Kumpi on todennäköisempää: Linda on pankkivirkailija vai feministisessä liikkeessä aktiivisesti toimiva pankkivirkailija?

Oikea vastaus löytyy joukosta ja osajoukosta. Linda on siis todennäköisemmin pankkivirkailija.

Miksi ja miten tekoäly voisi mallintaa ihmisen tiedostamatonta?

Ihmisellä on tietoinen eli algoritminen mieli, joka on tosi rajallinen. Sen prosessointikapasiteetti on 3-5 yksikköä kerrallaan. Ihmisen tiedostamaton mieli perustuu assosiaatioperiaatteille, eli siellä tietyntyyppiset asiat esiintyvät usein yhdessä. Sanojen keskinäisiin yhteyksiin perustuvat kielimallit pystyvät samankaltaiseen assosiointiin.

Tekoälyjärjestelmät vaan jauhavat sana sanalta eteenpäin. Ihmisen kielenkäyttö toimii pitkälti samalla tavalla. Meiltä pääsee esimerkiksi sammakoita.

Mitä olennaista tekoälyltä uupuu?

Tekoälyltä puuttuu muisti, spontaanius ja itsenäisyys. Ajatteleva ihmismäinen kone voidaan ehkä saavuttaa silloin, jos nämä kolme asiaa pystytään ohjelmoimaan tekoälyyn tai jos ne ilmaantuvat sinne, kun tekoälyjärjestelmät monimuotoistuvat.

Muistin osalta on olemassa hyviäkin lähestymistapoja, mutta ainakin vielä tekoälyn muisti nollaantuu. Spontaanius tarkoittaa sitä ihmisen ominaisuutta, että vähän väliä päähän pälkähtää ajatuksia. Sitä vastoin tekoälyjärjestelmät eivät tee mitään, jos ei ihminen sitä pyydä. Ne vaan odottavat, että ihminen antaa syötteen ennen laskutoimitusta. Mutta nyt on jo olemassa strategioita siihen, että ne lähtisivät tekemään laskutoimituksia omia aikojaan.

Lisäksi tekoälyltä uupuu itsereflektiivisyys, enkä tiedä, miten sitä voisi matemaattisesti lähteä koodaamaan. Esimerkiksi Roger Penrose esittää, että ihmisen mieli on fundamentaalisesti erilainen kuin tekoäly, eli tietoisuutta ei voi syntyä tekoälylle.

Kuvailetko vielä tekoälyn toimintaperiaatetta?

Tekoäly on sananarvauskone. Se muuttaa kaikki sanat numeroiksi, ja numerot mallintavat sitä, miten sanat tilastollisesti liittyvät toisiinsa. Esimerkiksi, jos meillä on kuninkaan määritelmä, siitä voidaan poistaa miehen määritelmä, lisätään siihen naisen määritelmä, ja saadaan tulokseksi kuningatar.

Jos tekoälyä pyytää vaikka kertomaan sadun, niin se tekee jokaisen sanan jälkeen valtavan pitkän matriisikerrontaoperaation. Lopputuloksena on todennäköisyysjakauma siitä, mitkä harjoitusdatan yksityiskohtaisen mallin perusteella ovat todennäköisimpiä sanoja kyseisen sanajoukon jälkeen. Sitten se aloittaa koko prosessin alusta.

  • ±Êä¾±±¹¾±³Ù±ð³Ù³Ù²â:
  • Julkaistu:
Jaa
URL kopioitu

Lue lisää uutisia

Lähikuva tieteellisestä instrumentista, jossa kultaa ja pronssia, johtoja ja merkintöjä laboratoriossa.
Mediatiedotteet Julkaistu:

Tutkijat kytkivät lähes ikiliikkuvan aikakiteen ensimmäistä kertaa ulkoiseen värähtelijään – voi kasvattaa kvanttitietokoneiden laskentatehoa

Aikakide on moninkertaisesti pitkäikäisempi kuin muut kvanttijärjestelmät, joten sitä voitaisiin hyödyntää esimerkiksi kvanttitietokoneiden laskentatehon sekä mittauslaitteistojen tarkkuuden kasvattamiseen.
Henkilö koskettaa suurta kiveä tiilirakennuksen edessä, sinisen taivaan alla.
Kampus, Tutkimus ja taide, Yliopisto Julkaistu:

Glitch-teos haastaa näkemään taiteen eri valossa

Laura Könösen veistos paljastettiin 14.10. Otaniemen kampuksella.
Henkilö seisoo ulkona syksyllä, yllä harmaa huppari ja vihreä takki. Taustalla puut oransseine lehtineen.
Nimitykset Julkaistu:

Esittelyssä Qi Chen: Luotettava tekoäly tarvitsee algoritmeja, jotka selviävät yllätyksistä

Tekoälyn kehittäjien on keskityttävä sovellusten turvallisuuteen ja oikeudenmukaisuuteen, sillä ne liittyvät suoraan yhteiskuntien luottamukseen ja tasa-arvoon, sanoo tutkija Qi Chen.
Henkilö pukeutuneena vaaleanharmaaseen huppariin seisoo sisätiloissa, taustalla tiiliseinä ja vihreitä kasveja.
Nimitykset, Yliopisto Julkaistu:

Tekoälyn ja ihmisen erimielisyys on tutkijalle jännä arvoitus

Francesco Croce tutkii multimodaalisia perustamalleja, erityisesti niiden hyökkäyksensietokykyä.