ÄûÃʵ¼º½

Uutiset

Hakukone tunnistaa aineenvaihduntatuotteet aiempaa nopeammin ja tarkemmin

Koneoppimiseen perustuvalle menetelmälle voi löytyä sovelluksia muun muassa anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.

Prosenttiosuus hauista, joissa oikea tunnistus on ensimmäisten osumien (top10) joukossa. Aalto-yliopiston ja Jenan yliopiston menetelmä on kilpailevia menetelmiä selvästi tarkempi.
 

Aalto-yliopiston ja saksalaisen Jenan yliopiston tutkijat ovat kehittäneet CSI:FingerID-hakukoneen, joka tunnistaa aineenvaihduntatuotteet tandemmassaspektrometrimittauksista yli 150 prosenttia parasta kilpailijaansa tarkemmin ja voi näin helpottaa muun muassa bio- ja lääketieteen tutkijoiden työtä. Tutkimus julkaistiin äskettäin arvostetussa PNAS-lehdessä.  

Aineenvaihduntatuotteet ovat pieniä molekyylejä, kuten sokereita, rasvahappoja ja aminohappoja, jotka toimivat soluissa muun muassa energianlähteinä ja soluseinien rakennusaineina. Tutkijoille ne ovat ikään kuin jälkiä solujen toiminnasta ja tilasta.

Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia.

– Aineenvaihduntatuotteita on paljon, sadoistatuhansista miljooniin, ja ne kaikki näyttävät vähän samankaltaisilta. Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia, Aalto-yliopiston professori Juho Rousu ²õ±ð±ô¾±³Ù³Ùää.

Molekyylin sormenjäljet

Tutkimuksessa käytetty tandemmassaspektrometri on laite, joka pilkkoo molekyylit palasiksi ja mittaa palasten massat ja suhteelliset osuudet eli massaspektrin. Aallon ja Jenan tutkijoiden menetelmässä kustakin opetusaineiston spektristä lasketaan ensin fragmentaatiopuu, joka kuvaa, mistä palasista pilkkoutumalla kukin molekyyliosanen on syntynyt. Tämän jälkeen tutkijat opettavat koneoppimismallia suurella määrällä fragmentaatiopuita ja kutakin puuta vastaavan molekyylin ominaisuuksia eli sormenjälkiä.  Kun mallille sitten annetaan uuden molekyylin spektri, se ennustaa sille todennäköiset sormenjäljet, joiden perusteella haetaan molekyylitietokannasta joukko parhaiten vastaavia molekyylejä.

Tällä hetkellä molekyylien tyypistä riippuen jopa 95 prosenttia hauista tuottaa oikean hakutuloksen 10 ensimmäisen osuman joukkoon. Tunnistamisen täsmällisyys paranee aineistoa kasvatettaessa. Tällä hetkellä mallin muodostamiseen on käytetty noin 6000 massaspektriä. Täydellisessä tilanteessa koneoppimiseen perustuva hakukone ehdottaisi aina ensimmäisenä osumana oikeaa molekyyliä, mutta se vaatii aineiston huomattavaa kasvattamista ja menetelmien kehittämistä.

Tutkimuksesta voi olla hyötyä erityisesti bio- ja lääketieteen tutkijoille. Tulevaisuuden mahdollisia sovellusalueita on esimerkiksi anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.

Tutkimus on tehty yhteistyössä Jenan yliopiston professori Sebastian Böckerin tutkimusryhmän kanssa, ja se on hyvä esimerkki Aalto-yliopiston tietotekniikkaan ja digitaalista terveyttä yhdistävästä tutkimuksesta.

³¢¾±²õä³Ù¾±±ð³Ù´ÇÂá²¹:

Professori Juho Rousu
Puh. 050 415 1702
juho.rousu@aalto.fi

Linkki artikkeliin

  • ±Êä¾±±¹¾±³Ù±ð³Ù³Ù²â:
  • Julkaistu:
Jaa
URL kopioitu

Lue lisää uutisia

Tutkimus ja taide Julkaistu:

ACRIS-järjestelmä jälleen käytettävissä

ACRIS-tutkimustietojärjestelmä on jälleen käytössä 13.–20.4.2026 toteutetun huoltokatkon jälkeen.
Design Methods class smiling faces during group work. Photo: Ayse Pekdiker
Tutkimus ja taide Julkaistu:

Tieteen äänen on pakko kuulua yhteiskunnassa – mutta miten?

Luottamus tieteeseen on laskenut Suomessa lähes kymmenen prosenttiyksikköä kahdessa vuodessa.
The Proteins.1 team smiling at the camera. 3 men wearing dark shirts smiling at the camera
Tutkimus ja taide Julkaistu:

Tutustu startuppiimme: Proteins.1 tähtää läpimurtoon sairauksien varhaisessa tunnistamisessa

Biotekniikka-startup Proteins.1 kehittää teknologiaa, joka voi mahdollistaa sairauksien, kuten syövän, tunnistamisen kuukausia tai jopa vuosia nykyistä aiemmin. Ratkaisuna on yksittäisten proteiinien havaitseminen verinäytteestä.
Hymyilevä mies hydrauliikkalaboratoriossa
³Û³ó³Ù±ð¾±²õ³Ù²âö, Tutkimus ja taide Julkaistu:

Liikkuvat työkoneet sähköistyvät vauhdilla – uusi tutkimusympäristö tukee teollisuuden tuotekehitystä

Liikkuvien työkoneiden kehitys- ja testauslaitteisto LEMMI tukee alan sähköistymistä ja vahvistaa tutkimuksen ja teollisuuden yhteistyötä.