Data-driven Atomistic Simulation (DAS)
Research group led by Miguel Caro
Hiilestä, vedystä ja hapesta koostuvia orgaanisia molekyylejä on kaikkialla maailmankaikkeudessa. Silti niiden alkuperään ja muodostumiseen liittyy paljon kysymyksiä.
mallintaa, miten orgaaniset molekyylit muodostuvat ja hajoavat tähtien ympärillä. Tavoitteena on selittää spektroskooppisia signaaleja – valon ja aineen vuorovaikutuksesta syntyviä “sormenjälkiä”, jotka tähtitieteilijät voivat havaita, mutta joiden tulkitseminen usein tuottaa vaikeuksia.
“Koneoppiminen mahdollistaa sellaisten prosessien simuloinnin, jotka vielä viisi vuotta sitten olivat täysin saavuttamattomissa – esimerkiksi äärimmäiset astrofysikaaliset olosuhteet, jatkuva säteily ja harvinaiset reaktiot. Käytännössä meillä on nyt työkalut aineen käyttäytymisen mallintamiseen avaruudessa. Näin voimme tutkia järjestelmiä, joita aiemmin ei voitu käsitellä laskennallisesti”, sanoo akatemiatutkija Rina Ibragimova.
Ibragimova on laskennallisen fysiikan asiantuntija ja SpaceML-hankkeen päätutkija. Hän toimii myös professori Miguel Caron johtamassa Data-driven Atomistic Simulation (DAS) -tutkimusryhmässä.
Ajatus koneoppimisen hyödyntämisestä astrokemian alalla syntyi yllättävästä monitieteisestä kohtaamisesta. Muutama vuosi sitten Ibragimova vieraili Espanjassa La Lagunan yliopistossa, ja hänen luentonsa herätti paikallisen tähtitieteilijän kiinnostuksen.
“Ennen tuota tapaamista en ollut ajatellut astrokemiaa lainkaan. Keskustellessamme huomasimme kuitenkin nopeasti, että meillä on paljon yhteistä ja mahdollisuuksia yhteistyöhön. Siitä kaikki alkoi: aloimme hahmotella mahdollisia projekteja, ja myöhemmin kirjoitin oman hakemukseni Suomen Akatemialle. Näin SpaceML sai alkunsa”, Ibragimova kertoo.
Kun orgaaniset molekyylit leijuvat tähtien ympärillä, ne vuorovaikuttavat valon kanssa niille ominaisella tavalla. Infrapunaspektroskopiassa tämä valo hajotetaan spektriksi – piikkien ja muiden piirteiden muodostamaksi kuvioksi. Jokaisella molekyylirakenteella on oma “sormenjälkensä”.
Yksinkertaisten molekyylien kohdalla signaali voidaan usein yhdistää suoraan tiettyyn sidokseen tai rakenteeseen. Usein havaitaan kuitenkin monimutkaisia seoksia, joissa eri molekyylien spektrit menevät päällekkäin. Tällöin syntyy piirteitä, jotka voivat vastata useita mahdollisia rakenteita – tai jäädä kokonaan ilman luotettavaa tulkintaa. Siksi monet tähtitieteellisissä havainnoissa näkyvät signaalit jäävät selittämättä.
Materiaalitieteessä vastaava haaste on helpompi ratkaista.
“Laboratoriossa valmistamme tietyn yhdisteen, mittaamme sen infrapunaspektrin ja yhdistämme suoraan rakenteen ja signaalin. Tähtitieteessä tilanne on paljon haastavampi: usein ei edes tiedetä, mitä molekyylejä voidaan tutkia. Mahdollisten rakenteiden ja yhdistelmien määrä on valtava, mistä johtuen kokeiden suunnittelu on vaikeaa”, Ibragimova selittää.
Laboratoriossa voidaan jäljitellä joitakin avaruuden kaltaisia olosuhteita: esiaste – niin sanottu prekursori – asetetaan kammioon, altistetaan vetyatomeille ja ultraviolettisäteilylle, ja seurataan, miten sen spektri muuttuu. Oikean prekursorin valinta on kuitenkin suuri haaste.
“Tässä laskennalliset simulaatiot ovat välttämättömiä. Kun seulomme suuria määriä mahdollisia prekursoreita koneoppimisen avulla, voimme tunnistaa ne, jotka todennäköisimmin selittävät avaruudessa havaitut infrapunapiirteet”, Ibragimova kertoo.
Astrokemian tutkimuksen edistämisen rinnalla SpaceML-hankkeen tavoitteena on kehittää laskennallisia menetelmiä, joita voidaan hyödyntää laajasti kemiassa ja materiaalitieteessä. Tavoitteena on tehdä simulaatioista tehokkaita ja erilaisissa tutkimushankkeissa sovellettavia työkaluja.
Toinen keskeinen tavoite on kuroa umpeen teoreettisia aukkoja ja yhdistää erilaisia lähestymistapoja yhtenäiseksi kokonaisuudeksi. Vaikka koneoppimiseen perustuvia työkaluja on jo runsaasti, Ibragimovan mukaan alalla kaivataan yhä sujuvampaa työnkulkua.
“Ihannetilanteessa tutkijalle syntyisi idea, hän tekisi tarvittavat laskelmat nopeasti, tunnistaisi rakenteen ja sen spektrin ja välittäisi tulokset yhteistyökumppaneilleen: ‘Uskomme, että nämä rakenteet ovat merkityksellisiä näissä olosuhteissa – voisitte ehkä testata niitä.’”
Tällainen toimintamalli voisi ohjata kokeellista tutkimusta tehokkaammin ja auttaa kohdentamaan myös teleskooppihavaintoja tarkemmin.
“Esimerkiksi James Webb -avaruusteleskoopin suhteen voisimme paremmin ennustaa, mitä kaikkea kannattaa tarkastella ja kuinka luotettavasti tietyt rakenteet voidaan tunnistaa”, Ibragimova sanoo.
SpaceML-hanke pohjautuu Data-driven Atomistic Simulation (DAS) -ryhmässä kehitettyihin työkaluihin ja laajentaa niitä uusilla menetelmillä. Yksi uusista malleista ennustaa infrapunaspektrejä koneoppimisen avulla. Toinen, Aallossa professori Andrea Sandin kanssa kehitetty malli, simuloi ionisoivan UV-säteilyn vaikutuksia materiaaleihin.
“On hämmästyttävää, että samoilla työkaluilla voidaan mallintaa sekä katalyyttisiä materiaaleja että miljoonien valovuosien päässä olevia kohteita. Erityisen kiinnostavaa on ajallisten mittakaavojen ero: tähtien kehitys tapahtuu tuhansien tai miljoonien vuosien aikana, kun taas atomistiset simulaatiot kattavat ehkä vain satoja pikosekunteja. Silti huolellisella analyysillä ja perusteellisella todentamisella voimme tunnistaa merkityksellisiä ilmiöitä”, Ibragimova sanoo.
* Alkuperäinen kuva tähtiä ympäröivistä molekyyleistä löytyy (englanniksi). Rina Ibragimova ei ole yksi tämän julkaisun kirjoittajista, mutta José A. Martín-Gago ja Gonzalo Santoro ovat Ibragimovan yhteistyökumppaneita.
Research group led by Miguel Caro
Apulaisprofessori Miguel Caron tutkimusryhmä hyödyntää koneoppimista materiaalien mallintamisessa. Tutkimus nopeuttaa uusien, kestävämpien teknologioiden kehittämistä.