Puhe on ihmisen luonnollisin tapa kommunikoida. Kun se liitetään yhteen tekoälyn ja varsinkin kehittyneiden kielimallien kanssa, tapahtuu käänteentekeviä asioita.
Unikie Oy:llä on siitä kiinnostavia kokemuksia.
Yksi niistä on käynnissä oleva hanke, jossa selvitetään, miten kokeneen teollisuustyöntekijän intuitio saadaan talteen ja siirretyksi muiden operaattoreiden ja tekoälyn hyödynnettäväksi.
”Teollisuudessa hyvän lopputuloksen saavuttaminen voi vaatia pitkää kokemusta. Kokenut operaattori vain jotenkin aavistaa, että tulos ei kohta enää ole speksien mukaista ja asetuksia pitää muuttaa”, sanoo CTO Niko Haatainen, joka johtaa Unikien keväällä perustamaa AI Labia.
Tekoälyn puheintegraation tutkimushankkeessa parhaat operaattorit selittävät mikrofoniin reaaliajassa, miksi tekevät jonkin muutoksen prosessiin.
”Tieto saadaan kielimallin avulla muutettua muotoon, jossa pystymme opettamaan koneoppimismallille prosessin numerotietojen lisäksi ihmisen tapaa ajatella”, Haatainen kertoo.
Järjestelmän toimintaa hyvin tuntevan ihmisen palaute tekee teollisen prosessin data-analyysista aiempaa tarkempaa.
”Tämä on uusi, hurjan mielenkiintoinen juttu. Intuitio ja hiljainen tieto vangitaan osaksi tekoälyjärjestelmän opetusta. Pystymme tätä kautta ymmärtämään teollisesta prosessista asioita, jotka eivät numeroita ja mittauksia tutkimalla avaudu.”
Haataisen mukaan hankkeen aikana on jo todettu, että asiakkaan tulokset ovat merkittävästi parantuneet.
”Toivon mukaan saamme heille vuoden sisällä mallin osaksi tuotantoa.”
Uusi tapa komentaa
Unikie on vuonna 2015 perustettu suomalainen yritys, joka kehittää sulautettuja ohjelmistoja ja tekoälypohjaisia ratkaisuja erityisesti teollisuudelle, puolustussektorille ja viestintäalalle.
Yhtiön fokus ei ole perusdigitalisaatiossa eli palvelujen tuottamisessa digitaalisille alustoille tai verkkoon.
”Vahvuutemme on soveltaa parhaita olemassa olevia tekniikoita ja tutkimustuloksia fyysisiin asioihin, kuten ajoneuvoihin ja teollisuuden prosesseihin”, Haatainen sanoo.
Hänen johtamansa AI Lab työllistää nyt 20–30 tekoälyn soveltamisen ammattilaista. Suunnitelma on kasvattaa siitä vähintään sadan hengen AI-organisaatio vuoden 2026 loppuun mennessä.
AI Lab kävi lokakuussa Dubaissa Gitex 2025 -teknologiamessuilla keräämässä kehuja demovideolle, joka kuvasi uutta tapaa komentaa drooniparvea tekoälyn ääniohjauksella, aivan tavallisella ihmispuheella.
Demo liittyy Unikien yhteistyöhön teknologian kehittäneen VentureOnen (AbuDhabi) kanssa.
”Perinteisesti droonien ohjaus vaatii hankalaa kliksuttelua, karttoja ja polun suunnittelua. Tässä lyhyellä, puhutulla lauseella saadaan aikaan vaikeita asioita. Tämä on tosi uutta.”
Tekoäly toimii siltana ihmisen ja droonien välillä. Se muuttaa luonnollista kieltä drooneille ymmärrettäväksi tehtäväksi.
”Maaoperaattorin ei tarvitse tasapainoilla vaikkapa kahdeksan droonin lennättäjänä, vaan hän voi keskittyä siihen, mitä pitää oikeasti saada aikaan.”
Haataisen demovideolla pelastaja haluaa tietää, miten vaarallinen tilanne on meneillään tulipalossa talon toisella puolella, jonne hän ei itse kykene näkemään.
”Pelastustehtävässä pelastajan oikea arvo ei ole lennättää droonia, vaan ymmärtää tilanne ja pelastaa ihmiset.”
Tekoälyn terästämä drooni on hänelle älykäs työpari, jolle voi esittää tavallisella puheella pyynnön: ”Siirry rakennuksia välttäen edessäni olevan palavan talon taakse ja analysoi tulipalon tilanne”.
Jos talossa ihminen roikkuisi ulkona rikkinäisestä ikkunasta, drooni osaisi todeta tilanteen vaaralliseksi ja kuvailla sen.
”Tekoäly tuo prosessiin sellaista inhimillistä päättelyä, mikä ei aiemmin ollut teknisesti mahdollista, ainakaan tässä mitassa”, Haatainen sanoo.
Pelastustoimi droonien avulla on vain esimerkki. Yhtä hyvin voisi kyse olla teollisuuden prosessin ohjaamisesta.
”Teollisuusautomaatio voidaan viedä puheohjatun AI-järjestelmän avulla paljon korkeammalle tasolle kuin perinteinen, jossa lauma ihmisiä ohjelmoi robottia tekemään jotain juuri oikein.”
Uusi kuvio on, että ihminen ei enää mikromanageroi teollista prosessia, vaan kertoo tekoälylle, mitä lopulta tavoitellaan. Tekoäly toteuttaa vaaditut muutokset sen käytössä olevien reaaliaikaisten tietojen ja prosessin toiminnasta oppimansa mukaisesti.
Ihminen antaa ratkaisuille lopullisen hyväksynnän.
”Tämä on oikeasti iso megatrendi.”
Tekoälyn ohjaaminen puheella on mahdollisimman lähellä sitä, miten ihmiset keskenään normaalisti toimivat. Se on myös käytännöllistä.
Haataisen mukaan teollisuuslaitoksessa huoltohenkilö ei edes voi kuljettaa koko ajan läppäriä mukana. Mikrofoni sen sijaan on helppo pitää matkassa.
Uutta arvoa automatisoimalla
Unikie on kymmenisen vuotta kehittänyt ajoneuvojen Marshalling-järjestelmää. Sen avulla ei-autonomisia ajoneuvoja liikutetaan suljetulla alueella kuin ne olisivat autonomisia eli itseohjautuvia.
”Auto ei ole älykäs, mutta se pystyy olemaan älykkään ulkoisen ohjausjärjestelmän radio-ohjattavana.”
Ominaisuus on kätevä esimerkiksi autotehtaalla, jossa liikutellaan satojatuhansia autoja vuodessa. Ilman etäohjausta niitä pitäisi olla iso joukko ihmisiä kuskaamassa paikasta toiseen.
”Puheella ohjattava tekoäly tuo paljon lisäarvoa Marshalling-järjestelmän perusteknologiaan”, Haatainen sanoo.
Hän antaa esimerkin varikolta, jonne bussi saapuu vuoron jälkeen.
”Kuski voi vain hypätä pois kyydistä ja mainita järjestelmään, että tämän bussin pitää mennä huoltoon ja siivoukseen.”
Järjestelmä siirtää automaattisesti kuskittoman ajoneuvon siivouspisteeseen, lataukseen ja portille seuraavan kuskin ajettavaksi.
”Näillä tekniikoilla voimme tuoda mihin tahansa olemassa olevaan tosi paljon uutta arvoa eli automatisoida yksi, kaksi tasoa lisää.”
Sen sijaan, että ihminen ohjailisi yhtä prosessin osaa, hän voi kertoa AI-järjestelmälle normaalilla puheella, mitä koko hommassa pitää tapahtua. Tekoäly organisoi käytännön toteutuksen.
Äidinkielistä palautetta
Puheentunnistus on vanha tekniikan haara. Ääniohjauksen pulmana ovat virheet, joita teknologia tekee varsinkin meluisassa ympäristössä.
”Puheentunnistus ei aina saa kiinni siitä, mitä ihminen sanoo. Se tulkitsee sanoja väärin.”
Haataisen mukaan kielimallit ovat nostaneet puheen ymmärtämisen järjestelmissä aivan uudelle tasolle. Vertauskohtana ovat ihmisen aivot. Ihmisaivot korjaavat keskustelussa käytetyn yksittäisen väärän sanan automaattisesti, jos tiedossa on, mistä aiheesta puhutaan.
Sama koskee kielimallia.
”Se kykenee korjaamaan väärän sanan, jos se tietää puheen kontekstin eli puhutaanko aidasta vai aidan seipäästä”, Haatainen sanoo.
”Kielimallin avulla saadaan tuotua tämä korjausliike esimerkiksi teollisiin prosesseihin.”
Ominaisuus saattaa olla tarpeen tehtaassa, jossa työntekijät puhuvat montaa eri kieltä.
”Maailman eniten puhuttu kieli on huono englanti.”
Kielimallin avulla työntekijät voivat myös saada palautteen tarvittaessa omalla äidinkielellään.
Generatiivinen tekoäly on kaikesta huolimatta satunnainen prosessi, aivan kuin ihmisenkin ajattelu. Haataisen sanoin: pääsääntöisesti menee maaliin, mutta polut saattavat olla vähän tutkimattomia.
Erehdyksiä sattuu. Tarvitaan siis ’aikuinen huoneessa’ -mekanismi, joka estää tekoälyä rikkomasta turvallisuusbarometria.
”Aina kun tekoälypohjalta ohjataan todellisen maailman tapahtumia, jotka voivat johtaa vahinkoihin, ympärillä täytyy olla eritasoisia turvajärjestelmiä. Tämä on tärkeää.”