AI - tekoäly

Tekoälyä reunalla – arkkitehdit, nyt on Edge AI:n aika

Milan Kratochvil

Tasapainoilu turvallisuusriskien, logistiikan ja energian/materiaalien/komponenttien vaihtelevan saatavuuden kanssa kasvattaa tarvetta resurssitehokkaalle ja vihreälle tekoälylle. Amazon Web Services (AWS):n video kertoo, että jopa 90 % koneoppimisen sovellusten kehittämiseen ja käyttöön liittyvistä infrastruktuurikuluista tulee päättelystä.

Kouluta ajoittain, käytä monta kertaa

Tiivistettynä: jokaista koneoppimisen sovelluksen koulutuksen tai uudelleenkoulutuksen kertaa kohti voimme ajaa sitä monta kertaa.

Infrastructure cost
Kuvan lähde: aws.amazon.com/ec2

Edge AI:sta on hyötyä monenlaisissa laitteissa terveydenhuollon ja kuntoilun puettavista laitteista korkeanopeuksisiin juniin tai teollisuus 4.0:an.

Reunalaskenta (edge computing) kokonaisuudessaan edistää Green IT:tä parantamalla parametrien laatua, reaaliaikaista suorituskykyä, saatavuutta (vähemmän riippuvuuksia yksittäisestä kohdasta) sekä tiedon omistajuutta ja yksityisyyttä – pienemmillä resurssikustannuksilla.

Tekoäly, koneoppiminen mukaan lukien, istuu hyvin useimpiin reunalaskennan arkkitehtuureihin. Osa koneoppimisen arkkitehtuureista, tosin eivät kaikki, ovat yhden Edge-mallin muunnoksia. Esimerkiksi kokonaisarkkitehtuurista ja erityisesti nykypäivän tekoälystä tuttu federoitu oppiminen on sukua reunalaskennan esikäsittelymallille, älykkäällä tietojen pelkistyksellä.

“Pientä koneoppimista” pienestä määrästä dataa – toisen maailman sodan operatiivisesta analyysistä teollisuus 4.0 tekoälyyn

Annoin Informatorin blogissa kymmenen vinkkiä vihreään tekoälyyn (Green AI). Yhdessä näistä vinkeistä vertasin erittäin relevanttia, pientä, puhdasta dataa suureen määrään dataa, jossa on paljon hälyä tai aukkoja. Valtavasta määrästä dataa ei ole hyötyä, jos ”oikean tarinan kertova” data puuttuu. Esimerkkinä tästä selviytymisharha, joka johtuu joko todellista maailmasta tai datan siirrosta johtuvasta ”tähtäyksen pieleen menemisestä”.

Usein käytetyssä esimerkissä takaisin selvinneen lentokoneen vaurioituneet osat näyttävät ne kohdat, joihin osumisesta huolimatta kone pystyi palaamaan takaisin. Lentokoneet, jotka saivat osuman muihin koneen osiin eivät palanneet.

Kuva: en.m.wikipedia.org/wiki/Survivorship_bias

Isokaan määrä dataa ei korvaa dataa, joka puuttuu vioista johtuen. Google Brainin perustaja Andrew Ng Landing AI:sta mainitsi tammikuussa ZDnet-julkaisussa ”Nämä tekniikat eivät oikeastaan toimi, jos käytössä on vain 50 kuvaa (…) Big datan sijaan meidän on ollut pakko keskittyä laadukkaaseen dataan.”

Kymmenien otos miljoonien sijaan voi tosiaan toimia. Landing AI on pystynyt kehittämään asiakkailleen toimivia teollisia malleja ”kourallisella” datanäytteitä. ”Olemme Landing AI:ssa innovoineet työkaluja siihen, kuinka datasta saadaan irti paras mahdollinen suoritus, kun käytössä on 50 kuvaa”. Ng:n mukaan on tärkeämpi keskittyä siihen, mitkä tietopisteet ovat tärkeimpiä ja muokata malli sen mukaan.

Uutta rautaa reunalla ja MLOpsin työkaluja

Andrew Ng:n mainitsema tärkeimpien tietopisteiden tunnistaminen inspiroi myös Edge AI -sirujen, alustojen ja työkalujen myyjiä. Yksi kymmenestä vihreän arkkitehtuurin vinkistäni on ”huomioi kustannus-hyötyanalyysia tehdessäsi sekä suunnittelu/virittäminen että koko MLOps-putki sekä kustannuksen että kestävän kehityksen näkökulmasta”. Tästä näkökulmasta paras ratkaisu on koneoppiminen pienestä, merkityksellisestä datasta pienellä, sisäänrakennetulla laitteistolla Edge-laitteissa: kustannus-hyötysuhde, nopea reaaliaikainen käyttöönotto ja reaaliaikainen vastaus uusiin riskeihin, vähemmän kuormitusta verkkoon, datan säilytys paikallisesti.

Ei kovinkaan yllättäen isot yritykset kuten Microsoft, Amazon, Google ja Invidia yhdistävät Edge AI -laitteistonsa käyttäjäystävällisiin, reunalaskentaan tarkoitettuihin MLOps-työkaluihin. Sen lisäksi kasvava määrä uusia yrityksiä tarjoaa resursseja säästäviä AI-optimoituja siruja (muun muassa EsperantoTech, SiMa.ai, Perceive, Blaize, Hailo, FlexLogix, AIStorm).

Työnnä siis myös tekoäly reunalle monestakin syystä, erityisesti saadaksesi nopean, reaaliaikaisen reaktion uusiin tilanteisiin ja riskeihin. Seuratessani alppihiihtäjä ja lumilautailija Ester Ledeckán eeppistä korjausliikettä Olympialaisissa 100 kilometrin tuntivauhdissa hänen yrittäessään neljättä olympiakultaansa, muistin kymmenen vuoden takaisen keskustelun epigenetiikasta ja kansallisen tason harjoittelusta.

Tuhansien toistojen jälkeen opittu liike toistuu yhtä nopeasti ja automaattisesti kuin se olisi peritty refleksi. Tämä vähentää ”signaali-liikennettä” aivoihin ja takaisin. Edge koneoppiminen on verrattavissa tähän.

Osa kokonaisarkkitehtuurista vastaavista ja johdosta todennäköisesti muistaa kirjailijan ja presidentin Václav Havelin, jonka veli oli tekoälytutkija Ivan M. Havel. Václav Havel johti tsekkiläistä Peruskirja 77 -ihmisoikeuskansanliikettä. Havelin veljekset rohkaisivat yhteisöä ja organisaatiota kehittymään organismeiksi, joiden osilla oli voimaa, jotka pystyivät viestimään ja tekemään itsenäisiä päätöksiä sekä reagoimaan uusiin tarpeisiin paikallisesti. Teollisuus 4.0 robottikokoonpanolinjan älykkäät reunasensorit toimivat samalla logiikalla.

Kuten CIO.com-julkaisun artikkelin otsikko totesi hetki sitten: 2022 on Edge AI:n vuosi.

Koulutusta tekoälyyn

Tietoa kirjoittajasta:
Milan Kratochvil

Milan on Tieturin ruotsalaisen tytäryhtiön, Informatorin kouluttaja. Hän työskentelee Kiseldalenilla Senior Modeling and Architecture -konsulttina. Milan on kouluttanut Informatorilla vuodesta 1996 arkkitehtuuria, tekoälyä, vaatimusmäärittelyä, mallinnusta ja suunnittelua.

Milan on julkaissut kaksi kirjaa: UML Extra Light (Cambridge University Press) ja Growing Modular (Springer).

Asiasanat: tekoäly, artifical intelligence, AI