Datamassasta ennustaminen ja sen hyödyntäminen liiketoiminnassa

Tieto on valtaa, on totuttu sanomaan. Tiedosta ennustaminen on ylivoimaa, tullaan jatkossa sanomaan. Koneoppimisella ja datamassoista ennustamisella kyetään tuottamaan liiketoiminnoille ja organisaatioiden johdoille ennennäkemätöntä tietoa, jonka avulla kyetään selviämään alati muuttuvilla markkinoilla johtajina. Lue miten jalostetaan liiketoimintaa hyödyttävää tietoa datamassoista koneoppimisen avulla!

Eräässä palvelinsalissa ”pannuhuoneella” sijaitsevasta harrastelupalvelimestani on hajonnut kolme kiintolevyä. Olen taistellut kohta kuukauden uusien levyjen tilaamisen, tiedostojen kopioinnin ja palvelinsaliin pääsyn kanssa. Ehkä jo tällä viikolla pääsen vihdoin asentamaan kiintolevyt. Toivon, että urakka on sillä selvä. Miten tämä liittyy datamassasta ennustamiseen? Antti Arnell kirjoitti blogissaan tekstin ”Pilvi on muutakin kuin toisen konesali”. Mielestäni on opettavaista tietää miten palvelin fyysisesti toimii, mutta kun tavoitteena on tuottaa nopeasti ja vaivattomasti uusia ratkaisuja, annan Azuren huolehtia kaikesta ylläpidosta. Minä voin keskittyä IoT-ratkaisujen tekemiseen, Machine Learningiin ja vaikkapa datavisualisointiin PowerBI:lla.

Tiedon tallennus ei itsessään hyödytä ketään. Tärkeää on mitä tiedolla tehdään, miten olemassa olevia datamassoja yhdistellään ja mitä niistä ennustetaan. Haluan antaa muutaman esimerkin Azuren Machine Learning -studion tarjoamista mahdollisuuksista. Millaisiin kysymyksiin Machine Learning voi vastata?

Jokaisella yrityksellä ja teollisuuden alalla on omat yksilölliset tarpeensa siitä, mitkä Big Data- ja Machine Learning menetelmät soveltuvat heille parhaiten. Myynnille on tärkeää asiakkaiden profiloiminen ja kohdentaminen: millä todennäköisyydellä tietty asiakas ostaa tuotteen, kelle markkinointi kannattaa kohdentaa. Voidaan luoda malleja tuotteiden suosittelemiseksi aikaisemman käyttäytymisen perusteella, esimerkiksi Netflixin elokuvasuositukset perustuvat tähän. Voidaan löytää poikkeuksia. Miksi asiakas käyttää luottokorttiaan kivijalkakaupassa toisella puolella maapalloa muutama minuutti sen jälkeen, kun sitä on käytetty asiakkaan kotiosoitteen lähellä? Kysynnän tai varastosaldon ennakointi: milloin tuotteen tai palvelun kysynnän ajatellaan olevan suurimmillaan? Liittyykö kysyntä esimerkiksi sääolosuhteisiin, lokaatioon, tapahtumiin tai muihin ulkopuolisiin olosuhteisiin?

Yksi kuuma aihe tällä hetkellä Machine Learningissa on ennakoiva huolto

Jo jonkin aikaa laitteistovalmistajien trendinä on ollut siirtyä pelkän laitteiston valmistamisesta palveluntarjoajaksi. Kone on kotimainen malliesimerkki tämän kaltaisesta yrityksestä. Yhteistyö asiakkaan kanssa vasta alkaa siitä, kun hissi on asennettu. Niiden on toimittava varmasti ja tauotta. Tämä varmistetaan mittaamalla reaaliaikaisesti osien käyttöä ja kulumista laitteistossa. Huoltotoimet suoritetaan ennen, kuin osa hajoaa. Lisäksi huoltomies tietää etukäteen mitkä komponentit pitää vaihtaa, tai huoltaa käyttödatan ja ennusteen perusteella.

Toinen esimerkki on prosessin optimointi reaaliaikaisesti. Tätä on perinteisesti tehty Suomessa kemian teollisuudessa ja puuteollisuudessa. Azure kuitenkin mahdollistaa tämän toteuttamisen kevyemmin ja pienemmillä resursseilla eri käyttökohteissa. Machine Learning mahdollisuudet ovat kaikkien käytössä, jotka omistavat tietokoneen ja webbiselaimen. Mitään muuta infraa ei mittauksen lisäksi tarvita. Tyypillisesti tällaiseen optimointiin soveltuvat kaikki prosessit, joissa on tähän mennessä katsottu lopputuotteesta, onko prosessi onnistunut.

Ohessa konkreettinen esimerkki Machine Learningin käytöstä yrityksen CRM-datan analysoinnissa.

Kuvan esimerkissä ML-algoritmille syötetään yrityksen CRM-dataa, jonka avulla aikaisemmin hävityistä ja voitetuista asiakkaista ennustetaan avoimista tapauksista todennäköisimmin voitettavat ja tuottavat tapaukset. Ylhäällä määritellään ensiksi datalähde, joka voi olla esimerkiksi tietokanta, jokin internetin lähde, tai vaikkapa tekstitiedosto, joka sisältää datan.

Suurin työ ML-algoritmin opettamisessa on yleensä datan käsittelyssä ja muokkaamisessa. Melkein poikkeuksetta datassa on aukkoja ja yleensä datan kirjaajan toimesta syntyneitä suoranaisia virheitä. Oheisessa kuvassa datan muokkausta tehdään Split Data -vaiheeseen asti. Tämän jälkeen data jaetaan kahtia. Toisella puoliskolla mallia opetetaan ja toisella arvioidaan mallin hyvyyttä. Kuvassa on lisäksi näkyvissä kaksi eri mallia, joiden sopivuutta tapaukseen verrataan keskenään. Kun malli on luotu, siihen voidaan reaaliaikaisesti syöttää uutta dataa, ja saada ennuste tilanteesta.

Katso tästä PowerBI -esitys CRM -datan antamasta myyntiennusteesta.

Machine Learning –mallin luominen ja varsinkin datan muokkaus vaatii jonkin verran kärsivällisyyttä. Kuitenkin kun malli on luotu, siitä voidaan tehdä esimerkin mukaisia helposti ymmärrettäviä ja automaattisesti päivittyviä visualisointeja. Datavarastoja maailmassa on jo vaikka kuinka paljon ja lisää voidaan kerätä koko ajan esimerkiksi esineiden internetin, IoT:n, avulla. Tulevaisuudessa voittajia ovat ne, jotka osaavat parhaiten hyödyntää tiedon tehostaakseen toimintaansa ja palvellakseen paremmin asiakkaitaan.

Teemme Onregossa datavarastojen yhdistämistä, visualisointeja, Azure Machine Learning avulla datasta ennustamista, IoT-ratkaisuja, sekä autamme asiakkaitamme hyötymään julkisen pilven palveluista.

Ota yhteyttä meihin tästä ja pyydä arkkitehti paikalle!

One Response

Leave a Comment

You must be logged in to post a comment