Mikä on Microsoft Fabric?

Julkaistu 6.2.2024
Lukuaika noin 2 min
Mikä on microsoft fabrikin header kuva

Microsoft Fabric kokoaa yhteen tarvittavat kehitysvälineet

Perinteisesti pilvipalveluissa data-alustan kehittäminen on edellyttänyt laajasti erilaisia osaamisia, aina infrapalveluista erillisten analytiikkapalveluiden osaamiseen saakka. Microsoft Fabric – palvelun idea on siinä, että tästä kokoelmasta IaaS / PaaS – palveluita päästään irti ja siirrytään enemmän kohden SaaS – tyyppistä analyyttista tarjoamaa. Suurin hyöty tulee yhtenäisemmästä käyttökokemuksesta kehittäjille sekä siitä että ei tarvitse hallinnoida yhtä laajaa kirjoa erilaisia pilvipalvelusta käyttöön valittavia palveluita.

Tyypillisesti data-alustaa kehitettäessä on valittu käyttöön erilaisia PaaS – palveluita, mutta niidenkin hyödyntäminen vaatii usein jonkin verran palvelukohtaista erikoisosaamista.

Lyhyenä yhteenvetona voidaan todeta, että Microsoft Fabric on kokonaisvaltainen uusi analytiikkapalvelu.

OneLake datan tallennusratkaisuna keskiössä

Microsoft Fabricissa datan tallennus ja datan käsittelyn erilaiset tarpeen mukaiset moottorit ovat aidosti erotettu toisistaan, keskiössä on OneLake – nimellä kulkeva tietoallas.

Microsoft Fabric OneLake

OneLake muodostaa keskitetyn loogisen tietoaltaan organisaation datoille ja eräälaisena standardina datan tallennuksen ratkaisuna on parquet-delta tiedostoformaatti, jota kaikki Fabricin analytiikkamoottorit tukevat.

OneLaken datoihin on tarjolla myös erillinen sovellus, jota voi käyttää Windows File Explorerin tapaan.

Datan käsittelyn moottorit

Eräs keskeisiä datan käsittelyn moottoreita on Spark, käyttäjän ei tarvitse itse hallinnoida laskentaklustereita, vaan ne ovat Microsoftin operoimia.

Lakehouse delta – tauluille on tarjolla oma SQL – endpoint jonka avulla voidaan suorittaa lukuoperaatioita dataan. Tietovarasto-osiolle on oma SQL endpoint, joka tarjoaa laajemman joukon operaatioita.

Tapahtumavirta / telemetriadatan analysointiin on tarjolla reaaliaikaisen analytiikan osio, joka tukee KQL – kyselykieltä.

Fabricin analytiikkapalvelut

Käytössä on seuraavia palveluita niin että kehittäjän käyttökokemus on aiempaan nähden paljon yhdenmukaisempi

  • Data Factory
  • Synapse Data Engineering
  • Synapse Data Science
  • Synapse Real-Time Analytics
  • Synapse Datawarehouse
  • Power BI

Esimerkiksi erilaisten Spark – notebookien suoritus data engineering – työssä on Fabricissa helppoa hyödyntäen Synapse Data Engineering osiota. Luonnollisesti juuri nyt Fabric on vielä Public Preview – vaiheessa, joten monet palvelut vielä kehittyvät ja muuttuvat.

Fabricin kustannusten muodostuminen

Microsoft Fabricissa kustannusten muodostumiseen vaikuttaa haluttu suorituskykytaso eli Capacity Unit – taso (CU). Tarkemmin asiasta löytyy tästä. Eri työtilat voivat jakaa kapasiteetteja, ja kapasiteetteja voidaan valita esimerkiksi henkilötietojen maantieteelliseen käsittelyyn liittyen tarkoituksenmukaisella tavalla.

Tämän lisäksi OneLake – tallennustila sekä joissain tapauksissa alueiden välinen tiedonsiirto tuottavat kustannuksia.

Miten lähteä liikkeelle Microsoft Fabricin kanssa?

Tietoa kirjoittajasta:

Asko Kauppinen
Principal Consultant, Ready Solutions

Asiasanat:

Microsoft Onelake Data Factory Synapse Fabric