Data Lake – toteutus käytännössä

Esittely

Kurssi on saatavana myös yrityskohtaisena. Lisätiedustelut [email protected] tai 050 3670809.

Data Platform on jokaisen data driven -organisaation perusedellytys. Siihen liittyy keskeisesti ei-strukturoidun datan kerääminen ja hyödyntäminen. Big Data on ehkä terminä kokenut inflaation, mutta isojen datamassojen hyödyntäminen on ajankohtaisempaa kun koskaan.

Data Laken on Hadoop-pohjainen ratkaisu ei-strukturoidun tiedon talletukseen ja analysointiin. Se on tällä hetkellä suositeltava arkkitehtuuriratkaisu aina, kun suunnittelemme Data Platformia, eli laajennettua tietovarastoa. Aivan jokainen vähänkään isompi yritys tulee käsittelemään suurempaa ulkoista datamassaa tulevaisuudessa, joten aihe on erittäin ajankohtainen. Katso tästä videosta lisätietoa Data Platformista ja sen toteutuksesta.

Tule oppimaan Data Laken toteutus käytännössä!

Kurssin tarkoituksena on syventää osallistujien ymmärrystä Hadoopista (järjestämme myös Hadoop-peruskurssin, jossa opit perustee käytännössä= sekä sen hyödyntämisestä tietovarastoinnissa käytännön työasemaharjoituksiin perustuvan oppimisen kautta. Vaikka painopiste on todenmukaisissa, käytännön harjoitustehtävissä, kahden päivän mittainen masterkurssi sisältää myös teoriaa ja taustoitusta Hadoopista.

Kurssilla toteutetaan todenmukainen, pilvipohjainen Data Lake harjoitustehtävien kautta. Data Lake –konseptin lisäksi kurssin aikana opitaan Hadoop-ekosysteemin yleisimmin käytetyt tuotteet kuten esimerkiksi Hive, Pig ja Sqoop sekä Hadoop-pohjaisen tietovarastoinnin edistyksellisiä menetelmiä, mm. Hadoopin käyttö suorituskykyisenä ETL-työkaluna ja raakadatan prosessorina, Hive-taulujen partitiointitekniikat, taulujen välisten liitosten suorituskyvyn optimointi sekä pilvitietovaraston hyödyntäminen tietovarastoinnissa.

Lue lisää Hadoopista tietovarastoinnissa ja Data Lake –konseptista kouluttajan, Karri Pulkkisen blogista https://www.arihovi.com/hadoopin-rooli-tietovarastoinnissa/.

Kenelle:

Tietovarastosuunnittelijoille ja -toteuttajille, DW/BI-asiantuntijoille, Big Data -asiantuntijoille, DBA:ille, arkkitehdeille.

Esitiedot:

Hadoop-peruskurssin suorittaminen tai Hadoop-perustuntemus on eduksi, mutta ei välttämätöntä.

Sisältö

  • Hadoop-klusterin arkkitehtuuri, infrastruktuurivaihtoehdot, distribuutiot
  • Pilvipalvelupohjaisen Hadoop-klusterin perustaminen
  • Klusterin konfigurointi ja valvonta
  • Klusterin suorituskyky ja tietoturva
  • Hadoop-pohjaisen tietovaraston arkkitehtuuri
  • Edistyneet tietovarastointimenetelmät ja parhaat käytännöt
  • Data Lake –konsepti
  • NoSQL-tietokannat
+ Lue koko esittely

Data Lake – toteutus käytännössä

Kieli:
Suomi
Kesto:
2 Päivää
Paikka:
Nortrain, Opastinsilta 12 F, Pasila, Helsinki
Aloituspäivämäärät:
Ota yhteyttä

Koulutusohjelmalla / kurssilla ei ole aktiivisia aloituspäivämääriä, jos olet kiinnostunut kurssista ota yhteyttä.

Ota yhteyttä

Ottakaa yhteyttä:

 

  • Kenttä on validointitarkoituksiin ja tulee jättää koskemattomaksi.

Saattaisit olla kiinnostunut myös näistä

Datan hallinta

Certified Data Vault Data Modeler (CDVDM)

Lue lisää
Datan hallinta

Data Management Fundamentals and DAMA Certification Preparation

Lue lisää
+