Etusivu / Kurssit / Data Lake – toteutus käytännössä

Data Lake – toteutus käytännössä

Esittely

Kurssi on saatavana myös yrityskohtaisena. Lisätiedustelut [email protected] tai 050 3670809.

Data Platform on jokaisen data driven -organisaation perusedellytys. Siihen liittyy keskeisesti ei-strukturoidun datan kerääminen ja hyödyntäminen. Big Data on ehkä terminä kokenut inflaation, mutta isojen datamassojen hyödyntäminen on ajankohtaisempaa kun koskaan.

Data Laken on Hadoop-pohjainen ratkaisu ei-strukturoidun tiedon talletukseen ja analysointiin. Se on tällä hetkellä suositeltava arkkitehtuuriratkaisu aina, kun suunnittelemme Data Platformia, eli laajennettua tietovarastoa. Aivan jokainen vähänkään isompi yritys tulee käsittelemään suurempaa ulkoista datamassaa tulevaisuudessa, joten aihe on erittäin ajankohtainen. Katso tästä videosta lisätietoa Data Platformista ja sen toteutuksesta.

Tule oppimaan Data Laken toteutus käytännössä!

Kurssin tarkoituksena on syventää osallistujien ymmärrystä Hadoopista (järjestämme myös Hadoop-peruskurssin, jossa opit perustee käytännössä= sekä sen hyödyntämisestä tietovarastoinnissa käytännön työasemaharjoituksiin perustuvan oppimisen kautta. Vaikka painopiste on todenmukaisissa, käytännön harjoitustehtävissä, kahden päivän mittainen masterkurssi sisältää myös teoriaa ja taustoitusta Hadoopista.

Kurssilla toteutetaan todenmukainen, pilvipohjainen Data Lake harjoitustehtävien kautta. Data Lake –konseptin lisäksi kurssin aikana opitaan Hadoop-ekosysteemin yleisimmin käytetyt tuotteet kuten esimerkiksi Hive, Pig ja Sqoop sekä Hadoop-pohjaisen tietovarastoinnin edistyksellisiä menetelmiä, mm. Hadoopin käyttö suorituskykyisenä ETL-työkaluna ja raakadatan prosessorina, Hive-taulujen partitiointitekniikat, taulujen välisten liitosten suorituskyvyn optimointi sekä pilvitietovaraston hyödyntäminen tietovarastoinnissa.

Lue lisää Hadoopista tietovarastoinnissa ja Data Lake –konseptista kouluttajan, Karri Pulkkisen blogista https://www.arihovi.com/hadoopin-rooli-tietovarastoinnissa/.

Kenelle:

Tietovarastosuunnittelijoille ja -toteuttajille, DW/BI-asiantuntijoille, Big Data -asiantuntijoille, DBA:ille, arkkitehdeille.

Esitiedot:

Hadoop-peruskurssin suorittaminen tai Hadoop-perustuntemus on eduksi, mutta ei välttämätöntä.

Sisältö

Hadoop-klusterin arkkitehtuuri, infrastruktuurivaihtoehdot, distribuutiot
Pilvipalvelupohjaisen Hadoop-klusterin perustaminen
Klusterin konfigurointi ja valvonta
Klusterin suorituskyky ja tietoturva
Hadoop-pohjaisen tietovaraston arkkitehtuuri
Edistyneet tietovarastointimenetelmät ja parhaat käytännöt
Data Lake –konsepti
NoSQL-tietokannat

+ Lue koko esittely

Etusivu / Kurssit / Data Lake – toteutus käytännössä

Data Lake – toteutus käytännössä

Kieli:

Suomi

Kesto:

2 Päivää

Paikka:

Nortrain, Opastinsilta 12 F, Pasila, Helsinki

Aloituspäivämäärät:

Ota yhteyttä

Koulutusohjelmalla / kurssilla ei ole aktiivisia aloituspäivämääriä, jos olet kiinnostunut kurssista ota yhteyttä.

Ota yhteyttä

Jaa kurssi

Ottakaa yhteyttä:

Saattaisit olla kiinnostunut myös näistä

Datan hallinta

Certified Data Vault Data Modeler (CDVDM)

Lue lisää

Datan hallinta

Data Management Fundamentals and DAMA Certification Preparation

Lue lisää

Data Lake – toteutus käytännössä

Esittely

Kenelle:

Esitiedot:

Sisältö

Data Lake – toteutus käytännössä

Kieli:

Kesto:

Paikka:

Aloituspäivämäärät:

Jaa kurssi

Ottakaa yhteyttä:

Saattaisit olla kiinnostunut myös näistä

Certified Data Vault Data Modeler (CDVDM)

Data Management Fundamentals and DAMA Certification Preparation

Ilmoittautuminen