Data Sciencen perusteet

Kurssin toteutukset:

  • 01.09.2017 Paasitorni, Paasivuorenkatu 5, Helsinki 900 € + alv
  • 02.10.2017 Paasitorni, Paasivuorenkatu 5, Helsinki 900 € + alv
  • 29.11.2017 Paasitorni, Paasivuorenkatu 5, Helsinki 900 € + alv

Kurssi on saatavana myös yrityskohtaisena. Lisätiedustelut johannes.hovi@arihovi.com tai 050 3670809. Mikäli haluat syventyä aiheeseen kunnolla ja omaksua laajemmat taidot Data Scientistinä toimimiseen, voit osallistuja Data Science-koulutusohjelmaan.

Business Intelligence ja tietovarastoinnin maailma on muuttumassa peruuttamattomasti. Perinteisen ja sinänsä yhä tarpeellisen raportoinnin rinnalle nousee voimakas tarve tutkia ja analysoida dataa entistä huomattavasti laajemmin.
Yritykset palkkaavat nyt Data Scientistejä, joiden tehtävänä on hakea uutta hyötyä liiketoiminnalle tekemällä koeasetelmia ja  ennustemalleja. Tiedoista puristetaan irti aivan uudenlaisia näkemyksiä.

Katso tästä lyhyt video: What is Data Science?

Nyt on aika tutustua tähän uuteen alueeseen. On  ymmärrettävä kausaliteetti ja korrelaatio. On opittava hakemaan dataa avoimista lähteistä. Kurssi on tarkoitettu henkilöille, jotka haluavat oppia datan käsittelyä ja tehokasta analysointia. Kurssin käytyään osallistuja osaa lähestyä business ongelmia Data Scientistin silmin. Kurssilla käytetään ohjelmistoina Exceliä, RapidMineria ja R:ää.

 

 Kurssin rakenne ja sisältö

  • Datan perusanalysointi ja visualisointi Excelissä
  • Data-analyysin suorittaminen RapidMinerissa

o   tunnuslukujen laskenta (keskiarvo, keskihajonta, jne.)

o   poikkeavien havaintojen etsiminen algoritmilla

o   puuttuvat tiedot ja niiden imputointi

o   muuttujien jakaumien tarkastelu

o   muuttujien yhdistely ja uusien luominen

o   muuttujien muunnokset

  • Datan käsittely ja visualisointi RapidMinerissa
  • Korrelaatio vai kausaalisuus -pohdinta (RapidMiner)
  • Datan segmentointi klusterointimenetelmillä (RapidMiner)
  • Avoimen datan lukeminen JSON-rajapinnasta R-ohjelmistolla ja datan tallennus csv-tiedostoon jatkokäsittelyä varten.

 

Kurssilla käytetään useita datasettejä eri liiketoiminta-alueilta (esim. asiakas- ja teollisuusdataa).

Esitiedot:

Ei erityisiä esitietovaatimuksia.

Kouluttaja:

Jaa: