R-ohjelman (lyhyesti R) suosio on noussut jo usean vuoden ajan liiketoiminnan analytiikan ja tilastollisen mallintamisen työkaluna. R-ohjelma on tällä hetkellä ylivoimaisesti käytetyin ja suosituin työkalu analytiikkamarkkinoilla. R:n lähdekoodi on vapaasti saatavissa GNU-lisenssin alla, joten sen käyttäminen ei vaadi lisenssihankintaa. Joustavuutensa ja nopean kirjastojen lisääntymisen, sekä päivittymisen myötä sinulla on käytössäsi aina uusimmat analytiikan ja tilastollisen mallintamisen menetelmät.
Kaupalliset analytiikkaohjelmistot ovat huomanneet R:n huiman suosion, jonka johdosta niihinkin on rakennettu R-integraatio, jonka avulla R:n käyttäminen onnistuu R:n oman käyttöliittymän ulkopuolelta.
Kurssilla käydään läpi erityyppisien liiketoimintaongelmien mallintamista esimerkkiaineistojen avulla. Tehtävät esimerkit liittyvät ennustamiseen (ennakoiva analytiikka) eri tilanteissa ja erilaisilla menetelmillä. Tämän lisäksi vertaillaan eri mallinnusmenetelmiä keskenään. Kurssilta saat hyvän pohjan itsenäiselle oppimiselle mallinnuksen parissa.
Kurssi soveltuu analytiikkaa aloitteleville ja R-ohjelma tutuksi -kurssin käyneille.
Esitiedot:
R-ohjelman peruskäyttö on hanskassa.
Kenelle:
Aloittaville data-analyytikoille ja vastaaville, joiden tarvitsee työssään hyödyntää ennakoivan analytiikan mahdollisuuksia. R:n oppiminen on hyödyllistä myös kokeneille data-analyytikoille.
Sisältö:
• Liiketoimintaongelmien määrittely
• Aineistojen lataus ja tarkastelu: muuttujien jakaumat, visualisointi
• Aineistojen yhdistäminen ja aggregointi
• Muuttujien muunnokset ja uusien muuttujien luominen
• Aineistojen mallintaminen
• Tulosten tarkastelu eri näkökulmista
• Mallin tallentaminen ja soveltaminen uuteen aineistoon