Späť

IBM® SPSS® Modeler: Príprava dát pre modelovanie

  • Termín: Bude upresnený
  • Miesto:

Počet výukových dní:
3 (24 výukových hodín)

Výuka prebieha v jazyku:
slovenčina

Náročnosť kurzu:
základné

Príprava dát je nutnou podmienkou akejkoľvek následnej analýzy. Chybná alebo nekvalitní príprava má za následok chybné závery či nevhodné modely. V dataminingovej metodológii CRISP-DM je príprave dát venovaná jedna fáza, ktorú užívatelia hodnotia ako časovo najnáročnejšiu. V praxi neexistujú dáta, ktoré by nevyžadovali žiadne úpravy pred analýzou a modelovaním. Typické operácie vo fáze prípravy dát zahŕňajú zlučovanie zdrojov, agregovanie, reštrukturalizáciu, prosté aj sekvenčné odvodzovanie atribútov, formátovanie, výbery, doplňovanie vynechaných hodnôt či hľadanie duplicít. Hoci ide mnohé operácie zapísať v SQL alebo nejakom programovacom jazyku, tento prístup je časovo náročný, neprehľadný a odvádza pozornosť dataminera od cieľa projektu.

Kurz data miningu jsem zvolil, abych doplnil své znalosti z oblasti statistiky. Tempo výuky bylo naprosto odpovídající a vyhovovalo myslím všem účastníkům nehledě na odlišnou vstupní úroveň. Poznatky kurzu rozhodně využiji pro automatizovanou úpravu dat do formátu potřebného ke statistické analýze.

Ing. Michal Jirásek
Masarykova univerzita
Ekonomicko-správní fakulta

Cieľ vzdelávacieho programu:

Cieľom kurzu je naučiť účastníkov pripravovať si dáta pomocou vizuálneho programovania v prostredí IBM SPSS Modeler. Naučia sa pracovať s procesnými uzlami tohto softvéru, osvoja si aj špeciálne manipulačné funkcie jazyka CLEM. Spoločne s prípravou dát sa budeme venovať aj ich vizualizácii, pretože interaktívna grafika IBM SPSS Modeler umožňuje generovať mnoho dátových manipulácií ad hoc priamo z grafov.

Kurz je určený:

Kurz je určený pre analytikov, dataminerov a dátový špecialistov, ktorí budú pre svoju prácu používať alebo používajú softvér IBM SPSS Modeler.

Predpoklady:

Pre úspešné absolvovanie kurzu postačí užívateľská znalosť práce na počítači, ovládať sotware IBM SPSS Modeler sa účastníci naučia na kurze.

Prínos účasti na kurze:

Účastníci budú vedieť používať uzly dátových manipulácií v softvéri IBM SPSS Modeler. Naučia sa pripojiť na dátové zdroje, analyzovať kvalitu dát, zlúčiť zdroje do modelovacej matice a dáta upraviť tak, aby poskytovali kvalitný vstup pre modelovacie metódy.

Popis obsahu a postupu:

Kurz prebieha v softvéri IBM SPSS Modeler. Systematicky sú preberané dátové manipulácie, ktoré tento softvér ponúka.

Program kurzu*:

  1. dátové formáty a prístup k dátam, ODBC
  2. vizuálne programovanie
  3. uzly IBM SPSS Modeler pre prácu so záznamami (Record Operations)
  4. uzly IBM SPSS Modeler pre prácu s premennými (Field Operations)
  5. zápis manipulačných formúl v jazyku CLEM
  6. dátový audit a interaktívne výstupy IBM SPSS Modeler

* Vo výnimočných prípadoch zmena programu vyhradená podľa zamerania a skúseností danej skupiny účastníkov.

Používaný softvér:

IBM SPSS Modeler Professional.