Business Analytik pre Data Science II.

8h 3min
Čas
77
Kapitol
Programovanie
Kategória
-
Hodnotenie
Mierne pokročilý
Level
slovenský
Jazyk kurzu

Popis kurzu Business Analytik pre Data Science 2 (machine learning)

Ste pripravení prehĺbiť svoje vedomosti o Data Science? V tomto kurze sa naučíte vytvárať atribúty pre machine learningové modely, pochopíte princípy strojového učenia, spoznáte rôzne rodiny modelov a naučíte sa ich správne používať. Taktiež pochopíte ako vyhodnotiť kvalitu prediktívnych modelov a ako vyzerá proces nasadenia modelu do reálneho sveta, v ktorom môže byť využívaný a prinášať skutočnú hodnotu. 

Upozornenie: V tomto kurze sa NEbudeme učiť “hands-on” Data Science. Tento kurz je pre Vás teda vhodný aj keď nemáte v budúcnosti plány programovať v Pythone alebo SQL-ku. Ak takéto plány máte, tak Vás kurz naučí mnoho veľmi potrebných konceptov, ktoré v budúcnosti určite aj prakticky implementujete. Tento kurz je prirodzeným pokračovaním kurzu Business Analytik pre Data Science 1 (definovanie projektu).

Čo sa v kurze Business Analytik pre Data Science 2 naučíte? 


Prejdime si jednotlivými kapitolami, ktoré na Vás v kurze Business Analytik pre Data Science II. čakajú:

Inferencia a prediktívne modelovanie

Keď už máme poňatie o našich dátach, využitie machine learningu a prediktívneho modelovania môže byť hodnotné. V tejto časti kurzu si uvedieme základné princípy prediktívneho modelovania. Napríklad, povieme si prečo je dôležité nechať si časť našich historických dát “bokom” a neučiť sa z nich (takzvaný holdout set). Existujú taktiež rôzne filozofie využitia prediktívnych modelov - môžeme sa, napríklad, snažiť o vytvorenie jednoduchého modelu alebo modelu, ktorý bude mať veľmi vysokú presnosť. Existuje veľa rôznych “rodín” modelov strojového učenia, ktoré môžeme použiť, a preto si ich predstavíme (PS: toto je naozaj zábavná časť kurzu :) ). Predstavíme si lineárne modely, rozhodovacie stromy, náhodné lesy a dokonca aj neurónové siete! Všetky tieto znalosti použijeme v nasledujúcej časti kurzu.

Klasifikačné a regresné problémy

Je čas ísť do hĺbky strojového učenia a prediktívneho modelovania. Zameriame sa na dva základné problémy, s ktorými sa pri supervised learningu môžeme stretnúť. Tými sú klasifikačný a regresný problém. Na vyriešenie klasifikačného problému vybudujeme rozhodovací strom a na vyriešenie regresného problému zas lineárnu regresiu. V oboch prípadoch sa pozrieme do srdca týchto machine learningových modelov, kde sa nachádza takzvaná “cost function”. No a nakoniec sa musíme zamyslieť ako vyhodnotiť presnosť a úspešnosť týchto modelov. Povieme si teda, napríklad, o nástrojoch ako “confusion matrix” alebo “residual analysis”.

Uvedenie modelu “do produkcie”

Počas kurzu sme už vytvorili rôzne modely Data Science - od vizualizácií až po modely strojového učenia. Ak ich však necháme takpovediac “na papieri”, tak z nich, samozrejme, žiadny úžitok nebude. Potrebujeme ich využívať v praxi a dať ich do produkcie. Tento posledný krok však nie je úplne priamočiary. Náš model potrebujeme chápať ako experiment a rátať napríklad s tým, že sa rôzne veci môžu pokaziť. Nemusíte sa však báť, o všetkom podstatnom si povieme v poslednej časti kurzu!

Čo po kurze Business Analytik pre Data Science II. dokážete a čo si odnesiete?

  • Znalosť o základných princípoch prediktívneho modelovania - napríklad, čo je to holdout set alebo aký je rozdiel medzi “statistical learning” a “machine learning”.
  • Vedomosť o srdci každého prediktívneho modelu - “cost function” a ako ju model využíva pri učení sa z dát.
  • Základnú znalosť o lineárnych modeloch, neurónových sieťach, rozhodovacích stromoch, distance-based modeloch, ensemble modeloch, algoritmoch na detekciu anomálií a redukciu dimenzionality.
  • Schopnosť vyhodnotiť kvalitu klasifikačného a regresného modelu.
  • Základnú znalosť o procese nasadzovania machine learning modelu do reálneho sveta.

Má kurz Business Analytika pre Data Science II. vstupné požiadavky?

Základná znalosť princípov Data Science. Môžete ju získať, napríklad, pomocou nášho kurzu Spoznaj Data Science a Business Analytik pre Data Science 1 (definovanie projektu). Ak ste tieto kurzy neabsolvovali tak je dôležité, aby ste:  
  • zvládali stredoškolskú matematiku,
  • vedeli základné informácie o tom, čo je data science, machine learning, databáza alebo štatistika,
  • vedeli o základných štatistických nástrojoch ako počítanie priemeru alebo smerodajnej odchýlky,

Žiadne technické znalosti (ako napríklad programovanie v Pythone) nie sú potrebné.

Čo všetko v kurze Business Analytik pre Data Science II. dostanete?

  • videotutoriály o Business Analytik pre Data Science 2 (machine learning),
  • moderované diskusné fórum, v ktorom na vaše otázky odpovedá lektor Róbert Barcík,
  • certifikát o absolvovaní online kurzu Business Analytik pre Data Science 2 (machine learning),
  • garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom.

Zoznam kapitol

Vytváranie a vyberanie atribútov
Čo je vytváranie atribútov?
Dostupné len po zakúpení prístupu
Prehľad typov atribútov
Dostupné len po zakúpení prístupu
Vytváranie numerických atribútov 1
Dostupné len po zakúpení prístupu
Vytváranie numerických atribútov 2
Dostupné len po zakúpení prístupu
Vytváranie kategorických atribútov
Dostupné len po zakúpení prístupu
Atribúty času a dátumu
Dostupné len po zakúpení prístupu
Vytváranie atribútov pomocou agregácie
Dostupné len po zakúpení prístupu
Chýbajúce hodnoty
Dostupné len po zakúpení prístupu
Preferujte pozorované a odvodené atribúty
Dostupné len po zakúpení prístupu
Využívajte špecifické atribúty
Dostupné len po zakúpení prístupu
Etika a férovosť pri vytváraní atribútov
Dostupné len po zakúpení prístupu
Čo je výber atribútov
Dostupné len po zakúpení prístupu
Hra vyberania atribútov
Dostupné len po zakúpení prístupu
Metódy výberu atribútov (prehľad)
Dostupné len po zakúpení prístupu
Vytváranie atribútov z textu
Dostupné len po zakúpení prístupu
Vytváranie atribútov z obrázkov
Dostupné len po zakúpení prístupu
Základné princípy strojového učenia
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Supervised Learning (príklady)
Dostupné len po zakúpení prístupu
Unsupervised Learning (príklady)
Dostupné len po zakúpení prístupu
Reinforcement Learning (príklady)
Dostupné len po zakúpení prístupu
Formulácia problému
Dostupné len po zakúpení prístupu
Funkcia prírody
Dostupné len po zakúpení prístupu
Nákladová funkcia
Dostupné len po zakúpení prístupu
Tréningové, zadržané a produkčné dáta
Dostupné len po zakúpení prístupu
Vytvorenie zadržaných dát nemusí byť priamočiare
Dostupné len po zakúpení prístupu
Pretrénovaný a nedotrénovaný model
Dostupné len po zakúpení prístupu
Rodiny modelov strojového učenia
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Modely založené na vzdialenosti (distance-based)
Dostupné len po zakúpení prístupu
Lineárne modely
Dostupné len po zakúpení prístupu
Neurónové siete
Dostupné len po zakúpení prístupu
Rozhodovací strom (decision tree)
Dostupné len po zakúpení prístupu
Ansámblové modely (Ensemble models)
Dostupné len po zakúpení prístupu
Rozhodnutie o rodine modelu
Dostupné len po zakúpení prístupu
Dve kultúry
Dostupné len po zakúpení prístupu
Regresia a jej vyhodnotenie
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Regresný problém
Dostupné len po zakúpení prístupu
Nákladová funkcia regresie
Dostupné len po zakúpení prístupu
Prvotný (baseline) regresný model
Dostupné len po zakúpení prístupu
Trénovanie modelu lineárnej regresie
Dostupné len po zakúpení prístupu
Predikovanie pomocou regresného modelu
Dostupné len po zakúpení prístupu
Porovnanie s prvotným modelom
Dostupné len po zakúpení prístupu
Vyhodnotenie regresného modelu
Dostupné len po zakúpení prístupu
Interpolácia a extrapolácia
Dostupné len po zakúpení prístupu
Klasifikácia a jej vyhodnotenie
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Klasifikačný problém
Dostupné len po zakúpení prístupu
Nákladová funkcia klasifikačného modelu
Dostupné len po zakúpení prístupu
Prvotný (baseline) klasifikačný model
Dostupné len po zakúpení prístupu
Trénovanie rozhodovacieho stromu
Dostupné len po zakúpení prístupu
Pretrénovaný a nedotrénovaný strom
Dostupné len po zakúpení prístupu
Predpovedanie natrénovaným stromom
Dostupné len po zakúpení prístupu
Matica zmien (confusion matrix)
Dostupné len po zakúpení prístupu
Celková správnosť / Presnosť (accuracy)
Dostupné len po zakúpení prístupu
Špecifita (precision) a senzitivita (recall)
Dostupné len po zakúpení prístupu
Nevybalansované dáta
Dostupné len po zakúpení prístupu
Učenie bez učiteľa
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Zhlukovanie - segmentácia zákazníkov
Dostupné len po zakúpení prístupu
Zhlukovanie - odporúčacie systémy
Dostupné len po zakúpení prístupu
Zhlukovanie - učenie poloriadené učiteľom
Dostupné len po zakúpení prístupu
Redukcia dimenzionality - vizualizácia
Dostupné len po zakúpení prístupu
Redukcia dimenzionality - príprava údajov
Dostupné len po zakúpení prístupu
Redukcia dimenzionality - separácia signálu
Dostupné len po zakúpení prístupu
Detekcia anomálií - odľahlé hodnoty
Dostupné len po zakúpení prístupu
Detekcia anomálií - chybné výrobky
Dostupné len po zakúpení prístupu
Detekcia anomálií - podvody
Dostupné len po zakúpení prístupu
Data Science modely v produkcii
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Môj model je vlastne experiment...
Dostupné len po zakúpení prístupu
Vytvorte si metriky
Dostupné len po zakúpení prístupu
Definujte AB testing
Dostupné len po zakúpení prístupu
Definujte experiment
Dostupné len po zakúpení prístupu
Zhrnutie experimentu
Dostupné len po zakúpení prístupu
Validácia dát
Dostupné len po zakúpení prístupu
Prepracovanie pre produkčné prostredie
Dostupné len po zakúpení prístupu
Vyčistenie pre produkčné prostredie
Dostupné len po zakúpení prístupu
Slučky spätnej väzby
Dostupné len po zakúpení prístupu
Nedeklarovaní spotrebitelia
Dostupné len po zakúpení prístupu
Stabilizácia zdrojov dát
Dostupné len po zakúpení prístupu

Pozri aj tieto kurzy

9 Online kurzov
0 Príspevkov
Prejsť na kanál

Rekvalifikovať sa dnes môže každý

Či už si zamestnaný alebo ešte len hľadáš prácu, si tu správne. Nakopni svoju kariéru pomocou vzdelávacieho programu v odbore, ktorý ťa zaujíma.