PROGRAM KURSA

PLAN kroz oblasti:

 

OSNOVE:

Počećemo tako što ćemo preći preko data science osnova i upoznati vas sa velikim brojem neophoding znanja i alata koji se koriste u industriji. U ovim početnim lekcijama, upoznaćete okruženja sa naučno programiranje i ključne koncepte iz statistike i  matematike koji se u arsenalu data science profesionalaca.

SciPy Stack: NumPy,pandas and matplotlib

Statistika: Verovatnoća, statistička distribucija, testiranje, deskriptivna statistika

Optimizacija: gradient descent, vremenska kompleksnost (O-notacija)

 

ANALIZA PODATAKA:

Polaznici će rešavati široki spekatar problema kroz razne metode exploratory data analysis. Prikupljanje, čišćenje, analiza i vizualizacija sirovih (raw) podataka je jedan od glavnih i najvažnijih zadataka koje data scientist sreće. Kroz ovu oblast polaznici će naučiti da otkriju patterne i trendove koji utiču na dalje modelovanje problema.

Dimensionality reduction: principal component analysis, multi-dimensional scaling

Data preprocessing: feature selection, data cleaning, outlier detection, feature engenieering, data transformation

Vizualizacija podataka: vizualizacija statističkih momentana, upotreba matplotlib, vizualizacija grafova, d3.js

 

MAŠINSKO UČENJE:

Naučićemo kako da istražujemo novi skup podatka, implementriamo veliki broj komplesknih alogritama mašinskog učenja. Ovladaćete svim komponentama predikativnog modelovanja — od preprocesiranja podataka, kreiranja novih atributa, selekcije metoda, njihove evaluacije i optimizovanja paramatara.

Prediktivni metodi: klasifikacija, evaluacija modela, složeni (ensemble) modeli, hyperparameter optimization, auto-ml (automatsko mašinsko učenje)

Data mining metodi: klastering, assocition rules, graf metodi, sistemi za preporučivanje (recommender systems)

Posebne teme: procesiranje prirodnog jezika (natural language processing), pretraživanje informacija (information retrieval), web mining

Mašinsko učenje: metodi klasifikacije, metodi klasteringa, ensambl metodi, optimizacija parametra, automatsko upravljanje

 

DATA ENGINEERING:

Kroz primere, zadatke i završni projekat upoznaćete se sa načinom izgradnje data science sistema. Ovladaćete korišćenjem biblioteka, platformi i okruženja koje su neophodne za rešavanja stvarnih problema i uspeh u data science industriji. Naučićete šta je to horizontalna skalabilnost, kako se pristupa i upravlja velikim količinama podataka i na koji način se data science rešenje .

Big data: spark, elasticserch, elastic map-reduce

Paralelizacija algoritama: map-reduce, mlib

 

 

Okvirni plan predavanja kursa:

 

PODACI, RAD SA PODACIMA I OSNOVE STATISTIKE:

Naučićete kako da manipulišete podacima uz pomoć pandas bilblioteke i kako da koristite numpy za matematičke operacija nad podacima. Podsetnik na osnovne metode statističke sumarizacije podataka i njihovo predstavljanje, i pravi pravi data science problem kroz EDA — exploratory data analysis. I na kraju kao uvod za sledeću nedelju optimizacija funkcija i razlika između opisivanja i predviđanja.

 

KLASIFIKACIJA:

Jedan od najčećih problema sa kojima se data scientist susreće. Razumećete šta je i kako radr i kada se koriste metodi sa klasifikaciju. Akcenat je na kombinaciji teorijskog razumevanja algoritama (regresija, support-vector machines, stabla odlučianja) i njihove konkretne primene u scikit-learn bibliotekama. I prvi pravi mini-projekat.

 

KLASTERING:

Kako definisati sličnost i kako grupisati podatke u smislene grupe. Naučićete kako se automatski kreiraju grupe, na koji način možete da optimizujete i procenite kvalitet tih grupa. Uvod u probleme kao što su segmentisanje tržišta, kreiranje grupa na društvenim mrežama…

 

RAD SA TEKSTUALNIM I VELIKIM PODACIMA:

Kako radi i kako napraviti search engine, kako od nestruktuiranih dokumenta napraviti podatke koje možete da koristite kao ulaz bilo u algoritme klasifikacije ili klasteringa. Kako računar razume tekst. Kroz demonstracije u elasticsearch  i nlptk platformi razumećete na koji način možete da uspešno da se izborite sa prirodnim jezikom. Specifičnosti rada sa velikim podacima kroz razumevanje horizontalne skalabilnosti, uvod u map/reduce kroz spark i uvod u mlib za data science na ogromnim količinama podataka. Posle ovoga moći ćete uspešto da rešavate probleme bez obzira na količinu podataka.

 

SISTEMI ZA PREPORUČIVANJE I VIZUELIZACIJU:

Naučićete kao da na najbolji način predstavite rezultate algoritama. Kako da uspešno koristite bilbioteke za vizualizaciju da prenesete poruku onoga sto je data science otkrio. Potom će te da naučite kako rade sistemi za preporučivanje (recommender systems) kako jedan on najprisutnijih DS problema. Kako da na osnovu prethodnih preferencija predivite buduće.

 

NEURONSKE MREŽE:

Šta su to neuronske mreže? Kako se prave? Koje su vrste? Šta mogu da urade? I zašto su danas toliko popularne? Kroz praktične primere u keras/tensorflow bibliotekama dobićete odgovore na ova pitanja i dovoljno znanja da izgradite vašu (prvu) neuronsku mrežu i uspešno je primenite na neki problem.

 

HAKATLON:

Sve što ste naučili u prethodnih 6 nedelja fokusira se na izgradnju demo projekta kroz zajednički rad sa predavačima i mentorima. Kroz 2 dana trebalo bi da osmislite projekat, postavite ga na ispravne temelje i manje više završite ono što ste zamislili. Taj projekat treba da služi da uspešno demonstrirate šta ste naučili. Uz asistenciju mentora i predavača i podršku u infrasrukturi ovaj poslednji vikend trebalo bi da bude prilika za rad uz uživanje.

 

Primer rasporeda:

SUBOTA:

10:00 – 10:15 — početak

10:15 – 11:45 — 2 časa sa blokovima predavanja

11:45 – 12:00 — pauza

12:00 – 13:30 — 2 časa sa blokovima predavanja

13:30 – 14:30 — ručak

14:30 – 16:00 — 2 časa sa blokovima predavanja

16:00 – 16:15 — pauza

16:15 – 18:15 — rad na zadacima

19:30(?) — večera

 

NEDELJA:

09:15 – 10:45 — 2 časa sa blokovima predavanja

10:45 – 11:00 — pauza

11:00 – 12:30 — 2 časa sa blokovima predavanja

12:30 – 13:30 — ručak

13:30 — rad na zadacima

 

PREKO NEDELJE:

RAD NA ZADACIMA

MENTORSKI RAD — 1 ČAS (ili 2 časa svake 2 nedelje) u vreme dogovoreno sa mentorom.

JEDAN MANJI PROJEKAT TOKOM KURSA

VELIKI PROJEKAT NA KRAJU

 

Prijavu za kurs možete popuniti klikom na link PRIJAVI SE!