Sadržaj kursa:
- Uvod u Big data tehnologije
Big data infrastruktura. Big data servisi. Big data kao deo cloud infrastrukture. Nerelacione baze podataka. Paralelno pretraživanje i procesiranje podataka. MapReduce. Projektovanje big data rešenja za preduzeća. Big data i otkrivanje znanja u podacima. - Big data analitika u Hadoop
Hadoop okvir za big data. Hadoop alati. HBase baza podataka. HiveQL upiti. Pisanje MapReduce programa korišćenjem Pig alata. Apache Impala analitička baza podataka. Nadgledanje izvršenja Hadoop poslova korišćenjem Ambari alata. Mahout biblioteka za mašinsko učenje. - Big data analitika u programskom jeziku Python
Osnove primene Python-a za manipulisanje podacima i analizu podataka. Osnove mašinskog učenja i primena Python-a i Python paketa u analitici podataka i mašinskom učenju. Korišćenje paketa : NumPy, Pandas, Bokeh, Agate, SciPy. - Real-time big data analitika
Big data analitika u realnom vremenu. Big data analitika i veštačka inteligencija. Streaming podataka. Apache Spark. Razvoj i upravljanje Spark aplikacijama. Mašinsko učenje u Apache Spark-u. Vizuelizacija podataka.
Izvođenje kursa je besplatno za sve učesnike. Teorijska i praktična nastava će se održavati u kabinetu 304 na Fakultetu organizacionih nauka. Tokom rada na navedenim temama, polaznici kursa će raditi na realizaciji projekta na zadatu temu.
Svi polaznici koji budu prisustvovali časovima i uspešno realizovali finalni projekat, po završetku kursa će dobiti sertifikat. Postojećim i budućim studentima Fakulteta organizacionih nauka, na osnovu stečenog sertifikata biće priznat deo predispitnih obaveza na jednom od sledećih predmeta Katedre za elektronsko poslovanje u zavisnosti od nivoa studija:
- Internet marketing – osnovne studije;
- Big data u elektronskom poslovanju – master studije;
- Internet marketing – odabrana poglavlja – specijalističke akademske studije;
- Big data infrastruktura i servisi– odabrana poglavlja – doktorske studije