Sadržaj predmeta
Teorijska i praktična nastava: Metodologija naučno istraživačkog rada u oblasti big data infrastrukture i servisa. Uloga big data infrastrukture i servisa u savremenom elektronskom poslovanju. Big data infrastruktura kao deo cloud infrastrukture. Hadoop ekosistem. Skladištenje podataka u cloud infrastrukturi. Analiza distribuiranih fajl sistema. HDFS. Strukturiranje podataka korišćenjem HBase-a. NoSQL baze podataka. Komparativna analiza big data baza podataka: Google BigTable, Amazon Dynamo, MongoDB, Cassandra. Distribuirano procesiranje podataka u cloud infrastrukturi. MapReduce. Paralelno programiranje i MapReduce. Distribuirano izvršavanje kompleksnih MapReduce poslova. Prioritetizacija i praćenje izvršavanja MapReduce poslova u realnom vremenu. Apstrakcija Hadoop MapReduce poslova korišćenjem Pig-a.Upravljanje resursima big data infrastrukture. Load balancing. Tehnike i algoritmi za analizu big data u elektronskom poslovanju. Rešavanje problema manipulacije nad podacima u elektronskom poslovanju: paralelno sortiranje, pretraga, analiza društvenih mreža, analiza imejlova. Integracija heterogenih log fajlova korišćenjem Flume-a. Importovanje i eksportovanje relacionih podataka korišćenjem Sqoop-a. Ad hoc upiti korišćenjem Hive-a. Hive fajl formati. Izvršavanje upita korišćenjem HiveQL-a. Upiti u realnom vremenu korišćenjem Impala. Analiza nestrukturiranih podataka u aplikacijama elektronskog poslovanja: detektovanje paterna, segmentacija onlajn tržišta, analiza ponašanja potrošača, analiza društvenih mreža, realizacija sistema preporuke u realnom vremenu, personalizovano onlajn oglašavanje. Apache Storm okvir za obradu podataka u realnom vremenu. Napredne analize podataka korišćenjem Mahout-a. Vizuelizacija podataka. Projektovanje i implementacija big data rešenja. Deployment rešenja na produkcioni klaster. Optimizacija performansi. Upravljanje data i computing nodovima. Pregled i analiza istraživanja povezanosti cloud computing, Internet of things i big data tehnologija. Analiza rezultata najnovijih istraživanja u oblasti big data sa pregledom najznačajnijih referenci.
Cilj predmeta
Cilj predmeta je osposobljavanje studenata za samostalan naučno istraživački rad, modeliranje novih rešenja i rešavanje aktuelnih problema u primeni big data infrastruktura i servisa u elektronskom poslovanju.
Literatura
- Materijali u e-formi, sa sajta www.elab.fon.bg.ac.rs
- B. Radenković, M. Despotović-Zrakić, Z. Bogdanović, D. Barać, A.Labus, Elektronsko poslovanje, FON, 2015.
- M.Despotović-Zrakić, V.Milutinović, A.Belić (Eds), High performance and cloud computing in scientific research and education, monografija, IGI Global, 2014.
- T.White, Hadoop: The Definitive Guide, O’Reilly Media, 2009.
- J.Dean, S.Ghemawat, MapReduce: Simplified Data Processing on Large Clusters, OSDI’04: Sixth Symposium on Operating System Design and Implementation, San Francisco, CA, December, 2004. http://research.google.com/archive/mapreduce.html
- M.Minelli, M.Chambers,A.Dhiraj, Big Data, Big Analytics: Emerging Business Intelligence and Analytic Trends for Today’s Businesses, Wiley, 2013.
- Internet inteligentnih uređaja, B. Radenković, M. Despotović-Zrakić, Z. Bogdanović, D.Barać, A.Labus, Ž. Bojović, Fakultet organizacionih nauka, 2017, ISBN:978-86-7680-304-0
- Praktikum Internet inteligentnih uređaja, B. Radenković, M. Despotović-Zrakić, Z.
Bogdanović , D. Barać, A. Labus, Fakultet organizacionih nauka, 2017