一、構(gòu)建離線數(shù)據(jù)分析平臺(tái)—用戶興趣取向分析
1.項(xiàng)目介紹及數(shù)據(jù)湖架構(gòu)與建設(shè)2.日志數(shù)據(jù)探索 3.Apache Kafka基礎(chǔ)及開發(fā) 4.Apache Flume基礎(chǔ)及使用案例 5.日志數(shù)據(jù)導(dǎo)入6.日志數(shù)據(jù)(Hive)ETL變換 7.機(jī)器學(xué)習(xí)及常用模型介紹 8.項(xiàng)目實(shí)戰(zhàn)—圖像分析9.建立日志推薦模型 10.Apache Oozie架構(gòu)及工作流模型11.日志數(shù)據(jù)ETL工作流 12.基于Spark Streaming的流數(shù)據(jù)處理和分析 13.使用Spark Streaming及ML實(shí)施用戶興趣取向?qū)崟r(shí)預(yù)測 14.建立Tableau與MySQL的鏈接,數(shù)據(jù)可視化及生成日志報(bào)表 15.項(xiàng)目部署 16.Apache NiFi基礎(chǔ)及架構(gòu)17.日志數(shù)據(jù)流程(data flow)開發(fā) 18.Cassandra基礎(chǔ)及使用 19.Cassandra與Spark的集成20.日志數(shù)據(jù)(Spark)ETL開發(fā) 21.Redis基礎(chǔ)及使用 22.Redis與Spark的集成23.企業(yè)數(shù)據(jù)監(jiān)管綜述及實(shí)施 24.項(xiàng)目大總結(jié)
二、實(shí)時(shí)流處理平臺(tái)—股票流數(shù)據(jù)實(shí)時(shí)分析
1.項(xiàng)目介紹及數(shù)據(jù)格式定義2.Apache Kafka開發(fā) 3.股票數(shù)據(jù)爬取 4.基于Confluent的股票元數(shù)據(jù)管理及應(yīng)用 5.基于Apache Flink流數(shù)據(jù)處理及實(shí)時(shí)分析 6.使用Apache Flink實(shí)施股票的實(shí)施分析 7.Grafana/Zeppelin數(shù)據(jù)可視化
三、混合計(jì)算項(xiàng)目實(shí)戰(zhàn)—教育平臺(tái)大數(shù)據(jù)分析
1.項(xiàng)目介紹及數(shù)據(jù)格式定義2.Apache Kafka開發(fā)3.Flume采集數(shù)據(jù) 4.Hive數(shù)據(jù)分析及處理 5.Spark數(shù)據(jù)分析及處理 6.Spark Streaming實(shí)現(xiàn)數(shù)據(jù)處理 7.工作流調(diào)度 8.可視化開發(fā)
四、阿里云大數(shù)據(jù)ACP認(rèn)證
1.電影評價(jià)數(shù)據(jù)的采集2.基于LBS的熱點(diǎn)店鋪搜索 3.搭建社交好友推薦系統(tǒng) 4.TensorFlow框架識(shí)別圖片5.模擬搭建數(shù)據(jù)中心 6.數(shù)據(jù)倉庫系統(tǒng)的運(yùn)維優(yōu)化 7.搭建運(yùn)營工單數(shù)據(jù)分析系統(tǒng)8.海量電力設(shè)備監(jiān)測數(shù)據(jù)分析