具有大數據從業(yè)經(jīng)驗
希望進(jìn)一步提升行業(yè)經(jīng)驗
拓寬晉升通道
有一定技術(shù)基礎
希望了解大數據行業(yè)
進(jìn)入用戶(hù)畫(huà)像
機器學(xué)習的細分通道
熟悉Linux、Hadoop
Hive、Flume
Kafka 等基礎框架
有Scala和SQL語(yǔ)言基礎
充分理解用戶(hù)畫(huà)像管理平臺的搭建及使用、用戶(hù)畫(huà)像系統的設計思路,以及標簽的設計流程及應用
了解用戶(hù)畫(huà)像平臺的數據庫表的構造,包括標簽表、任務(wù)表、進(jìn)度表等全部表含義
掌握如何使用Spark進(jìn)行標簽開(kāi)發(fā),包括標簽的計算、重組、導出等操作,學(xué)會(huì )標簽計算業(yè)務(wù)處理的全流程
掌握使用ClickHouse和Redis對畫(huà)像數據的存儲和多標簽的組合篩選
掌握利用SpringBoot和Mybatis等框架完成用戶(hù)分群
掌握利用SparkMllib的機器學(xué)習算法完成挖掘類(lèi)標簽開(kāi)發(fā)
使用Scala作為開(kāi)發(fā)語(yǔ)言編寫(xiě)Spark程序完成對標簽數據的處理;
利用Vue+SpringBoot搭建整體用戶(hù)畫(huà)像平臺,實(shí)現用戶(hù)畫(huà)像項目的全流程平臺化管理;
利用ClickHouse的位圖表完成對用戶(hù)標簽的快速即席查詢(xún);
利用SparkMllib中的機器學(xué)習算法實(shí)現對挖掘類(lèi)標簽的計算,掌握機器學(xué)習算法的使用。