欧美视频一区二区三区,免费精品国产福利片,亚洲国产欧美日韩一区二区,337p欧洲亚大胆精品

推薦系統

本電商推薦系統項目，依托于真實(shí)的中文亞馬遜電商數據集，以及真實(shí)的電商企業(yè)業(yè)務(wù)數據體系，構建了符合教學(xué)體系的一體化電商推薦系統。本項目包含離線(xiàn)推薦與實(shí)時(shí)推薦兩大部分，綜合利用了協(xié)同過(guò)濾算法以及基于內容的推薦方法來(lái)提供混合推薦。

提供了從前端應用、后臺服務(wù)構建、算法設計實(shí)現、平臺部署等多方位的閉環(huán)的業(yè)務(wù)實(shí)現。本項目從電商項目體系入手，從基礎的推薦算法講起，引導學(xué)員一步步走進(jìn)推薦算法的深處，充分理解推薦系統的運作流程，拓寬技術(shù)視野。

適學(xué)人群

擁有多年從業(yè)經(jīng)驗的大數據從業(yè)者
渴望突破自我職業(yè)瓶頸，轉型推薦系統工作
具有數學(xué)學(xué)習背景的高校畢業(yè)生
希望可以從實(shí)際項目中理解推薦系統
提升工作經(jīng)驗

學(xué)習收獲

系統性梳理整合大數據技術(shù)知識與機器學(xué)習相關(guān)知識

深入了解推薦系統在電商企業(yè)中的實(shí)際應用

深入學(xué)習并掌握多種推薦算法

基于統計的離線(xiàn)推薦基于隱語(yǔ)義模型的離線(xiàn)推薦基于自定義模型的實(shí)時(shí)推薦基于Item-CF的離線(xiàn)相似推薦

推薦系統項目一數據模型

技術(shù)點(diǎn)

使用Flume、Kafka搭建實(shí)時(shí)數據采集系統，對多樣化的用戶(hù)行為數據和大體量的業(yè)務(wù)數據進(jìn)行采集清洗和系統調優(yōu)；
使用ALS算法對評分矩陣做矩陣分解，根據商品的隱語(yǔ)義特征計算商品之間的相似度，并將相似度做倒排索引，并將倒排數據持久化到MongoDB；
實(shí)時(shí)推薦：利用商品的相似度倒排，根據用戶(hù)商品評分或者點(diǎn)擊行為來(lái)做推薦，使用Spark Streaming來(lái)實(shí)時(shí)計算推薦優(yōu)先級，然后存儲到Redis中，提高用戶(hù)的訪(fǎng)問(wèn)體驗；
利用商品的標簽數據，使用TF/IDF來(lái)計算商品之間的相似度，同樣使用倒排的思路持久化道MongoDB；
使用Spark計算每個(gè)門(mén)類(lèi)的平均評分商品來(lái)解決冷啟動(dòng)問(wèn)題；

使用Spark將日志數據做分析和處理，然后持久化到MongoDB、ES等數據庫中，實(shí)現data loader功能；
通過(guò)A/B測試來(lái)評估推薦結果；
優(yōu)化Spark的計算效率，比如將一些數據進(jìn)行.cache()操作緩存，對某些數據做broadcast廣播到其他節點(diǎn)，加快運算；
使用Git進(jìn)行版本管理，遠程代碼倉庫使用自己搭建的gitlab；
將推薦系統引擎模塊化：als矩陣分解的相似度計算、基于tfidf的相似度計算、實(shí)時(shí)推薦模塊，每一個(gè)引擎都會(huì )產(chǎn)生一個(gè)推薦列表，對不同的引擎賦予不同的權重，然后合并列表，產(chǎn)生推薦數據。