Skip to content

Cynthia-He02/TFB102-G2_travel_project

 
 

Repository files navigation

TFB102-G2_雙北同玩捷

台北捷運旅遊推薦系統

專題引言及架構

負責報告人:康瑋



資料蒐集與清洗

負責報告人:成澐



資料庫建置

負責報告人:怡陵

使用資料庫

關聯式資料庫-MySQL
非關聯式資料庫-MongoDB

建置方式

雲端建置-Aamzon RDS、Atlas服務
使用原因:彈性、協同合作方便、避免硬體設備故障資料遺失

資料儲存規劃

Aamzon RDS->MySQL-儲存經整理後的關聯式table eg.餐廳列表、景點列表等
Atlas->MongoDB-儲存爬取下來、尚未整理之原始資料 eg.景點評論、景點遊記、餐廳食記

演算法及分析

Part 1-分群

負責報告人:怡陵

分群使用資料

爬蟲蒐集之各大景點遊記

分群步驟

(1) NLP預處理:Jieba斷詞及詞性篩選、TF/IDF、One-hot編碼
(2) 分群模型
(3) 風格貼標

分群方式

嘗試不同分群演算法
(1) K-means
(2) 階層式分群
(3) DBSCAN

分群結果

(1) PCA+TSNE降維->K-means分群
(2) 經調整得到7個風格群
(3) 風格群貼標:登山健行、戶外踏青、藝文館所、宗教祈福、親子共遊、文化古蹟、主題商圈

Part 2-word2vec

負責報告人:奕如



Part 3-協同過濾

負責報告人:佳宜



Part 4-圖片辨識

負責報告人:佳宜



作品展示與前後端串接

負責報告人:康瑋



未來展望

負責報告人:康瑋



About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%