關聯式資料庫-MySQL
非關聯式資料庫-MongoDB
雲端建置-Aamzon RDS、Atlas服務
使用原因:彈性、協同合作方便、避免硬體設備故障資料遺失
Aamzon RDS->MySQL-儲存經整理後的關聯式table eg.餐廳列表、景點列表等
Atlas->MongoDB-儲存爬取下來、尚未整理之原始資料 eg.景點評論、景點遊記、餐廳食記
爬蟲蒐集之各大景點遊記
(1) NLP預處理:Jieba斷詞及詞性篩選、TF/IDF、One-hot編碼
(2) 分群模型
(3) 風格貼標
嘗試不同分群演算法
(1) K-means
(2) 階層式分群
(3) DBSCAN
(1) PCA+TSNE降維->K-means分群
(2) 經調整得到7個風格群
(3) 風格群貼標:登山健行、戶外踏青、藝文館所、宗教祈福、親子共遊、文化古蹟、主題商圈