📊 總樣本數
538,069
唯一玩家: 204,836
🎯 訓練集樣本
429,614
玩家數: 163,948 (80%)
✅ 驗證集樣本
108,455
玩家數: 40,888 (20%)
⏰ 持續追蹤玩家
16,678
驗證集樣本: 25,970
📈 模型性能對比
評估指標說明
整體準確率: 所有預測正確的比例 | 持續追蹤玩家: 對持續活躍玩家的預測準確率(預測>0即為正確)| 已流失玩家: 對已流失玩家的預測準確率(需精確匹配)| 二分類準確率: 預測流失(0)或留存(>0)的準確率
🔥 混淆矩陣詳細分析
類別定義
類別0: 0-100轉 | 類別1: 101-500轉 | 類別2: 501-1000轉 | 類別3: 1001-5000轉 | 類別4: 5001+轉
類別 0 (0~100轉)
實際樣本數: 47,978
預測正確數: 34,063 (71.0%)
預測為 0 (0~100):
34,063 (71.0%)
預測為 1 (101~500):
7,498 (15.6%)
預測為 2 (501~1000):
2,253 (4.7%)
預測為 3 (1001~5000):
3,375 (7.0%)
預測為 4 (5001+):
789 (1.6%)
類別 1 (101~500轉)
實際樣本數: 26,640
預測正確數: 7,043 (26.4%)
預測為 0 (0~100):
10,119 (38.0%)
預測為 1 (101~500):
7,043 (26.4%)
預測為 2 (501~1000):
2,994 (11.2%)
預測為 3 (1001~5000):
5,204 (19.5%)
預測為 4 (5001+):
1,280 (4.8%)
類別 2 (501~1000轉)
實際樣本數: 9,913
預測正確數: 1,548 (15.6%)
預測為 0 (0~100):
2,320 (23.4%)
預測為 1 (101~500):
1,837 (18.5%)
預測為 2 (501~1000):
1,548 (15.6%)
預測為 3 (1001~5000):
3,250 (32.8%)
預測為 4 (5001+):
958 (9.7%)
類別 3 (1001~5000轉)
實際樣本數: 17,601
預測正確數: 7,240 (41.1%)
預測為 0 (0~100):
2,723 (15.5%)
預測為 1 (101~500):
1,937 (11.0%)
預測為 2 (501~1000):
2,055 (11.7%)
預測為 3 (1001~5000):
7,240 (41.1%)
預測為 4 (5001+):
3,646 (20.7%)
類別 4 (5001+轉)
實際樣本數: 6,323
預測正確數: 3,507 (55.5%)
預測為 0 (0~100):
486 (7.7%)
預測為 1 (101~500):
237 (3.7%)
預測為 2 (501~1000):
296 (4.7%)
預測為 3 (1001~5000):
1,797 (28.4%)
預測為 4 (5001+):
3,507 (55.5%)
類別 0 (0~100轉)
實際樣本數: 47,978
預測正確數: 42,075 (87.7%)
預測為 0 (0~100):
42,075 (87.7%)
預測為 1 (101~500):
3,928 (8.2%)
預測為 2 (501~1000):
12 (0.0%)
預測為 3 (1001~5000):
1,846 (3.8%)
預測為 4 (5001+):
117 (0.2%)
類別 1 (101~500轉)
實際樣本數: 26,640
預測正確數: 6,580 (24.7%)
預測為 0 (0~100):
15,666 (58.8%)
預測為 1 (101~500):
6,580 (24.7%)
預測為 2 (501~1000):
35 (0.1%)
預測為 3 (1001~5000):
4,119 (15.5%)
預測為 4 (5001+):
240 (0.9%)
類別 2 (501~1000轉)
實際樣本數: 9,913
預測正確數: 26 (0.3%)
預測為 0 (0~100):
4,204 (42.4%)
預測為 1 (101~500):
2,578 (26.0%)
預測為 2 (501~1000):
26 (0.3%)
預測為 3 (1001~5000):
2,905 (29.3%)
預測為 4 (5001+):
200 (2.0%)
類別 3 (1001~5000轉)
實際樣本數: 17,601
預測正確數: 7,790 (44.3%)
預測為 0 (0~100):
5,202 (29.6%)
預測為 1 (101~500):
3,460 (19.7%)
預測為 2 (501~1000):
47 (0.3%)
預測為 3 (1001~5000):
7,790 (44.3%)
預測為 4 (5001+):
1,102 (6.3%)
類別 4 (5001+轉)
實際樣本數: 6,323
預測正確數: 1,808 (28.6%)
預測為 0 (0~100):
1,058 (16.7%)
預測為 1 (101~500):
397 (6.3%)
預測為 2 (501~1000):
8 (0.1%)
預測為 3 (1001~5000):
3,052 (48.3%)
預測為 4 (5001+):
1,808 (28.6%)
類別 0 (0~100轉)
實際樣本數: 47,978
預測正確數: 15,885 (33.1%)
預測為 0 (0~100):
15,885 (33.1%)
預測為 1 (101~500):
27,133 (56.5%)
預測為 2 (501~1000):
4,577 (9.5%)
預測為 3 (1001~5000):
355 (0.7%)
預測為 4 (5001+):
28 (0.1%)
類別 1 (101~500轉)
實際樣本數: 26,640
預測正確數: 13,069 (49.1%)
預測為 0 (0~100):
4,793 (18.0%)
預測為 1 (101~500):
13,069 (49.1%)
預測為 2 (501~1000):
7,595 (28.5%)
預測為 3 (1001~5000):
1,142 (4.3%)
預測為 4 (5001+):
41 (0.2%)
類別 2 (501~1000轉)
實際樣本數: 9,913
預測正確數: 4,143 (41.8%)
預測為 0 (0~100):
1,098 (11.1%)
預測為 1 (101~500):
3,852 (38.9%)
預測為 2 (501~1000):
4,143 (41.8%)
預測為 3 (1001~5000):
794 (8.0%)
預測為 4 (5001+):
26 (0.3%)
類別 3 (1001~5000轉)
實際樣本數: 17,601
預測正確數: 3,049 (17.3%)
預測為 0 (0~100):
1,272 (7.2%)
預測為 1 (101~500):
4,937 (28.1%)
預測為 2 (501~1000):
8,205 (46.6%)
預測為 3 (1001~5000):
3,049 (17.3%)
預測為 4 (5001+):
138 (0.8%)
類別 4 (5001+轉)
實際樣本數: 6,323
預測正確數: 432 (6.8%)
預測為 0 (0~100):
216 (3.4%)
預測為 1 (101~500):
900 (14.2%)
預測為 2 (501~1000):
2,294 (36.3%)
預測為 3 (1001~5000):
2,481 (39.2%)
預測為 4 (5001+):
432 (6.8%)
📈 每日類別0趨勢分析 (2026/01/08 - 2026/03/17)
圖表說明
此圖展示驗證集中每日的真實類別0比例、各模型預測類別0比例、以及實際隔日流失率的趨勢變化
💡 關鍵發現
1. XGBoost 表現最佳
整體準確率 62.37%,在非活躍玩家預測上顯著優於其他模型(60.46% vs 52.73%/34.46%)
2. Ordinal Logistic 對活躍玩家偏好強
持續追蹤玩家準確率高達 91.53%,但已流失玩家僅 34.46%,存在明顯的預測偏差
3. 二分類任務更可行
三個模型的二分類準確率均達 63-73%,顯著高於多分類精確預測(48-62%)
4. 建議採用兩階段預測
第一階段: 預測玩家是否流失(二分類)| 第二階段: 對留存玩家預測價值層級(多分類)
📊 總樣本數
538,069
唯一玩家: 204,836
🎯 訓練集樣本
429,614
玩家數: 163,948 (80%)
✅ 驗證集樣本
108,455
玩家數: 40,888 (20%)
⚖️ 類別平衡度
49.4% / 50.6%
流失 / 留存
📈 模型性能對比
評估指標說明
準確率: 預測正確的比例 | AUC-ROC: 模型整體區分能力(0.5-1.0,越高越好)| 精確率: 預測為留存的準確度 | 召回率: 找出留存玩家的能力 | F1分數: 精確率和召回率的調和平均
📊 訓練集類別分布
流失: 212,225 (49.4%) | 留存: 217,389 (50.6%)
📊 驗證集類別分布
流失: 53,060 (48.9%) | 留存: 55,395 (51.1%)
🔥 混淆矩陣詳細分析
隨機森林 - 73.21%
XGBoost - 73.19%
邏輯回歸 - 67.64%
實際流失 (剩餘轉數 0~100)
實際樣本數: 53,060
預測正確數: 40,894 (77.1%)
✓ 預測為流失:
40,894 (77.1%)
✗ 預測為留存:
12,166 (22.9%)
實際留存 (剩餘轉數 >100)
實際樣本數: 55,395
預測正確數: 38,506 (69.5%)
✗ 預測為流失:
16,889 (30.5%)
✓ 預測為留存:
38,506 (69.5%)
實際流失 (剩餘轉數 0~100)
實際樣本數: 53,060
預測正確數: 41,094 (77.5%)
✓ 預測為流失:
41,094 (77.5%)
✗ 預測為留存:
11,966 (22.5%)
實際留存 (剩餘轉數 >100)
實際樣本數: 55,395
預測正確數: 38,280 (69.1%)
✗ 預測為流失:
17,115 (30.9%)
✓ 預測為留存:
38,280 (69.1%)
實際流失 (剩餘轉數 0~100)
實際樣本數: 53,060
預測正確數: 32,585 (61.4%)
✓ 預測為流失:
32,585 (61.4%)
✗ 預測為留存:
20,475 (38.6%)
實際留存 (剩餘轉數 >100)
實際樣本數: 55,395
預測正確數: 40,770 (73.6%)
✗ 預測為流失:
14,625 (26.4%)
✓ 預測為留存:
40,770 (73.6%)
📈 每日流失率趨勢分析 (2026/01/08 - 2026/03/17)
圖表說明
此圖展示驗證集中每日的真實流失率、各模型預測流失率、以及實際隔日流失率的趨勢變化
💡 關鍵發現
1. 二分類準確率顯著提升
整體準確率達 73%,相比五分類的 60% 提升 13 個百分點,證明流失預測任務更可行
2. XGBoost 表現最佳
AUC-ROC 達 0.8018,顯示出色的分類能力;對流失玩家的識別準確率高達 77.5%
3. 類別平衡良好
流失/留存比例接近 50:50,無需過多的類別權重調整,模型訓練更穩定
4. 實用建議
建議優先使用 XGBoost 或隨機森林進行流失預測,邏輯回歸雖然準確率較低但更易解釋,可用於業務分析