玩家生命周期預測研究報告

📊 總樣本數

538,069

唯一玩家: 204,836

🎯 訓練集樣本

429,614

玩家數: 163,948 (80%)

✅ 驗證集樣本

108,455

玩家數: 40,888 (20%)

⏰ 持續追蹤玩家

16,678

驗證集樣本: 25,970

📈 模型性能對比

評估指標說明

整體準確率: 所有預測正確的比例 | 持續追蹤玩家: 對持續活躍玩家的預測準確率（預測>0即為正確）| 已流失玩家: 對已流失玩家的預測準確率（需精確匹配）| 二分類準確率: 預測流失(0)或留存(>0)的準確率

📊 訓練集類別分布

總樣本數: 429,614

📊 驗證集類別分布

總樣本數: 108,455

🔥 混淆矩陣詳細分析

類別定義

類別0: 0-100轉 | 類別1: 101-500轉 | 類別2: 501-1000轉 | 類別3: 1001-5000轉 | 類別4: 5001+轉

類別 0 (0~100轉)

實際樣本數: 47,978

預測正確數: 34,063 (71.0%)

預測為 0 (0~100): 34,063 (71.0%)

預測為 1 (101~500): 7,498 (15.6%)

預測為 2 (501~1000): 2,253 (4.7%)

預測為 3 (1001~5000): 3,375 (7.0%)

預測為 4 (5001+): 789 (1.6%)

類別 1 (101~500轉)

實際樣本數: 26,640

預測正確數: 7,043 (26.4%)

預測為 0 (0~100): 10,119 (38.0%)

預測為 1 (101~500): 7,043 (26.4%)

預測為 2 (501~1000): 2,994 (11.2%)

預測為 3 (1001~5000): 5,204 (19.5%)

預測為 4 (5001+): 1,280 (4.8%)

類別 2 (501~1000轉)

實際樣本數: 9,913

預測正確數: 1,548 (15.6%)

預測為 0 (0~100): 2,320 (23.4%)

預測為 1 (101~500): 1,837 (18.5%)

預測為 2 (501~1000): 1,548 (15.6%)

預測為 3 (1001~5000): 3,250 (32.8%)

預測為 4 (5001+): 958 (9.7%)

類別 3 (1001~5000轉)

實際樣本數: 17,601

預測正確數: 7,240 (41.1%)

預測為 0 (0~100): 2,723 (15.5%)

預測為 1 (101~500): 1,937 (11.0%)

預測為 2 (501~1000): 2,055 (11.7%)

預測為 3 (1001~5000): 7,240 (41.1%)

預測為 4 (5001+): 3,646 (20.7%)

類別 4 (5001+轉)

實際樣本數: 6,323

預測正確數: 3,507 (55.5%)

預測為 0 (0~100): 486 (7.7%)

預測為 1 (101~500): 237 (3.7%)

預測為 2 (501~1000): 296 (4.7%)

預測為 3 (1001~5000): 1,797 (28.4%)

預測為 4 (5001+): 3,507 (55.5%)

類別 0 (0~100轉)

實際樣本數: 47,978

預測正確數: 42,075 (87.7%)

預測為 0 (0~100): 42,075 (87.7%)

預測為 1 (101~500): 3,928 (8.2%)

預測為 2 (501~1000): 12 (0.0%)

預測為 3 (1001~5000): 1,846 (3.8%)

預測為 4 (5001+): 117 (0.2%)

類別 1 (101~500轉)

實際樣本數: 26,640

預測正確數: 6,580 (24.7%)

預測為 0 (0~100): 15,666 (58.8%)

預測為 1 (101~500): 6,580 (24.7%)

預測為 2 (501~1000): 35 (0.1%)

預測為 3 (1001~5000): 4,119 (15.5%)

預測為 4 (5001+): 240 (0.9%)

類別 2 (501~1000轉)

實際樣本數: 9,913

預測正確數: 26 (0.3%)

預測為 0 (0~100): 4,204 (42.4%)

預測為 1 (101~500): 2,578 (26.0%)

預測為 2 (501~1000): 26 (0.3%)

預測為 3 (1001~5000): 2,905 (29.3%)

預測為 4 (5001+): 200 (2.0%)

類別 3 (1001~5000轉)

實際樣本數: 17,601

預測正確數: 7,790 (44.3%)

預測為 0 (0~100): 5,202 (29.6%)

預測為 1 (101~500): 3,460 (19.7%)

預測為 2 (501~1000): 47 (0.3%)

預測為 3 (1001~5000): 7,790 (44.3%)

預測為 4 (5001+): 1,102 (6.3%)

類別 4 (5001+轉)

實際樣本數: 6,323

預測正確數: 1,808 (28.6%)

預測為 0 (0~100): 1,058 (16.7%)

預測為 1 (101~500): 397 (6.3%)

預測為 2 (501~1000): 8 (0.1%)

預測為 3 (1001~5000): 3,052 (48.3%)

預測為 4 (5001+): 1,808 (28.6%)

類別 0 (0~100轉)

實際樣本數: 47,978

預測正確數: 15,885 (33.1%)

預測為 0 (0~100): 15,885 (33.1%)

預測為 1 (101~500): 27,133 (56.5%)

預測為 2 (501~1000): 4,577 (9.5%)

預測為 3 (1001~5000): 355 (0.7%)

預測為 4 (5001+): 28 (0.1%)

類別 1 (101~500轉)

實際樣本數: 26,640

預測正確數: 13,069 (49.1%)

預測為 0 (0~100): 4,793 (18.0%)

預測為 1 (101~500): 13,069 (49.1%)

預測為 2 (501~1000): 7,595 (28.5%)

預測為 3 (1001~5000): 1,142 (4.3%)

預測為 4 (5001+): 41 (0.2%)

類別 2 (501~1000轉)

實際樣本數: 9,913

預測正確數: 4,143 (41.8%)

預測為 0 (0~100): 1,098 (11.1%)

預測為 1 (101~500): 3,852 (38.9%)

預測為 2 (501~1000): 4,143 (41.8%)

預測為 3 (1001~5000): 794 (8.0%)

預測為 4 (5001+): 26 (0.3%)

類別 3 (1001~5000轉)

實際樣本數: 17,601

預測正確數: 3,049 (17.3%)

預測為 0 (0~100): 1,272 (7.2%)

預測為 1 (101~500): 4,937 (28.1%)

預測為 2 (501~1000): 8,205 (46.6%)

預測為 3 (1001~5000): 3,049 (17.3%)

預測為 4 (5001+): 138 (0.8%)

類別 4 (5001+轉)

實際樣本數: 6,323

預測正確數: 432 (6.8%)

預測為 0 (0~100): 216 (3.4%)

預測為 1 (101~500): 900 (14.2%)

預測為 2 (501~1000): 2,294 (36.3%)

預測為 3 (1001~5000): 2,481 (39.2%)

預測為 4 (5001+): 432 (6.8%)

📋 詳細性能指標

📈 每日類別0趨勢分析 (2026/01/08 - 2026/03/17)

圖表說明

此圖展示驗證集中每日的真實類別0比例、各模型預測類別0比例、以及實際隔日流失率的趨勢變化

💡 關鍵發現

1. XGBoost 表現最佳

整體準確率 62.37%，在非活躍玩家預測上顯著優於其他模型（60.46% vs 52.73%/34.46%）

2. Ordinal Logistic 對活躍玩家偏好強

持續追蹤玩家準確率高達 91.53%，但已流失玩家僅 34.46%，存在明顯的預測偏差

3. 二分類任務更可行

三個模型的二分類準確率均達 63-73%，顯著高於多分類精確預測（48-62%）

4. 建議採用兩階段預測

第一階段: 預測玩家是否流失（二分類）| 第二階段: 對留存玩家預測價值層級（多分類）

📊 總樣本數

538,069

唯一玩家: 204,836

🎯 訓練集樣本

429,614

玩家數: 163,948 (80%)

✅ 驗證集樣本

108,455

玩家數: 40,888 (20%)

⚖️ 類別平衡度

49.4% / 50.6%

流失 / 留存

📈 模型性能對比

評估指標說明

準確率: 預測正確的比例 | AUC-ROC: 模型整體區分能力（0.5-1.0，越高越好）| 精確率: 預測為留存的準確度 | 召回率: 找出留存玩家的能力 | F1分數: 精確率和召回率的調和平均

📊 訓練集類別分布

流失: 212,225 (49.4%) | 留存: 217,389 (50.6%)

📊 驗證集類別分布

流失: 53,060 (48.9%) | 留存: 55,395 (51.1%)

🔥 混淆矩陣詳細分析

隨機森林 - 73.21% XGBoost - 73.19% 邏輯回歸 - 67.64%

實際流失 (剩餘轉數 0~100)

實際樣本數: 53,060

預測正確數: 40,894 (77.1%)

✓ 預測為流失: 40,894 (77.1%)

✗ 預測為留存: 12,166 (22.9%)

實際留存 (剩餘轉數 >100)

實際樣本數: 55,395

預測正確數: 38,506 (69.5%)

✗ 預測為流失: 16,889 (30.5%)

✓ 預測為留存: 38,506 (69.5%)

實際流失 (剩餘轉數 0~100)

實際樣本數: 53,060

預測正確數: 41,094 (77.5%)

✓ 預測為流失: 41,094 (77.5%)

✗ 預測為留存: 11,966 (22.5%)

實際留存 (剩餘轉數 >100)

實際樣本數: 55,395

預測正確數: 38,280 (69.1%)

✗ 預測為流失: 17,115 (30.9%)

✓ 預測為留存: 38,280 (69.1%)

實際流失 (剩餘轉數 0~100)

實際樣本數: 53,060

預測正確數: 32,585 (61.4%)

✓ 預測為流失: 32,585 (61.4%)

✗ 預測為留存: 20,475 (38.6%)

實際留存 (剩餘轉數 >100)

實際樣本數: 55,395

預測正確數: 40,770 (73.6%)

✗ 預測為流失: 14,625 (26.4%)

✓ 預測為留存: 40,770 (73.6%)

📋 詳細性能指標

📈 每日流失率趨勢分析 (2026/01/08 - 2026/03/17)

圖表說明

此圖展示驗證集中每日的真實流失率、各模型預測流失率、以及實際隔日流失率的趨勢變化

💡 關鍵發現

1. 二分類準確率顯著提升

整體準確率達 73%，相比五分類的 60% 提升 13 個百分點，證明流失預測任務更可行

2. XGBoost 表現最佳

AUC-ROC 達 0.8018，顯示出色的分類能力；對流失玩家的識別準確率高達 77.5%

3. 類別平衡良好

流失/留存比例接近 50:50，無需過多的類別權重調整，模型訓練更穩定

4. 實用建議

建議優先使用 XGBoost 或隨機森林進行流失預測，邏輯回歸雖然準確率較低但更易解釋，可用於業務分析

🎮 玩家生命周期預測研究報告

📈 模型性能對比

評估指標說明

📊 訓練集類別分布

📊 驗證集類別分布

🔥 混淆矩陣詳細分析

類別定義

類別 0 (0~100轉)

類別 1 (101~500轉)

類別 2 (501~1000轉)

類別 3 (1001~5000轉)

類別 4 (5001+轉)

類別 0 (0~100轉)

類別 1 (101~500轉)

類別 2 (501~1000轉)

類別 3 (1001~5000轉)

類別 4 (5001+轉)

類別 0 (0~100轉)

類別 1 (101~500轉)

類別 2 (501~1000轉)

類別 3 (1001~5000轉)

類別 4 (5001+轉)

📋 詳細性能指標

📈 每日類別0趨勢分析 (2026/01/08 - 2026/03/17)

圖表說明

💡 關鍵發現

1. XGBoost 表現最佳

2. Ordinal Logistic 對活躍玩家偏好強

3. 二分類任務更可行

4. 建議採用兩階段預測

📈 模型性能對比

評估指標說明

📊 訓練集類別分布

📊 驗證集類別分布

🔥 混淆矩陣詳細分析

實際流失 (剩餘轉數 0~100)

實際留存 (剩餘轉數 >100)

實際流失 (剩餘轉數 0~100)

實際留存 (剩餘轉數 >100)

實際流失 (剩餘轉數 0~100)

實際留存 (剩餘轉數 >100)

📋 詳細性能指標

📈 每日流失率趨勢分析 (2026/01/08 - 2026/03/17)

圖表說明

💡 關鍵發現

1. 二分類準確率顯著提升

2. XGBoost 表現最佳

3. 類別平衡良好

4. 實用建議