數據挖掘的13個應用案例研討

數據挖掘(Data Mining)運用分類(Classification)、預測(Prediction)、聚類(Clustering)、關聯規則(Association Rule)、序列型樣(Sequential Pattern)、時間序列(Time Series)及統計方法(Statistical Method)從龐大且紛雜的資料中,找出隱藏、未知且對企業經營有說明的資訊,是精準行銷的核心,近年來受到相當廣泛的關注,並應用於各種領域的實務中。

銀行業(Banking)藉由數據挖掘發掘潛在有資金需求的中小企業戶(Small-Medium Enterprise),進行信貸行銷(Credit Marketing),以及偵測客戶的信用風險(Credit Risk)。醫療業(Health Care)藉由數據挖掘偵測病患罹患心臟病(Heart Disease)的機率及罹患糖尿病(Diabetes)的可能性。零售業(Retail)則藉由數據挖掘預測促銷活動(Promotion)的成效以及每日的銷售量,並評估客戶對產品的喜好。電信業(Telecommunication)藉由數據挖掘預測客戶流失(Customer Churn)的機率以及何種措施最能將客戶挽留(Customer Retention)。保險業(Insurance)則藉由數據挖掘評估車貸(Car Loan)客戶會來理賠的可能性,以做為其保費高低的依據。

有鑑於此,本培訓的目的就是要針對數據挖掘模型的建構方法,以13個實務案例進行實際操作,並做廣泛且深入的探討,有效建構企業營運獲利的新模式,使企業利潤最大化。

適合對象

1. 資料分析師或資料分析人員
2. 營運分析或經營企劃人員
3. 資料庫管理人員
4. 企業或技術決策人員
5.對於雲端運算之大量資料(Big Data)處理、分析、應用有興趣者

預備知識

1.熟悉作業系統的基本操作
2.熟悉資料庫的基本原理

課程大綱

1.藥物治療(醫療業):

在這個案例中,想像你是一個醫學研究人員,並收集許多患有相同疾病的病患資料。在他們的治療過程中,每一個病人會被記錄對哪一種藥物有療效(總共有五種針對此疾病的藥物)。此案例的目的是想利用數據挖掘(分類模型-多目標決策樹(Decision Tree))找出,哪種藥物適用於哪一種類型的病人。

2. 對客戶響應建模(零售業):

本案例是某公司希望通過提供客戶對的營銷活動,在未來實現更多的獲利。此案例的目的是想根據以往的促銷活動,利用數據挖掘(分類模型-決策列表(Decision List))找出會對營銷活動有響應的客戶特徵,並根據建模的結果產生要郵寄的促銷客戶名單。
 

3. 電信客戶分類(電信業):

假設某電信服務提供商通過客戶使用服務的方式,將客戶分為四類人。此案例的目的是想根據人口統計數據(分類模型-多目標羅吉斯迴歸(Multinomial Logistic Regression)),利用數據挖掘找出這四類人的特徵,並發掘這四類人的潛在新客戶。
 

4. 電信客戶流失(電信業):

假設某電信服務提供商非常關注客戶流失到競爭對手的數量。假如服務使用的數據可以用來預測哪些客戶有可能被轉移到另一個供應商,則此供應商可提供客製化的優惠,以儘可能留住客戶。此案例的目的是想根據服務使用的數據,利用數據挖掘(分類模型-二元羅吉斯迴歸(Binomial Logistic Regression))來預測客戶的流失。

5. 預測頻寬使用率(通訊業):

某全國寬頻網路供應商的分析師需進行客戶使用網路的預估,以便預測頻寬的使用。全國網路的使用是全國各區域網路使用的加總,因此分析師需逐一對給個區域市場進行頻寬使用的預測。此案例的目的是想利用數據挖掘中的時間序列模型(預測模型-簡單時間序列(Simple Time Series))來預測每個區域市場下三個月的頻寬使用量。

6. 預測型錄商品的銷售(零售業):

某型錄公司希望根據過去10年的銷售記錄,利用數據挖掘來預測男裝生產線每月的銷售。此案例的目的是想利用數據挖掘中的兩個時間序列模型-Exponential Smoothing和ARIMA(預測模型-複雜時間序列(Exponential Smoothing & ARIMA))來解決這個問題。
 
 

7. 提供對的產品給對的客戶(銀行業):

此案例的目的是想利用數據挖掘(分類模型-自學回應模型(Self-Learning Response Model))來預測客戶對不同產品報價的接受程度,以便預測哪些產品適合提供給哪些客戶。此類模型適合運用在顧客關係管理中的目標市場行銷及客服中心。

8. 預測貸款逾期者(銀行業):

某銀行希望根據客戶過去的貸款數據,利用數據挖掘(分類模型-貝式網路(Bayesian Network))來預測新的貸款者,核貸後會逾期的機率,以做為銀行是否核貸的依據,或提供給客戶其他類型的貸款產品。

9. 零售業銷售促銷(零售業):

此案例的目的是想根據零售產品過去的促銷記錄,利用數據挖掘(預測模型-神經網路及迴歸樹(Neural Network & Regression Tree))來預測未來的銷售成效。
 
 

10. 狀態監測(資訊業):

此案例的目的是想根據機器監控狀態的資訊,利用數據挖掘(分類模型-神經網路及決策樹(Neural Network & Decision Tree))來預測機器發生故障的機率。此案例的數據包含在時間軸上連續的機器監控狀態資訊。因此,每一筆記錄是機器在某個時間點的狀態報告。

11. 細胞樣本分類(醫療業):

某醫學研究中心收集癌症病患的細胞樣本特徵數據,以便進行研究。原始的數據顯示良性樣本與惡性樣本間的許多特徵有顯著的差異。此案例的目的是想根據此數據,利用數據挖掘(分類模型-支持向量機(Support Vector Machine))來提早發現某樣本是良性還是惡性的樣本。

12. 購物籃分析(零售業):

此案例的目的是想根據會員卡所記錄的客戶的個人資訊及每次購買商品的數據,利用數據挖掘(關聯模型-Apriori & 決策樹(Decision Tree))來發掘購買類似商品的客群,以及客群的特徵(例如,年齡、收入、等)。

13. 評估新車設計(汽車業):

某汽車製造商開發兩種新車(汽車及卡車)的原型。在將新車型引入至產品系列之前,該製造商想知道競爭對手已經上市的車輛中,哪些與這兩款產品的原型最為相似,以確定這兩種新車將與哪些車型展開競爭(分群模型-K最近鄰居(K Nearest Neighbor))。

 

 

時數費用

24小時 / 原價15000元,優惠價12,000元

課程洽詢

askhead承辦人:沈小姐 電話:(02)66316583 E-Mail:
地 址:台北市復興南路一段390號2樓 傳真:(02)66316598

課程資訊