大數據時代的金融數據挖掘

大數據時代的金融數據挖掘

企業想要在競爭激烈的市場中勝出,決策的速度和反應的效率尤為重要。

根據調查顯示,75%的企業在面臨擬定策略時,常常無法獲得即時且有根據的決策資訊。什麼樣的資料、要透過什麼樣的方法,才能快速且即時的轉變成決策時有用的資訊,是現代企業所面臨最迫切性的問題。

資料採礦(Data Mining)無疑是解決這些問題最有效的途徑。

資料採礦強調與現有資訊系統的整合,以提供決策者做決策時所需的情報,或轉化成經營智慧,以作為調整營運策略方針的輔助工具。

從顧客關係管理(Customer Relationship Management)的整體架構來說,資料採礦是整個顧客關係管理的核心。完整的資料採礦不單可以做到準確的目標市場行銷(Target Marketing),也可以做到大量的客製化,也就是所謂的一對一行銷(One-to-One Marketing)。

有鑑於此,本課程的目的就是要針對資料採礦在銀行業上的應用與案例,並搭配Open Source Weka的操作,做廣泛且深入的探討。

課程規劃說明

透過本課程的訓練,上課人員應將具備以下能力:

  1. 了解什麼是顧客關係管理(Customer Relationship Management);
  2. 了解顧客關係管理系統的架構及其組成元素;
  3. 了解如何利用顧客關係管理系統來進行行銷活動;
  4. 了解什麼是資料採礦(Data Mining);
  5. 了解資料採礦技術的功能分類;
  6. 了解資料採礦技術的績效增益;
  7. 了解資料採礦技術的產業標準;
  8. 了解如何利用資料採礦技術來篩選關鍵變量(Key Attribute);
  9. 了解如何利用資料採礦技術來進行交叉銷售(Cross-Selling);
  10. 了解如何利用資料採礦技術來評估客戶的信用風險(Credit Risk);
  11. 了解如何利用資料採礦技術來建立銀行客群(Customer Segmentation);
  12. 了解如何利用資料採礦技術來分析顧客行為、產生商業智慧並發展行銷策略。
  13. 了解如何使用資料採礦工具Weka來完成上述的各項工作。

課程大綱

顧客關係管理及基礎資料採礦技術

金融業使用之範圍:

說明銀行業如何利用顧客關係管理來進行行銷活動

理論介紹:

  • 顧客關係管理系統的架構及其組成元素
  • 銀行業如何利用顧客關係管理系統來進行行銷活動
  • 資料採礦技術的功能分類
  • 資料採礦技術的績效增益
  • 資料採礦技術的產業標準
  • 資料採礦基本觀念與實際應用解說

基礎資料採礦技術

金融業使用之範圍:

說明銀行業如何利用資料前處理技術來進行資料的重整,建置資料倉儲,以做為資料採礦之輸入

理論介紹:

  • 資料採礦技術的流程-SEMMA & CRISP DM
  • 資料前處理(Data Preprocessing)技術
  • Attribute Selection(欄位選擇)
    *Data Integration(資料整合)
  • Data Cleansing(資料清理):
    *Wrong Value(錯誤值),
    *Outlier(離群值),
    *Null Value(空值)
  • Attribute Enrichment(欄位擴充):
    *內/外部資料的擴充方法
  • Data Coding(資料編碼):
    *Data Transformation(資料轉換),
    *Data Reduction(資料精簡),
    *Record Reduction(記錄精簡),
    *Attribute Value Reduction(欄位值精簡),
    *Attribute Reduction(欄位精簡)

進階資料採礦技術

金融業使用之範圍:

說明銀行業如何利用關鍵變量發掘技術來發掘對專案目標有效之關鍵變量,以做為資料採礦之輸入變數

理論介紹:

  • 訓練資料與測試資料的產生方法
  • 關鍵變量(Key Attributes)發掘技術
    *卡方檢定(Chi-square Test)
    *t檢定及ANOVA檢定(t Test & ANOVA Test)
    *利用決策樹(Decision Tree)選擇關鍵變量

金融業使用之範圍:

說明銀行業如何利用分類技術之決策樹及簡單貝式來建立交叉銷售(Cross-Selling)模型,以提昇公司獲利

理論介紹:

  • 分類之簡單貝式(Naive Bayes)
  • 分類之決策樹(Decision Tree)

金融業使用之範圍:

說明銀行業如何利用分類技術之羅吉斯迴歸及類神經網路來建立信用評分(Credit Scoring)模型,以降低公司損失

理論介紹:

  • 分類之類神經網路(Neural Network)
  • 分類之羅吉斯迴歸(Logistic Regression)

金融業使用之範圍:

說明銀行業如何利用分群技術之階層式及k-平均分群來建立客群分析模型,使銀行針對不同客群,採用不同之行銷策略,讓銀行獲利最大化

理論介紹:

  • 分群(Clustering)之階層式分群(Hierarchical Clustering)
  • 分群(Clustering)之k-平均分群(K-Means Clustering)

金融業使用之範圍:

說明銀行業如何利用關聯及序列分析技術來建立交叉銷售(Cross-Selling)及提昇銷售(Up-Selling)模型,以提昇公司獲利

理論介紹:

  • 關聯分析(Association Analysis)
  • 序列分析(Sequence Analysis)

金融業使用之範圍:

說明銀行業如何利用預測(Prediction)技術之線性迴歸、迴歸樹及類神經網路來建立數值預測模型-如預測客戶之年收入,以利公司設計行銷活動

理論介紹:

  • 線性迴歸(Linear Regression)
  • 迴歸樹(Regression Tree)
  • 類神經網路(Neural Network)-非線性迴歸

師資介紹

李老師

  • 國立台灣大學資訊工程博士
  • 大學資訊工程學系教授
  • 大學大數據研究中心主任
  • 中華資料採礦協會理事

時數與學費

上課時段:週一~週五,日間:09:00-16:30(或17:00)

課程洽詢
  • 課程洽詢:呂小姐
  • 聯絡電話:(02)66316589  傳真:(02)66316598
  • 電子信箱:
  • 上課地址:台北市大安區復興南路一段390號2樓交通指引