蔡秀娟 (資深專案經理)
現今企業在考量導入資料探勘應用時,多從分析系統能提供演算法的多樣性、演算法的參數設定及探勘模型驗證方法等面向來評估,但由於資料探勘技術日趨成熟,因此導入時應多從解決企業業務面問題的角度著手,先進行企業目標與現況的評估,審慎訂定分析議題,再針對相關資料進行篩選整理,如此所得到的預測結果,才可提供較完整的資訊,讓企業作更正確的決定。
為了達成上述的成效,「資料庫」在整個資料探勘流程便佔有很重要的地位,資料庫的正確性、完整性和容易查詢都是在進行任何資料分析時必須確認的,在逐一確認資料的過程中,通常會發現到原先資料收集流程的疏漏或原業務政策的決策錯誤,這通常是在進行資料探勘分析時的意外收穫。
此外,在應用資料探勘分析時,由於企業對顧客是處於資料不對稱的情況,即使是資料最齊全的銀行在評估顧客的信用時,有關顧客的資產、負債、投資、業外收入、確實支出及未來的發展潛力…等,都是銀行無法正確得知的部分,因此分析時應盡量從顧客和企業來往的行為來分析,而預測結果中有些灰色地帶部分還是需要人做最後的判讀;另外還有一個觀念是資料探勘預測模型的準確度不是唯一評估模型的指標,因為模型的準確度並不代表實用性;資料探勘可使企業了解顧客的行為,但是無法改變顧客的行為,因此在完成資料探勘分析之後要有實際的活動執行才能真正評估效益,同時也要對預測模型進行定期調校,這樣才能使模型的分析預測結果較符合當下的環境條件。
|