目前分類:Machine Learning (2)

瀏覽方式: 標題列表 簡短摘要

Linear Associatoin (線性關聯)

購物籃分析(Market-Basket Analysis)是機器學習的應用之一,主要是幫助零售業者瞭解客戶的消費行為,假設發現通常購買x產品的人也會購買y產品,若今天有一客戶只有買x沒有買y,那麼他就是一個y的淺在客戶(Potencial Customer)。當我們找到這些客戶時,我們就可以利用同類產品做聯合推銷(Cross-selling)。為了找出這些關聯規則(Association Rule),我們使用條件機率(Conditional Probability)的形式P(y|x),代表購買x產品狀況下,也會順道購買y的機率。假使我們經過統計後,得知P(Chips|Beer)=0.7,則代表:

70 percent of customers who buy beer also buy chips.

另外我們還可以將整個關聯,對於客戶的部份做細分,P(y|x, d),d代表客戶的屬性,例如年齡、性別與職業等等。

Classification (分類)

tzanfeng 發表在 痞客邦 留言(0) 人氣()

隨著電腦科技的進步,我們有能力去儲存與處理大量資料,甚至彙整來自不同地方的資料,例如像是世界連鎖企業,販售數以千記的商品給百萬客戶,每天將這些交易紀錄儲存下來。然而對於這些沒有經過分析的資料(Data),如何轉換成有意義的資訊(Information),是一件很有趣的事情,例如像是預測(Prediction)。

雖然我們不曉得哪些人會喜歡哪些特定的商品,但是我們可以透過資料的萃取(Abstration),將我們有興趣的資訊,從隱含的資料中找出來。例如說,當人們到超級市場,買啤酒的人會順便買洋芋片,但是買洋芋片的不一定會買啤酒,而大部分的人夏天會買冰淇淋,冬天會買麻辣火鍋,這似乎有一個樣本(Pattern)存在其中。

當然我們無法做完全的預測,但可以找到一個比較好且近似的法則,這個近似法則沒辦法符合所有現實狀況,但至少他可以代表部份的資料,像是一些樣本或者規律,那這些樣本或規律性,就可以當作我們預測的基準,對未來預測(Future Prediction)。這個就是機器學習(Machine Learning)的雛型。

應用機器學習的方法處理大量資料庫數據又稱資料探勘(Data Mining),這個名詞的意謂,就好比是在大體積的地球,從一堆粗糙的金屬中萃取出金礦(Gold Mine)。由於資料探勘技術的進步,許多演算法都可以達到高度的正確性,因此應用相當廣泛,例如零售連鎖(Retail Chain)、銀行金融、測謊(Fraud Detection)和股票市場(Stock Market)。在製造業可以用來做最佳化流程、控管與除錯分析;在醫學方面可以用來做病例診斷(Medical Diagnosis);在通訊方面可以分析數據做網路最佳化(Network Optimization)與提昇服務品質(Quality of Service, Qos);還有資料以爆炸性速度增加的WWW(World Wide Web),這些巨大的資料都無法用人工的方式做處理來得到有用的資訊。

但機器學習並非只是用在處理資料庫問題,它是屬於人工智慧(Actifical Intelligence)的一部分。也被廣泛應用在視訊辨識(Vision&Speech Recognition)與機器人學(Robotics)上,再舉一個人臉辨識的例子,我們知道一張圖片是由許多像素隨意組成的,但人臉有結構(Structure),並且是對稱的,眼睛鼻子嘴巴都在特定的相對位置上,為了利用這些特徵找出人臉,我們可以撰寫一支程式去鑑定是否有這些特徵樣本的存在,這就是一個樣本辨識(Pattern Recognition)的例子。

tzanfeng 發表在 痞客邦 留言(1) 人氣()