2014年7月17日 星期四

9 Data Mining Algorithm + Text Mining

image

 

1. Decision Tree 決策樹

image

image

 

2. Cluster 群集演算法

image

image

image

image

 

3. Association 關聯規則演算法

MBA: Market Blacket Analysis (購物籃分析)

image

image

image

 

4. Sequence Cluster 時序群集演算法

image

image

image

image

Bioinformatics

image

image

 

5. Time Series 時間序列演算法

image

物價,GDP,匯率,股價…

image

image

image

image

image

 

6. Neural Network 類神經網路演算法

image

image

image

image

image

 

7. Naive Bayes Classifer 貝氏機率分類演算法

image

Social Network Analysis (SNA)

貝氏定理: P(B|A) => 在A之下,B發生的機率

image

image

image

image

image

image

增益圖 Lift Chart

image

 

8. Linear Regression 線性迴歸演算法

image

y(因變數) = ax(自變數) + b + ei(誤差)

y 是連續的數字

image

簡單線性迴歸: 一個x一個y

複迴歸:多個x一個y

多變量迴歸:多個多個y

image

用電量,冷氣,跟人口之間的關係

image

image

 

9. Logistic Regression 羅吉斯迴歸演算法

image

風險管控,生物資訊,社會科學

image

y 是類別的,非連續性資料

image

Odds Ratio (OR) 勝算比: P(勝) / P(不勝) 的機率

Ln(OD) = f(x), 即變成 Logistic regression

image

image

 

10. Text Mining 文字採礦

Term Extract, Term Lookup

image

Fuzzy Lookup, Fuzzy Grouping

image

image

image

image

image

image

image

image

image

image

 

商業問題 vs 演算法

image_thumb[25]

沒有留言:

張貼留言