何謂機器學習
對一份有特徵的資料進行判斷
舉例 人 => 身高 ,體重, 腰圍 -> 是否過重, 是否健康 過往我們依賴專家的意見,如 BMI 異常或腰圍來判斷,但這樣的判斷模式,容易受限於規模, 身高 ,體重, 腰圍, 血紅素數值, 血小板數值... 體檢列表可以列出上千上百種指數,我們也可以針對各個數值判讀,通常每個數值也會也有對應的好壞區間, 但,假設,有一種人們還不知到的特殊的連結,在身高和血紅素數值間,身高介於 150 - 155 ,血紅素數值介於 12 - 12.25 , 有高機率患有特殊疾病, ; TODO
資料 -> 結果 = 方法
假設有一個被設計好的判斷方法可以判別問題的結果,我們是否能夠模仿這個方法?
先決條件是:這個方法我們還未知。 如果已經知道這個方法的確切模樣,那直接套用方法就好。
大量的資料很重要,需要反覆驗證,大量練習。 想要什麼樣的結果,如果沒辦法精準定義結果,你會訓練出好像可以又好像不行的東西。
{(xn, yn)} from f -> ML -> g xn: 因 yn: 果 f: 神妙而不可知的因果關係 g: 我們對這種神妙的猜想
其中 yn 是 f 產生的。 透過 ML 找到跟 f 接近的 g。 換句話說,因果之間存在某種被規定好的關係,但這個神妙而不可知的因果關係我們沒辦法看透,所以只能透過資料和結果,自己腦補中間的關係。
可能信無限多種
hypothesis set 找到最好的 hypothesis 我們稱之為 g
Lecture 2
Perceptron
感知機,這個名字本身不重要,只是歷史因素遺留下來的慣用名字
g = sign(Sigma 1 ~ N(W_i X_i) - threshold) = sign(Sigma 0 ~ N(W_i X_i)) // W_0 = -threshold, X_0 = 1 = sign(W^T*X)