2025-09-23
輸入 ➞ 人類規則 ➞ 輸出
提供大量資料 ➞ 找到規則
資料類型: 使用帶有「標籤」的資料進行訓練,即每個輸入資料都有對應的正確輸出或答案。
目標: 學習輸入資料與輸出資料之間的映射關係,以便在遇到新數據時能預測其輸出結果。
應用範例: 根據過去的天氣狀況(輸入)預測未來的航班時間(輸出)。
資料類型: 使用未帶有標籤的原始資料進行訓練。
目標: 探索資料並在其中發現隱藏的模式、結構或關係,而不是預測特定的輸出。
應用範例: 尋找顧客群體中的相似性(分群),或識別未標記資料中的新關聯。
與機器學習的關係: 是機器學習的一個子集,屬於一類特定的機器學習模型。
特點: 使用多層神經網路(類似人類大腦結構)來學習資料中的複雜模式。
應用範例: 深度學習模型可以執行監督式學習任務,如圖像識別,也可以進行非監督式學習,從大量的未標記資料中提取有價值的資訊。
生成式 AI 是基於深度學習的技術分支,可以學習數據中的模式並生成新的內容,涵蓋文本、圖像、聲音等多種形式。(細節下堂課再介紹。)
監督式學習 (Supervised Learning) 與 非監督式學習 (Unsupervised Learning)
技術路徑的選擇,更反映了我們想從數據中獲得什麼是「驗證已知的答案」,還是「探索未知的結構」
「有標準答案的考卷」(監督式學習)來訓練 AI 解決已知的問題,比起「沒有答案的浩瀚圖書館」(非監督式學習)中探索未知和關聯性,如何在「指導」與「探索」之間的權衡?又有哪些風險?
Spotify 如何為你推薦音樂?一種方式是監督式:你按了「喜歡」的歌曲(提供了明確標籤),系統就去尋找音樂特徵相似的歌曲推薦給你。另一種是非監督式:系統分析全球數億用戶的收聽數據,將品味相似的人自動「分群 (Clustering)」,然後把你那一群人喜歡、但你還沒聽過的歌推薦給你(例如「每週新發現」)。哪一種方式更容易讓你跳出同溫層,發現全新的音樂類型?哪一種方式又可能讓你越陷越深?
酷澎網站想了解顧客。監督式做法是,進行滿意度問卷,讓顧客在「價格」、「服務」、「品質」等項目上打 1-5 分(給予明確標籤),然後分析哪個環節分數最低。非監督式做法是,直接分析數十萬條顧客的原始評論文字,AI 自動將評論分群,可能會發現一個從未想過的顧客抱怨主題,例如「包裝過度不環保」或「贈品品質太差」,這在原本的問卷中根本沒有這個選項。哪種方法能解決已知的問題?哪種能發現未知的問題?
銀行如何偵測盜刷?監督式方法是,利用過去所有被標記為「盜刷」和「正常」的交易紀錄來訓練模型,當一筆新交易進來時,模型會判斷其為盜刷的機率。但如果出現一種全新的詐騙手法,模型可能就認不出來。非監督式的「異常偵測 (Anomaly Detection)」則是,模型先學習什麼是「正常」的交易模式(一個龐大的群體),任何不符合這個模式的交易,無論手法為何,都會被標記為可疑。哪種方法更擅長防堵已知的敵人?哪種更能應對未知的威脅?
警察局想預防犯罪。監督式方法是,分析過去標記有「犯罪地點」和「時間」的數據,來預測下一個犯罪熱點。但這完全依賴於「有報案」的數據。非監督式方法則是,分析城市裡匿名的通訊或交通流量數據,找出「異常聚集」或「模式突然改變」的區域,這可能是一個未被發現的地下交易市場,也可能只是一場快閃活動。我們該如何權衡這種探索帶來的機會與誤判的風險?
AI 從有偏見的歷史數據中學習,不僅會複製,更會放大這些偏見。原則:垃圾進,垃圾出。
ref: (MIT)Media Lab 的《Gender Shades》研究(Joy Buolamwini)
非監督式學習找到的「模式」不一定具有現實意義。它可能會發現冰淇淋銷量和溺水人數呈現高度正相關。(相關不等於因果)。
不需要標籤比對,也不像非監督學習單純從數據自發發現模式。
透過環境互動,根據行為得到的獎勵或懲罰來漸進地學習達成目標的策略。(就跟人類很像)
[台大李宏毅教授 - 機器學習系列課程 (YouTube)]
[經典教科書: 《機器學習》(西瓜書) - 周志華]
[聖經級教科書: "Deep Learning" by Ian Goodfellow, et al.]
[反面論點論文: "The Mythos of Model Interpretability" by Zachary C. Lipton]
[反面論點書籍: 《Weapons of Math Destruction》 by Cathy O'Neil]
[Google AI Blog: 來自Google的最新AI研究]
[Distill.pub: 以視覺化方式解釋複雜ML概念的期刊]
[案例 - 性能超越: Google AI 改善乳腺癌檢測]
[案例 - 科學躍進: DeepMind 關於 AlphaFold 的官方影片]
(例如:YouTube 的影片推薦系統、Instagram 的限時動態濾鏡、Google Maps 的預估到達時間、蝦皮的「猜你喜歡」商品)
(例如:它學習我看過哪些影片、停留多久,來推薦我可能喜歡的新影片。)
(例如:節省我尋找影片的時間、讓我發現新的興趣、讓我的照片更好看。)
(例如:它可能讓我陷入「同溫層」,只看見我想看的內容,視野越來越窄。或是,美顏濾鏡可能加劇了容貌焦慮。)