機器學習、深度學習基本原理

2025-09-23

解決問題的思維轉變:指令 ➞ 推論

傳統程式設計(就是計算機啦)

輸入 ➞ 人類規則 ➞ 輸出

機器學習 (Machine Learning)

提供大量資料 ➞ 找到規則

機器學習的主要類型

監督式學習 (Supervised Learning)

資料類型: 使用帶有「標籤」的資料進行訓練,即每個輸入資料都有對應的正確輸出或答案。

目標: 學習輸入資料與輸出資料之間的映射關係,以便在遇到新數據時能預測其輸出結果。

應用範例: 根據過去的天氣狀況(輸入)預測未來的航班時間(輸出)。

非監督式學習 (Unsupervised Learning)

資料類型: 使用未帶有標籤的原始資料進行訓練。

目標: 探索資料並在其中發現隱藏的模式、結構或關係,而不是預測特定的輸出。

應用範例: 尋找顧客群體中的相似性(分群),或識別未標記資料中的新關聯。

那深度學習 (Deep Learning) 又是什麼?

深度學習(Deep Learning)

與機器學習的關係: 是機器學習的一個子集,屬於一類特定的機器學習模型。

特點: 使用多層神經網路(類似人類大腦結構)來學習資料中的複雜模式。

應用範例: 深度學習模型可以執行監督式學習任務,如圖像識別,也可以進行非監督式學習,從大量的未標記資料中提取有價值的資訊。

那…生成式 AI (Generative AI) 又是什麼?

生成式 AI

生成式 AI 是基於深度學習的技術分支,可以學習數據中的模式並生成新的內容,涵蓋文本、圖像、聲音等多種形式。(細節下堂課再介紹。)

機器學習的核心:

監督式學習 (Supervised Learning)非監督式學習 (Unsupervised Learning)

技術路徑的選擇,更反映了我們想從數據中獲得什麼是「驗證已知的答案」,還是「探索未知的結構」

關鍵問題

「有標準答案的考卷」(監督式學習)來訓練 AI 解決已知的問題,比起「沒有答案的浩瀚圖書館」(非監督式學習)中探索未知和關聯性,如何在「指導」與「探索」之間的權衡?又有哪些風險?

不同情境下的探討

1. 個人化的音樂世界:

Spotify 如何為你推薦音樂?一種方式是監督式:你按了「喜歡」的歌曲(提供了明確標籤),系統就去尋找音樂特徵相似的歌曲推薦給你。另一種是非監督式:系統分析全球數億用戶的收聽數據,將品味相似的人自動「分群 (Clustering)」,然後把你那一群人喜歡、但你還沒聽過的歌推薦給你(例如「每週新發現」)。哪一種方式更容易讓你跳出同溫層,發現全新的音樂類型?哪一種方式又可能讓你越陷越深?

2. 酷澎電商的行銷策略:

酷澎網站想了解顧客。監督式做法是,進行滿意度問卷,讓顧客在「價格」、「服務」、「品質」等項目上打 1-5 分(給予明確標籤),然後分析哪個環節分數最低。非監督式做法是,直接分析數十萬條顧客的原始評論文字,AI 自動將評論分群,可能會發現一個從未想過的顧客抱怨主題,例如「包裝過度不環保」或「贈品品質太差」,這在原本的問卷中根本沒有這個選項。哪種方法能解決已知的問題?哪種能發現未知的問題?

3. 打擊金融詐騙:

銀行如何偵測盜刷?監督式方法是,利用過去所有被標記為「盜刷」和「正常」的交易紀錄來訓練模型,當一筆新交易進來時,模型會判斷其為盜刷的機率。但如果出現一種全新的詐騙手法,模型可能就認不出來。非監督式的「異常偵測 (Anomaly Detection)」則是,模型先學習什麼是「正常」的交易模式(一個龐大的群體),任何不符合這個模式的交易,無論手法為何,都會被標記為可疑。哪種方法更擅長防堵已知的敵人?哪種更能應對未知的威脅?

4. 城市安全的洞察:

警察局想預防犯罪。監督式方法是,分析過去標記有「犯罪地點」和「時間」的數據,來預測下一個犯罪熱點。但這完全依賴於「有報案」的數據。非監督式方法則是,分析城市裡匿名的通訊或交通流量數據,找出「異常聚集」或「模式突然改變」的區域,這可能是一個未被發現的地下交易市場,也可能只是一場快閃活動。我們該如何權衡這種探索帶來的機會與誤判的風險?

看不見的風險:從「偏見的固化」到「虛假的發現」

監督式風險 - 偏見問題(The Bias Problem)

AI 從有偏見的歷史數據中學習,不僅會複製,更會放大這些偏見。原則:垃圾進,垃圾出。

AI 辨識錯誤率差異

Gender Shades 研究圖片

ref: (MIT)Media Lab 的《Gender Shades》研究(Joy Buolamwini)

非監督式風險 - 詮釋的困難與虛假關聯

非監督式學習找到的「模式」不一定具有現實意義。它可能會發現冰淇淋銷量和溺水人數呈現高度正相關。(相關不等於因果)。

還有一種「強化學習」

(Reinforcement Learning, RL)

不需要標籤比對,也不像非監督學習單純從數據自發發現模式。

透過環境互動,根據行為得到的獎勵或懲罰來漸進地學習達成目標的策略。(就跟人類很像)

用強化學習來通關玩寶可夢

考試?

課程相關資源彙整 (中英)

作業三

[作業表單超連結請按此!]

請於 9/26 周五 23:59 前完成提交

簡短說明: 請找出一個生活中的 AI 應用,並回答以下問題。

1. 你發現了哪個 AI 應用?

(例如:YouTube 的影片推薦系統、Instagram 的限時動態濾鏡、Google Maps 的預估到達時間、蝦皮的「猜你喜歡」商品)

2. 簡要描述這個 AI 應用是如何運作的?它在「學習」什麼?

(例如:它學習我看過哪些影片、停留多久,來推薦我可能喜歡的新影片。)

3. 這個 AI 應用為你帶來了什麼「好處」?

(例如:節省我尋找影片的時間、讓我發現新的興趣、讓我的照片更好看。)

4. 根據課堂上學到的概念(如:偏見、黑盒子、信任),思考這個 AI 應用可能存在的一個「潛在風險」或「負面影響」?

(例如:它可能讓我陷入「同溫層」,只看見我想看的內容,視野越來越窄。或是,美顏濾鏡可能加劇了容貌焦慮。)