之所以會寫這篇文章,主要是因為育聖老師在這篇貼文裡問到「你的專業的核心知識是什麼」。我覺得這個問題很棒,想藉機回答看看,也順便整理自己在四年的工作經驗中究竟理解到什麼事。
文章大綱
訓練與推論
你或許有聽過,AI 主要分成兩個階段:訓練與推論。
訓練指的是人類用大量的資料餵給 AI,推論則是 AI 用從訓練資料裡學到的東西來預測未知。
以我自己的話來說,AI 的本質是用過去的已知來預測未來的未知。一切看似神奇的 AI ,無論是生成文字的 chatGPT、生成影片的 sora、 做圖片的 midjourney 等等,目前都尚未脫離這個範疇。
ChatGPT 的訓練資料是從網路上蒐集的大量語料,維基百科、部落格文、論壇、書籍、新聞;Midjourney 則盡可能搜集網路上所有公開的圖片。無論是生成文字還是生成圖片,模型吃的資料都是過去的已知。
接下來我想試著用一個每個人都經歷過的事,試著解釋 AI 是如何學習的。
作業、模擬考與大考
AI 是如何被訓練的?AI 的學習過程是什麼?我喜歡用考試來比喻。
所謂的「訓練」,即拿很多資料來餵給 AI 的過程,就像是學生時期在考試之前要做很多習題一樣。對 AI 來說,無論資料是文字、圖片還是影片,每一筆資料就像是一道題目。題目可能是一篇部落格長文、一張貓貓圖片、或是一部電影預告片。這就是「訓練集」。
究竟要做多少題目才夠呢?沒有人知道確切答案。在運算能力沒那麼強的時候,有人嘗試找到最低的題目數。但是現在運算能力越來越強,讓 AI 練個幾百萬題都沒問題,多多益善。以結果而言,反正只要能通過考試即可,對吧?
題目做夠之後,要怎麼確保 AI 學的成果如何?
對於這個問題,我們可以想想:在學校裡,老師如何確保學生們學會了沒?答案是:模擬考。模擬考裡面會有什麼?通常是和之前一樣的習題很像、卻又有一點變化的題目。這就是「測試集」。(請容我先忽略 validation 與 testing)
模擬考考完,也確定 AI 表現不錯之後,接下來要面對的就是大考了,即真實世界的資料。真實世界總是千變萬化,有數不清的驚喜。可能很多人看過下面這張迷因,它很好地解釋了真實世界有多難以預測:
我們對 chatGPT 所下的每一個 prompt ,對它來說就像是大考的題目。所以它自然有些題目答得好,有些則比較差。如果你覺得它有些事情為什麼可以做得那麼好,那是因為它剛好做了比較多某種類型的題目(例如叫它總結一篇文章)。
練習用的習題與模擬考都是人類能決定的範圍,不過大考會出現什麼,永遠沒人說得準。
我們知道 AI 到底學到了什麼嗎?
你可以說 AI 是一個黑箱,我想不會有太多人反對。
即使人類能控制餵給 AI 的資料或參數,我們也無法 100% 控制 AI 能從中學到什麼。有許多論文會嘗試解釋 AI 學習的過程,不過,能有 100% 信心說出「我完全了解 AI 學到什麼」的專家我想恐怕不多。(如果有的話歡迎補充給我)
我們可以清楚地說出電腦是由 CPU、記憶體、顯示卡所組成,每一個元件在開機時的運作順序,以及日常運作中所扮演的功能;但我們目前有辦法知道 chatGPT 裡每一層 hidden layer 所扮演的角色是什麼嗎?是第十層在了解語意嗎?是第二十層在分析詞性嗎?到了第五十層才開始理解上下文,還是第五十二層?
目前還沒辦法。
這有點像教小孩。我們可以給小孩看我們的選書,但是要 知道小孩究竟從自己給的資源裡學到什麼,則不完全是我們能控制的事。
AI 的本質是什麼?
AI 的本質是從過去的已知學習出某種模式,藉此預測未來的未知。
由此,我認為 AI 的精神之一,在於「減少重複的工作」,更簡單的說,就是自動化。說穿了,我認為軟體業的精神也不離自動化三個字,AI 到目前為止仍算在軟體的範疇,自然也脫離不了這個精神。
過去四年的工作裡,基本上我都在做同一件事:用模型找到更好的受眾,以提升廣告成效。如果 AI 下的廣告成效和人類下的效果相同、甚至更好,那人幹嘛還要親自做?交給模型不就好了嗎?如果未來每個月都要重複下廣告,模型又能夠做得比人好,那何不把所有事情都交給 AI?
我想稍微大膽的說:只要有重複的部分,AI 就有可能學會,因為這就是模型的功能——從過去的已知找出某種模式。
寫程式是否有重複的部分?是,出現了 Copilot;外場服務生是否有重複的部分?是,出現了端盤機器人;上字幕是否有重複的部分?是,出現了自動辨識字幕。
反過來說,如果是不具備重複性、或是隨機性大於重複性的工作,可能就是 AI 派不上用場的地方。如果在過去的已知裡,沒有明顯的模式,AI 可能就沒辦法學得很好,自然也比較難取代人類。例如——人的情緒、思考的過程。
以寫作來說,寫作重複的地方是什麼?可能是架構,例如「觀點、舉例、結論」的框架,也可能是研究某個主題、尋找資料佐證的過程。
寫作不重複的地方是什麼?可能是每個當下的情緒與感受、選擇的字眼、想傳達的潛台詞、化模糊為具體的思考過程。就算針對同個主題,在不同時空背景之下,寫出的文字也不會完全相同,就像就算是寫同一個字也沒辦法保證每一個字都長得一模一樣。人心是流動的。
這裡想表達的是,每個工作都含有重複與隨機的部分,比例的高低則視工作而定。目前為止,我所理解到的 AI,並不是要取代人類所有工作,而是要將工作裡重複的部分自動化。