台大電機工程學系副教授李宏毅

AI非萬能 制定題目最重要

採訪/施鑫澤 文/林裕洋 刊期/2020.02

目前AI技術雖然非常成熟,但並非像科幻電影般的無所不能,所以企業在推動AI專案時,應該要將題目簡化成AI可以做的事情。

台大電機工程學系副教授李宏毅,目前AI技術雖然非常成熟,但並非像科幻電影般的無所不能,所以企業在推動AI專案時,應該要將題目簡化成AI可以做的事情。

隨著AI已成為各種智慧服務的重要核心,世界各國莫不積極投入AI技術的研發與推廣,藉此累積國家在國際舞台上的競爭力。身為台灣推動AI發展的重要單位-科技部,則是選擇從「小國大戰略」出發,基於台灣現有ICT產業優勢,打造由人才、技術、場域及產業共構的AI創新生態圈,引導臺灣成為AI發展重鎮。

除了在台灣打造4個AI中心之外,科技部也舉辦多項與AI相關的比賽,如隨著智慧語音服務盛行,便與科技政策研究與資訊中心合作,共同舉辦的第一屆「科技大擂台:與 AI 對話」,決戰階段AI語音除完成1000題選擇題外,還必須通過「華語文能力測驗」流利級、精通級25題簡答題試煉,最終台灣大學團隊奪得冠軍。

帶領團隊參與此項比賽的台大電機工程學系副教授李宏毅說,這次比賽吸引超過700名好手參加,顯見多數專家對語音辨識感到有極高興趣,也代表台灣在發展語音辨識方面潛力無窮。這項比賽最困難的之處,在於團隊無法預測考試的題目為何,機器要憑著人工智慧能力辨識分析題目。因此,現階段中文語音辨識邁向成熟階段,尚且要克服的許多困難,如語音辨識、語意理解等等,這可做為台灣發展中文語音辨識的參考。

首席AI專家 吸引400人上課

現任台大電機工程學系副教授的李宏毅,自2015年起在台大開授有關機器學習課程,並將上課教材、作業與影片放在其個人課程網站內公開分享,其中的課程影片皆放在YouTube網站公開撥放。其中,「Machine Learning」(2017年秋季)與「Machine Learning and having it deep and structured」(機器學習及其深層與結構化,2018年春季),能完整介紹機器學習的原理與進階課程。

李宏毅研究方向是以機器學習技術讓機器辨識並理解語音訊號的內容,即以深度學習技術為基石,致力於語音數位內容搜尋、語音數位內容之自動化組織以及從語音數位內容擷取關鍵資訊等前瞻性研究。前述技術有多元應用面向,如人機互動、問答系統、智慧型線上教學平台等等,而其在2018年於台大開設的機器學習課程,吸引高達四百人同時修課,也凸顯台灣學生對學期AI知識的渴望。

李宏毅指出,AI教育最重要的部分,是培養學生不斷求新與學習的能力,可不斷學習最前瞻技術。因為AI技術變化相當快,所有論點可能半年之後就被推翻,因此AI技術學習沒有終點,這是所有學習AI技術的學生與在職人士,應該要理解的部分。對AI有興趣的人,可到arXiv網站去瀏覽相關文章,因為多數AI專家在得出研究成果後,通常會立即在該網站上發表。由於文章並沒有經過審核,所以論點不一定完全正確,但確實是一個掌握趨勢與技術的最佳平台。

三大階段著手 推動AI專案

在AI演算法成熟、運算能力持續進化下,市面上出現眾多以AI技術相關的應用服務,如語音辨識、自動駕駛、智慧醫療等等,讓企業對AI技術有莫大期待,誤以為該技術無所不能,最終卻面臨AI專案成效不彰的困境。其實AI技術發展至今,無論在應用面或執行面上仍然有很大限制,因此李宏毅認為應該要四階段著手,才能落實在商業環境的應用上。

李宏毅表示,目前的AI技術,並非像科幻電影般的無所不能,所以企業在推動AI專案時,應該要將題目簡化成AI可以做的事情。舉例而言,企業若想要強化在商業環境中的競爭力,應該先思考本身面臨的挑戰為何,如是產品功能不足或是欠缺掌握市場趨勢的能力等等。等待問題釐清之後,在制定合適的AI專案,才能達成事半功倍的效果。

推動AI專案過程中,第二階段是要收集訓練資料,在各方大力宣傳下,多數人都知道AI專案成功與否的關鍵,在於需有大量資料訓練,但是卻面臨不知道從何取得訓練資料的窘境。蒐集訓練資料的重要工作之一就是標註資料,也就是收集成對的資料,如當要推動語音辨識時,就是要語音辨識能與相對應文字能串連,才能讓AI開始學習語音辨識,企業面臨最大挑戰,即是要去哪裡收集資料,以及公司是否有成對的資料能夠利用,同樣以語音辨識為例,如youtube影音平台上的影片,有很多影片均有字幕可以使用。但由於資料源自於許多人免費貢獻,所以資料乾淨程度較差,所以端看企業能否接受。

最後一項工作,則是訓練AI模型,以及找出需要相關專案所需的演算法。訓練模型需要花費很多時間,可能長達數個月之久,但是多數企業能夠接受的時間約7天,兩者之間的差距很大。企業若需要訓練一套可用的模型,勢必需要仰賴大量GPU運算協助,才能要找出一組可商業化的參數。所幸目前不需要自行建置高效能的AI電腦,可用合理價格在網路上取得取得所需的運算資源,如AWS、GCP、Azure等均有,端看企業願意投入的資源高低。

資料收集難度高 可用公開資料訓練

李宏毅認為企業要收集大量成對的資料難度很高,因為成對資料的產生往往需要耗費大量人工。不過,在沒有大量成對資料下,其實仍然可以訓練出來一套堪用的解決方案,又或者企業也能以比較低的成本,產生出大量的成對資料。第一種方法是facebook平台上有很多影片上,雖然多數可能沒有字幕,但是卻會有hashtag或評語。因此,在打造語音辨識模組時,可用影片語音內容與hashtag或評語連結起來,發展出一套可用的語音分析解決方案。

第二種方法則是可從大量沒有標注的資料中,自行創造出大量的成對資料。機器學習不一定要成對資料,也能學會一些簡單的事情,如可透過克漏字概念,專案人員可用系統去預測被蓋住的詞彙,這種模式發展出來的AI模組,已經足夠應用於部分問答服務,也算是還不錯的方案。

另外,以語音辨識為例,很多人會對Amazon的智慧音箱 Alexa講話,因此Amazon 可以輕易蒐集到大量的未標注語音資料,Amazon 曾經嘗試用多達100萬小時的未標注語音資料來強化用7000小時標註資料訓練出來的語音辨識系統,使得語音辨識系統辨識正確率得到顯著的提升。

「在推動AI專案過程中,因為深度學習技術至今仍然是黑盒子,所以幾乎沒有辦法驗證效能。」李宏毅解釋:「以Google在做語音合成時,一套深度學習的類神經網路,再將文字變成語音。結果該公司方案會在某個單字發音時出現破音狀況,顯見沒有方法可確認模型是否會有漏洞。但是此種瑕疵發生在醫療或交通上,應該沒有人可以接受,因此AI技術尚且沒有辦法真正應用在關鍵領域之中。

學校、企業落差大 AI專案難度高

鑑於產業對AI人才有大量量需求,除學界開始開啟相關課程之外,產業界也推動多元人才培育計畫。如在Google的智慧台灣計劃中人才培育項目,即擴大人才培育的範疇,預計可在 2020 年底前讓1萬人接受 AI 基礎訓練,降低學習AI和數位知識的門檻,亦積極推動人工智慧技術人才的密集培訓,讓不同專業領域的學員都能如虎添翼,以人工智慧加上原本的領域知識,具備協助各企業解決問題,以及帶領人工智慧團隊的能力。接受完整人工智慧課程的專業AI人才,可望扮演技術種子角色,深入台灣產業的各個層面,以其本身專業及人工智慧技術協助企業解決在邁向智慧化的過程中所面臨的難題。

李宏毅認為,現今企業要組成AI團隊,除讓員工接受AI課程訓練之外,最常見做法便是到學校尋找相關人才,關鍵在於有受過完整的深度學習課程,可扮演帶領AI專案團隊的重責大任。然而多數企業有訂PKI的規定,期盼在半年內看到相關成果,但實際上並不容易。除需要時間收集資料之外,團隊成員也需要熟悉產業相關知識,加上需要耗費大量費用打造符合AI專案的基礎環境,所以真正成功的企業並不多。

產學合作兩面刃 需改變思維

為協助台灣企業加速運用AI,科技部規劃「AI主題式產學合作計畫」將學研機構AI相關研發成果導入業界,為廠商尋求具體解決方案之過程,另遴選合適之人才,配合前述過程進行實作,達成人才培育及替產業培訓人才之目標。雖然該計畫確實有助於解決企業面臨AI人才不足的問題,但是實際上可能還有許多困境。

李宏毅說,與學校合作推動產學專案,確實有不少優點。首先,自然是可以解決人才不足的問題,有利於推動AI專案。其次,由於學校本身沒有須做出成果的壓力,所以自然願意嘗試多種創新技術,企業也能藉此掌握最新的AI技術。只是誠如前述企業都會制定PKI,這不利於產學專案的合作,且若期待學生在求學階段就要求做出成果,也相對比較不符合實務。學生應該還是要專注在論文上,若被企業的KPI綁住,反而會限制學生的長期發展。

比較合宜的方法,應該是讓學生能專注在學校的AI研究專案,企業在依照公司營運狀況,選擇合適的AI研究團隊,讓學生畢業之後能夠到業界上班,可兼顧AI研究與公司未來發展。