國立臺灣大學資訊工程學系特聘教授陳信希

設定目標與建立團隊 打造完美AI績效

採訪 / 施鑫澤 文 / 明雲青 刊期/2019.11

企業欲實現 AI,須仰賴幾種不同人才,一是懂 Business 的資深員工,協助想像適當的 AI 命題,另需借助工程師,幫助公司建立最佳模型。

臺灣大學資訊工程學系特聘教授陳信希強調,科技部臺大人工智慧中心期望統合跨領域、跨單位的 AI 計畫團隊,開發機器學習與深度學習、資料探勘與巨量資料分析、人工智慧知覺、自然語音與語言處理、人工智慧政策與法律等理論和前瞻技術,躍居國際級 AI 研究中心。

無庸置疑,載浮載沈長達一甲子的「人工智慧」(AI),總算在近幾年揚眉吐氣,受到各界極大重視;而向來富含前瞻研究能量的學校、例如國立臺灣大學,也同樣對 AI 投以高度重視。

在此前提下,舉凡 AI 技術發展趨勢、政府與學校所推動的相關研究成果,乃至於企業如何有效運用 AI、解決實際商業問題,各種從 AI 衍生出來的議題,都讓人們倍感興趣。

身兼臺灣大學資訊工程學系特聘教授、科技部人工智慧技術暨全幅健康照護聯合研究中心主任,以及臺大醫院醫務秘書等多重職務的陳信希,堪稱是國內夙負盛名的 AI 研究學者之一。他指出,可藉由 Gartner發佈的 2018 年技術成熟度曲線為基礎,初步理解各項 AI 技術處在哪些發展階段。

強化學習、知識圖譜等技術,處在快速揚升的軌道

眾所皆知,在技術成熟度曲線之中蘊含五大階段,分別是「科技誕生的促動期」、「過高期望的峰值」、「泡沬化的底谷期」、「穩步爬升的光明期」及「實質生產的高原期」;而與 AI 相關的智慧應用、CUI(Conversational User Interface)、自然語言生成(NLG)、Human-in-the-Loop、Crowdsourcing、知識圖譜(Knowledge Graphs)及 AI 開發工具等多個項目,目前都處在「科技誕生的促動期」上升軌道,預期今後幾年會持續成為焦點。

扣除掉前述在上升階段的亮點技術,其餘有些看似依然熱門的選項,其實已邁向「過高期望的峰值」、甚至「泡沬化的底谷期」。陳信希說,若對比 2016、2018 兩年技術成熟度曲線,確實出現由熱轉冷的跡象,例如自然語言處理(NLP)便是一例;但他認為這純粹是趨勢使然,因此有些技術從高峰滑落,並不代表不再受到重視。

時序推向 2019 年,落在「科技誕生的促動期」的 AI 技術依然不少,有幾項特別值得注意,首先是「可解釋的人工智慧」(explainable AI),因為即便深度學習(Deep Learning)引領風騷,但從 input 到 output 過程,難免給予人「黑盒子」之感,所以愈來愈多人亟欲解釋箇中現象,可解釋的人工智慧為發展重點技術之一;其次為資料標記或高標準標記品質服務(Annotation Services),資料為 AI 發展過程中不可或缺的重點,如何將資料轉為有標記的資訊,當然是重中之重;其他重點項目還包含知識圖譜、AI 開發工具,及強化學習(Reinforcement Learning)。

當然,已脫離「科技誕生的促動期」的許多 AI 技術,仍有持續關注的必要,比方說進入「泡沬化的底谷期」的電腦視覺(Computer Vision),便不容輕忽,因它在一些 AI 國際頂級學術會議,仍舊持續保有很高能見度。

以 2019 國際人工智慧聯合會議(IJCAI)為例,總計提交的 4,752 份論文中,電腦視覺便佔 17.5%,僅落後機器學習 52.9%。綜觀 IJCAI 2019 頒出的 Classic Paper Award(選自於15年前發表於人工智慧期刊的論文)、Prominent Paper Award(選自於近7年發表於人工智慧期刊的論文),分別與強化學習、Dropout Learning 演算法等主題有關,顯示模型自我學習適應環境,以及避免過度擬合(overfitting)的技術,已廣為各界重視。

科技部臺大 AI 中心 主攻智慧技術與生技醫療

有鑑於 AI 是大勢所趨,科技部擬定五年期 160 億元預算的大計畫,嘗試在臺灣發展 AI 相關建置,其間涵蓋半導體射月計畫、智慧機器人創新基地、科技大擂台、AI 研發平台及 AI 創新研究中心等計畫項目;而臺大與交大、清大、成大所參與的即是「AI 創新研究中心」項目,共計五年 50 億元經費,科技部希望有興趣發展 AI 的人都能參與研究。

談到 AI 創新研究中心的發展目標,首先是培養高階 AI 人才,其次是扮演產業界與學術界之間橋樑,再者即是催生國際級 AI 研究中心,而科技部於 2017 年敲定成立四個中心,臺清交成各自負責其一,其中臺大選擇發展的主題有二,包括智慧技術與生技醫療,也因此產生了「科技部人工智慧技術暨全幅健康照護聯合研究中心」。

「我們的目標最重要的乃是期望統合跨領域、跨單位的人工智慧計畫團隊,開發機器學習與深度學習、資料探勘與大數據分析、人工智慧知覺、自然語音與語言處理、人工智慧政策與法律等理論和前瞻技術,成為國際級人工智慧研究中心。」陳信希說,其餘的目標,則在於建立國際 AI 生醫的重要研究聚落、建置充沛生醫資料庫和暢通的國際/產業合作管道,及培育 AI 人才並厚實 AI 產業發展。

綜觀現在由科技部臺大人工智慧中心推動的 33 項研究計畫,21 項與智慧技術相關、12 項與生技醫療相關,其中由陳信希主持的智慧技術研究執行單位,成員橫跨臺大、交大、清大、成大、師大、元智大學與中研院,至於這些學校機構的系所類別,則以資訊、電機、電信等領域為大宗,合計佔 90%,其餘 10% 一半來自電子領域、另一半來自人文領域。

論及智慧技術轄下計畫領域,係以機器學習與深度學習為最大宗,佔比達 43%,若和資料探勘與巨量資料分析的 18% 一併計算,已逾六成之譜,正好涵蓋了現今 AI 專案所需主流技術。

截至目前,科技部臺大人工智慧中心已孕育相當多耳目一新的研究成果。比方說由臺大資訊系徐宏民教授主導的「DeepTutor」,結合前瞻的深度學習演算法、系統平台及智慧互動技術,開發全新的多媒體問答技術。此外中研院廖弘源教授團隊與義隆電子聯手發展的「城市智慧交通車流與智慧商業流解決方案」,已部署在臺北、桃園、新竹、臺中、嘉義、臺南與高雄等城市,可謂成果豐碩。

其他同樣深具亮點的成果,還包括基於非督導方式訓練的語音辨識系統、Slow Motion Video Synthesis、基於SSR-Net 的人臉影像年紀估測模型、Disguised Faces in the Wild、群體人工智慧、情緒數據庫整理收集、基於 AI 應用之深度學習智慧系統整合、跨視覺資料模組之感知/合成/前瞻應用、生活記錄探勘及應用…等等。值得留意的,該中心已將「行動裝置人臉防偽造技術」技轉、部署於部份行動電話裝置,而計畫開發的「以視訊為基礎之多攝影機行人重識別技術」,亦已部署於實際場域中。

企業欲發展 AI 需有能力找問題、訂題目

在了解 AI 技術發展趨勢、學術界的 AI 前瞻研究成果之餘,企業更關心的,則是如何選擇適當 AI 技術、實際運用在其作業環境。對此陳信希先給出基本概念,AI 技術的選用,一定與應用場景有著密切相關,譬如醫療機構欲分析醫療影像,就適合選用電腦視覺技術,如果要分析病歷資料,會涉及文字方面的訊息解析,此時 NLP技術便派上用場。

「但無論如何,談到如何把 AI 應用到真實場景,其實是滿大的問題,」陳信希說,常見的情況,有些說要投入 AI 的企業,卻不曉得要做什麼,也不知道該如何處理資料。

不禁讓人好奇,若換個角度來談,假設有企業想尋求大學老師等專家的幫助,探索切入 AI 之道,那麼企業自己應該先做好什麼準備?陳信希說,企業對於想要達成什麼應用的期望,需有一定程度的理解,能描述問題,甚至手邊上應該有一些資料,也清楚這些資料的特性;但可惜的是,現階段這些事項對不少企業來說,仍具有挑戰性,他們不太清楚AI能幫什麼忙,此時老師會提出一些建議,引導他們把若干定量的資料拿出來、描述一下,將問題釐清到某種層次,慢慢把主題具體化,再逐步討論更細部的合作計畫。

要推動 AI 專案,首先必須找問題、訂題目,而訂題目必須要有一些Input,「不能兩手一攤等上帝來」,所以企業自己要有能力陳述其面臨的真實狀況、預期達到什麼目標,如此外部專家才能一起腦力激盪,真正進入計畫階段。

換句話說,產業界意欲尋找AI大數據的幫手,起碼要將數據分享出來,否則學界根本無從處理,也不知從何幫起。但畢竟資料對於大部份企業是珍貴資源,當然不會一下子願意掏心掏肺、在外人面前攤開資料,通常需要談好幾次,一步步引導企業把問題定義清楚,AI中心就有機會幫忙媒合,由適當的 AI 夥伴協助企業推動專案。

善用外界公開資料 加速催生 AI 服務

可以肯定的是,此時在產業界不論屬於前、中或後段班的企業,即使還沒真正做過 AI 題目,至少都已經在摸索、在思考如何投入資源,總是希望在發展的過程中,可以避免無謂的浪費、少走一點冤枉路,學校無疑是很好的求助對象。

陳信希說,以他接觸過的例子來說,有些企業對於 AI 已有高度的期待,然而對 AI 究竟能在其產業中扮演何種輔助角色,還不太清楚,再來自己的Data能發揮到何等程度的功效,也不太明白;另一種情況,企業已發展到一定規模,甚至某種程度上內部已有 AI 團隊雛型,也許 AI 人才比重還不見得高,但至少已有一定掌握,姑且可稱之「中上班」。相對來說,後者會是比較好談的對象。

不可諱言,屬於「後知後覺」類型的企業數量,比起前述「中上班」大上許多。但建議這些企業仍應先了解自己處在產業中什麼樣位置,想清楚可先從哪裡著手引進 AI,不要冒然看到別人已有些成果了,誤以為自己只要肯砸錢就有相同績效,畢竟 AI 應用需要靠時間的琢磨淬煉,不可能一步到位。

最重要的,不管企業處在哪個階段,至少應說得出現今營運過程大概為何,如此學校老師或外部專家,才可能幫忙公司想像,哪裡有機會可透過 AI介入、產生一些成效。坦白說,「想像」這件事其實應當由企業自己進行,但由於現階段多數企業對 AI 仍感陌生,所以專家只能退而求其次,藉由與企業的互動討論,先了解其營運操作的過程,甚至詢問是否已有相關資料,再逐步協助企業初步勾勒 AI 的應用輪廓。

另一種做法是,由公司指派懂Business的資深員工上AI課,他們扮演 AI 的想像者,可透過上課汲取一些經驗,再從公司實際運作過程,找出與成功案例情況較吻合的地方,做為 AI 切入點。

陳信希補充,企業做AI,除可使用自己的資料外,也不妨善用外部的公開資料,比方說在網路上,有一些 AI 競賽平台,上頭有很多由企業釋放出來的資料,甚至搭配徵選獎勵的機制,希望有團隊來幫忙做模型;由於此類平台往往都有嚴謹的登入、管理、排名機制,所以願意參與分享的企業愈來愈多,想做 AI 的企業,其實可以運用這些資源,做為加速推動 AI 應用發展的養分之一。