自從電腦發明以來,大眾對「AI智力超越人類,最終統治世界」這樣的技術奇點(Technological Singularity)充滿擔憂,許多科幻電影也基於上述假設展開劇情,例如電影魔鬼終結者裡的AI超級電腦Skynet,因產生自我意識,認為人類具有威脅性,因而想要毀滅人類而發生核戰。
未來學家雷庫茲維爾(Ray Kurzweil)是奇點理論的信奉者,他在2008年創立奇點大學(Singularity University),在Google、Nokia、LinkedIn等公司的贊助下,成為創意的孵育地。雷庫茲維爾認為,到2029年AI將達到人類的智力水平,而到2045年,AI運算力會超過人類10億倍,人與機器將深度融合,奇點就會來臨。
然而,奇點真的會到來嗎?這樣的論點,在全球已經掀起一波論戰。
開放式深度學習框架Keras的作者François Chollet,認為人們對智力的誤解引導出錯誤的推理。Chollet認為,智力高低並不能決定成功與否,沒有任何證據可以證明IQ高的人,能做出對人類社會更大的貢獻,而且大多數的智慧並不存在於人類大腦中,而是外部化成為人類的文明,變成人類的工具,使人類的問題解決能力不斷提高。人類自己,就是一個不斷迭代自我增強的系統。
因此,在擔心AI是否會毀滅人類之前,我們更關心的是,AI目前的發展進度為何?企業應如何導入AI,幫助企業增加內部效率,甚至改變營運模式。以下就將針對2018年AI技術的最新發展進行探討。
2018年AI 視覺辨識發展
1)簡化自定義分類工具
2018年1月18日,Google雲端人工智慧暨機器學習首席科學家李飛飛,透過Twitter宣布Google推出客製化的機器學習平台Cloud AutoML。
Cloud AutoML採用遷移學習(Transfer Learning)技術,利用已經預先學習的神經元圖像,套用到新的分類目標中,達到快速訓練的目的。目前Cloud AutoML僅推出視覺工具包AutoML Vision,藉由Google已經預先訓練好的公開資料集ImageNet,達成簡化訓練的目標。
AutoML Vision特別適用於辨識具專業知識的特定應用領域,即使對AI模型不熟悉的開發者,也可以很快的創造出圖形分類器,因而達到「AI民主化」的成效。
2)精確的大規模圖形自動標註
目前深度學習可以讓AI進行大規模的圖像辨識,其中一個成功要素,來自於高品質人工標註的資料集。史丹佛大學的ImageNet圖形辨識競賽,就匯集了1,400萬張經過人工標註的圖片,由人工手動分類成2萬種不同的類別,再訓練AI進行辨識。到2015年以後,辨識錯誤率已降到5%以下,超過人類的水準。
人工標註的資料集,規模達到千萬等級已經趨於頂峰,然而真實世界並無法只靠千萬張圖片來詮釋。因此,全球大廠仍然在發展自動化的圖形標註。
2018年5月,Facebook在F8開發者年會上公布了新的成就,透過其平台上35億張公開照片以及用戶自行定義的HashTag上,訓練圖像識別系統,來代替人工標註。Facebook採用弱監督式學習演算法,達到了85.4%的準確率。
這項功能強大的地方在於用詞更準確,舉例來說,AI在辨識蘋果派時,就是「蘋果派」,不會被標註成泛用的類別「食物」,更貼近真實世界。
2018年AI 自然語言發展
語音助理從家庭進入企業
2018年在Amazon上面的熱銷商品中,智慧音箱Echo佔有重要的一席之地。Echo讓語音技術走進家庭,透過智慧音箱,可以撥放音樂,也可以訂購商品、叫計程車、撥打電話、查詢天氣、播報新聞、控制智慧家電等,Amazon為Echo開發了一萬多種應用,讓Echo成為智慧家庭的中心。除Amazon外,Apple、Google、Microsoft、Sony、小米、天貓與京東也都推出智慧音箱。
而智慧音箱的靈魂便是語音助理系統。語音助理系統必須具備語音辨識、自然語言分析、語意識別等重點技術。智慧音箱是否熱銷好用,語音助理系統功不可沒。
而2018年語音助理系統近一步走進企業市場。IBM就是企業語音助理的解決供應商之一,提供企業用戶語音助理解決方案Watson Assistant。IBM將人工智慧、雲端運算與物聯網結合在一起,提供良好的顧客體驗,並同時保持商業與顧客數據的隱私與安全。
IBM初期將此解決方案鎖定特定應用領域,包含汽車、飯店房間、零售商店與會議室等,並且和汽車製造商HARMAN,在一台Maserati GranCabrio敞篷車上,合作展示Watson Assistant數位駕駛解決方案,打造無縫的智慧生活體驗。
2018年AI 認知理解發展
強化式學習幫助AI認知理解
認知理解發展是人工智慧領域一個重要的部分。發明AlphaGo圍棋AI的DeepMind公司,打敗韓國九段棋士李世乭,讓大眾對AI能力大為震驚。
DeepMind在AlphaGo獲勝後,仍不斷精進圍棋AI,2017年10月,在Nature上發表論文,推出AlphaGo Zero,DeepMind拿掉人類創造的所有圍棋知識,讓AI徹底亂下,從0開始對弈。AlphaGo Zero訓練時間更短,採用強化式學習技術,僅訓練3天就達到擊敗李世乭AlphaGo Lee版本的水準,訓練21天達到擊敗柯潔的AlphaGo Master版本的水準。而2017年12月,DeepMind再發表新論文,推出Alpha Zero,一種通用型的棋類AI,Alpha Zero僅訓練幾小時就在圍棋、西洋棋、象棋等領域稱霸。
DeepMind達到這空前的成績,除了演算法不斷精進外,也利用Google TPU運算資源進行快速訓練。但圍棋AI將不是只有DeepMind可以擁有,2018年5月,Facebook宣布開源其ELF OpenGo圍棋機器人。Facebook人工智慧研究院實現了DeepMind AlphaGo Zero及Alpha Zero論文中的演算法,成為OpenGo機器人。根據Facebook表示,他們用兩千顆GPU(圖形處理器)訓練兩到三週後,得到的這個圍棋AI OpenGO。Facebook宣布將OpenGo開源後,任何人都可以取得原始碼進行圍棋AI訓練。
AI 走入尋常百姓家
所謂的AI民主化,希望透過雲端運算服務,並簡化AI工具,讓AI技術可以迅速普及化,導入到各行各業,而不是只有少數企業可以使用的技術。
科技大廠已經積極往AI產業發展,而底層的Framework(架構)也已經具備,許多AI演算法都開源讓所有開發者使用。對企業來說,這是一個充滿機會的年代。不需要從底層開始,就可以很快導入AI技術,為企業提高作業效率,甚至開創新的營運模式。
因此,不久的將來,AI技術將快速從學術領域走向產業,成為各行業的驅動力,影響零售、媒體、文化、金融以及健康等應用領域。