第 622 期文章

字級:
小字級
中字級
大字級

AI+AR智慧神隊友 加速元宇宙世界的來臨

AI(Artificial Intelligent)人工智慧不是新名詞,在ChatGPT誕生之前,許多人都是透過電影或新聞事件聽聞AI,因此不論是2001年的電影「A.I.人工智慧」、2004年的「機械公敵」,或者是現實世界中AlphaGo打敗世界棋王成為世界冠軍,AI對大部分的人來說就是一個智慧型技術的統稱 ,一個很厲害的神秘巨星。

 

2022年底ChatGPT被各界形容為「橫空出世」,所有的電腦人口幾乎都使用了ChatGPT查詢各種資料或問題,相關的AI軟體也快速演化與增長,發展速度令人瞠目結舌。AI此刻正如同唐詩中所描述的「舊時王謝堂前雁,飛入尋常百姓家」,由神秘巨星快速下凡成為工作夥伴,由Nice to have到Must to use,如今沒用過、不了解AI的人彷彿就要被時代淘汰。

 

AI這個落入凡間的精靈,令人一則以喜、一則以憂。喜的是ChatGPT、Midjourney、Stable Diffusion等AI軟體變成顯學,要寫稿的、要寫報告的、要產圖的,一夕之間都有快速產製的工具,再也不怕內容製作上缺乏想像力或有障礙;憂的是擔心AI有可能取代大家的工作。大致上來說,AI是透過機器學習(Machine Learning)、深度學習(Deep Learning)、影像辨識(Image recognition)、自然語言處理(Natural Language Processing)等技術,將大量的資料進行模擬演算與訓練,最終可以推演出應用模型來進行決策與分析。

 

但單獨存在的AI運用對人類的幫助有限,就算產出文字和圖像可以解決一些秘書或顧問的工作,但實務上還是僅限於片斷的幫助,無法完整解決問題。而上述提到的AI電影「機械公敵」,就是在描述一個AI發達的世界,機器人搭配AI,可以變成工作助手、居家照顧員,人類只要下指令就能完成指定工作,這是我們想像中更理想的AI世界。

AI+AR=神隊友

此種混合式或進階的AI世界,可以視AI為大腦,而眼睛就由AR(Augmented Reality)擴增實境技術來扮演。AI和AR是將現實世界與數位化、網路化整合的一組神隊友,因為AI可以透過深度學習的類神經網絡取代傳統AR電腦視覺做法,讓AR判讀物理世界的資訊更加準確;AR也可以透過AI收集更多數據強化辨識演算法,AI再透過鏡頭不斷偵測資訊強化演算訓練;AI也讓視覺場景加入添加物件檢測、文本分析、場景標註等新功能,進一步強化AR體驗。

 

AR結合AI可謂真正達成一種數位化且無所不在的媒體,AR軟體透過鏡頭和傳感器辨識與判讀真實世界環境的相關資訊,使用者從而可以用互動模式,將虛擬物件或虛擬資訊與真實物理世界相結合,達成人機交互,輔助行為模式。目前已知AI結合AR神隊友的產業應用情境將輔助各產業達到導覽導購、強化訓練、節省人力、提升業績等目標。

 

AR結合AI的產業應用場景與商機

1. 未來賣場與隨看隨買

「虛實融合的零售賣場」一直都是被大眾所期待的零售最後一哩路,雖然電商被視為是零售商場的一大威脅,但在疫情後零售賣場因為消費者體驗、社交話題、物流成本高等多重因素,反而需求提高,甚至有線上數位店走向實體的趨勢,另一層面在元宇宙科技的導入下,線上與線下的整合更是大勢所趨。零售場域在AI的趨勢應用下,未來賣場主要為兩大應用方向。

 

其一為運用AI對象標註,其方法是利用機器學習為分類模型,然後再將標籤覆蓋在AR環境中的物理對象,如賣場空間或者貨架,消費者即可在賣場中快速尋找到自己想要的商品,並隨時查找類似品類與了解即時庫存。另一應用類型為利用類神經網絡(CNN)演算法來估計場景中對象的位置與範圍,檢測到目標對象後,AR可以將物件疊加在指定目標空間中並理解兩者之間的關聯與展開互動。

例如:家具業者就可以應用此技術開啟AR鏡頭掃描周圍環境,量測出垂直與水平面,並且計算深度,然後建議適合放置於特定空間的家具,當然在工廠也可以透過即時標註技術查找零件或顯示操作方式,甚至於進行障礙排除等。

 

2. 未來工廠與高效訓練

多年來製造業一直受惠於AI人工智能,大約在80年代起許多工業場域就開始借助AI機器手臂來取代一些人力組裝的工作,但機器人通常和人類一起協作,執行有限任務範圍,到90年代起,AI更進一步取代人力來辨識產品的良率並進行產能預測分析。隨著XR延展實境技術成熟,工業領域中的培訓已經成為XR運用中最受歡迎的應用場域。XR提供無風險、沉浸式、可不斷重複訓練的環境,以提高各種訓練效能。儘管XR本身在訓練時也可以生成不同類型的數據,但如何解釋與判讀數據來評估使用者對操作技能的掌握程度依然是一大挑戰。目前將XR和AI結合則可以從XR的載具或體驗者端生成數據資料庫,再從資料庫中提取和選擇特徵值,並由AI演算法來確定相關的技能評估結果。另外,在工業類型的XR操作中,使用者需要解放雙手,因此就會應用到自動語音識別(ASR, Automatic Speed Recognition),自動語音辨識是一種依靠圖像處理來提取文本的演算法,特定單字觸發資料庫中標記為適合該字詞所描述的圖像,並將圖像投影到AR空間。在未來的培訓中,XR也將會廣泛被應用在各式訓練上,包含醫療、軍事、消防等工作,XR和AI的組合也被用於開發「虛擬使用者」的自然反饋,如在醫療領域,虛擬病患可在虛擬環境中與受訓醫生或人員進行互動,虛擬使用者可以透過互動產生各種情境反應,從而提高受訓者的專業度與特定技能。

3. 未來城市與隨身秘書

在2012年推出的Google Glasses示範了未來城市的情境,人們可透過智慧眼鏡的穿戴,將城市中的各種導覽與體驗透過視覺體現出來。後續Google進一步透過Google Lens的文字辨識功能,將AI與深度學習等文本資料進行多語言翻譯,最終透過視覺追蹤器將翻譯的結果顯示在AR用戶的目標對象上。

隨著智慧眼鏡的逐漸成熟,未來的智慧城市運用上,有了AI將不僅僅能提供翻譯服務,戴上AR眼鏡,就好像攜帶了隨身顯示螢幕,最了解你的AI即時導覽員隨時提供語音、翻譯、導覽、導航等各式專屬服務和互動遊戲,並且用最直覺的方式將資訊顯示出來,就像最貼心的隨身秘書提供各種便利。

無論大家擔不擔心AI取代人類,都無法阻止這項科技的進步,因此唯有擁抱科技,才能駕馭科技。由以上的情境看來,有了AI與AR這組智慧神隊友,XR元宇宙將會加速來臨,腦和眼等細節工作將由AI和AR來輔助,人類可以在工作中當專家,下班有貼心秘書陪你漫遊,人類會有更多時間用「心」來享受世界。

 

我要留言

歡迎您留下聯絡資訊,我們將由專人與您聯繫

輸入驗證碼
TOP
在線客服
客服時間
周一~周五 08:30~18:00
0809-068-588
關閉