,

AI 的發展近年為何加快了呢? 精神時光屋來了

Posted by

最近大家會覺得 AI 領域的發展不可同日而語,但其實近期市場上最熱門的主要是生成式 AI與相關的演算法和模型,但能夠真正成為人類最期待的通用 AI 仍還在發展中,那為何業界會很震撼的原因,其實在於生成式 AI 和相關的演算法、模型、API 已經陸續透過雲端和自建資料中心的方式,以最容易上手的資源形式讓許多大中小企業和個人可以使用,這是過去好幾年研發成果的累積,逐漸在這兩三年開花結果,而成果逐漸是我們般人可以感受到的,但工程師、研究者感受到則是更震撼的未來。

AI 大爆發是基於神經網路、機器學習與NLP多年發展的基礎

在 80 年代 90年代陸續就有基於 卷積神經網路 相關的論文與網路系統的設計,演算法也逐漸發展中,但到了 2014 年AlexNet 的深度學習卷積神經網路拿繪圖處理器 (GPU) 加速並獲得不錯的圖像辨識成果,市場就明顯地加速增溫了。圖像辨識是我們在做機械學習(ML,machine learning)與建構 AI 辨識能力的一項很好的方式,大家都在聚焦辨識的速度啦、準確率,使用的能效等等,經過多年的發展,辨識效果越來越好,機械學習在 電腦視覺(CV) 已經發展到不錯的程度。一個正在大量部署中的簡單案例就是行車車牌的辨識,道路路口的車牌辨識、停車場的車牌辨識等等,加上即時車流車牌的辨識(需要更大的計算能力與辨識能力),這些都是在過去時代沒有的產物,現在已經越來越便宜到各家單位可負擔,未來還會再加碼更多應用上去。

在2019 年 微軟 Azure 平台釋出了 Custom Vision ,大家要做機械學習,做模型訓練的動作就更簡單了,簡單說就是門檻降低,你不用自己搞太多那些機械學習的解決方案,採用的企業家數變多,有更多人開發有意思的應用出來。

另一個 AI 重點就在人類多年在資訊科技的期待和發展上,也就是自然語言處理(Natural Language Processing,NLP) ,這可是資訊科學的重點之一,因為從有電腦程式以來,人類都是用各種定義好的機械語言、程式語言和電腦、程式去做溝通,而電腦和程式其實一直不懂人類的自然語言,你要做很多的轉換給他才能以預先寫好的方式來對應使用,因此,相關的科技發展了好幾十年,人類要想辦法「教」電腦能夠真正辨識我們提供的自然語言、對話、文字,甚至是語音,要有演算法和程式能夠把這些轉換給電腦,讓他們去做判斷與對應,所以,一直到有機械學習這種東西出來幫大家加速,NLP的實際發展就更為快速,2017年的Google大腦計畫釋出的 Transformer 模型,就不得了了。

能處理NLP和CV的它,具備並列化優勢可以一次處理大量的資料,所以人類就可以把它用在更大的資料集上進行訓練,讓BERTGPT這些預訓練模型能夠誕生,把各種大型語料庫拿來進行訓練,加上前面講過的,我們可以用 GPU 來加速運算,這樣全部兜起來後,很快地就發展出更多不同任務的訓練與整合。GPT 發展過程中的成果,等於是一年訓練就超過以往這領域人類產生的成果了。

人類取得了資訊科技中的神器 – 精神時光屋

前面提到,要「教」電腦學會這些東西,我們用傳統的方法要訓練很久,但如果透過適當的演算法、預先訓練好的模型庫,搭配足夠的資料,繼續加以訓練,AI 程式能夠幫我們人類做的事情、自動化等等工作任務就會越來越多,且速度會越來越快,範圍越來越大。

這樣一來,包括文字對文字的理解與回應 (如我們看到火紅的ChatGPT聊天機器人,知道你打的內容並正確地回應問題,從模型資料中找適合的東西排列組合給你)、文字到圖像 (Text to image,如我們看到很熱門的 mindjourney AI 繪圖、stable diffusion、Adobe firely微軟 bing image creator等等),文字到聲音音樂等等,就陸續在這幾年發表出來,並加速 AI 領域應用在全球市場的發展。

而且這個速度還會是越來越快的,我會把它定義為 AI 精神時光屋,它畢竟不會累,也不會煩,能重複幾千萬次、幾億次以上的運算去重複加強它的模型資料,以及改善演算法。且各家廠商會陸續把API放出來給大家用並賺錢,如微軟把OpenAI的服務放上Azure,讓更多企業可以打造適合自己用的 AI 工作任務。

以我們在工業製造上碰到的各種辨識、光學檢測、除錯、資料排序等工作來說,AI 可以幫助我們的不少,業界已經有許多廠商把自己擅長的 domain knowledge,搭配演算法去結合 AI 去解決各種生產上的問題與改善製程。

所以,我記得在 2022下半年開始玩stable diffusion生圖,當時我就覺得不得了了,而2022 年底上線的 ChatGPT 更是了不起,我們等於可以看到結合各種 AI 模型後,能夠處理和反應的東西就更多,從文字、圖像到語音、影像都是。加上 GPT 系列模型拿來當我們寫程式開發用的輔助工具更強大後,我相信人類的技術發展可以繼續往前走滿遠的。

不但如此,全球應用科技中最受矚目和擁有龐大資金的半導體產業,也在這次 NVDIA GTC 全球技術大會中讓世人知道,半導體的製程可以透過 AI 來改善,這意味著,這只是個開始,全人類的許多製程和方法,陸續都會有 AI 可以協助和強化的地方。

台積電 (TSMC),以及新思科技 Synopsys 等半導體廠,也把 NVIDIA 的運算式微影 cuLitho 技術,去整合到半導體製程中,換言之,可以大幅改善半導體廠的產能和資源安排。台積電他們是最快導入的,預計將在 2023 年6月就開始運用相關技術進行晶圓代工製程。

我們來看NVIDIA 執行長黃仁勳講的,在微影技術已達到物理學極限情況下,NVIDIA與台積電、ASML、Synopsys經過長達4年合作,推出在GPU上運行的cuLitho,其效能較目前微影技術高出40倍,根據NVIDI資料,500個 NVIDIA DGX H100 系統可以做到相當於 4 萬個CPU系統的工作量,差異相當可觀。採用 cuLitho 技術的半導體晶圓廠,每天可望讓用電量減少9倍,光罩生產量增加3到5倍。原本需要兩周時間才能生產出一個光罩,如今在一夜之間即可完成。長期來看,cuLitho 將有助於創造出更好的微影技術,也有人工智慧的協助及各種改善製程的方式。

ChatGPT 正式支援各種外掛的影響,AI普及於各領域只是時間問題而已了

OpenAI讓ChatGPT開始支援各種外掛,以及各家公司都推出AI雲端服務API給大家串接,我們就知道 AI 普及於各領域只是時間的問題而已了。

在這個AI 大爆發的時代,大家先不需要去擔心失業的問題,而是去想接下來的發展會有哪些領域會先走,那些工作可以先自己用 AI 來嘗試整合看看,去熟悉 AI 這個市場的潛力和未來性。

軟體工程師還是需要的,因為不論做哪些程式,即便是有AI來寫,要告訴它怎樣寫,哪些領域是需要的,商業邏輯該怎樣走,這些還是需要人類的智慧,因此懂得和AI溝通是一回事,你自己對產業的了解,工作流程和工序的明白程度,會影響你在 AI 時代中,寫程式、做專案的工作內容與成果。

翻譯書本和文章也是,如果你有足夠的domain knowledge ,翻譯財經書籍、文學書籍、專業書籍都還是需要專業編輯的能力,但其中翻譯文本的工作,很多可以讓AI先完成大部分,人再來精粹句子和呈現即可,也能夠去訓練自己風格的翻譯機器人來幫你做翻譯書的基礎工作。至少,資訊科技類的書籍,AI目前已經做得很很好了,可以參考保哥他用AI翻譯好的 提示工程 (Prompt Engineering)  這本電子書一樣,人工部分只有1%,但我覺得可以弄得更好,比方說我不喜歡優化這個翻譯,就會全部把它改成最佳化。

對我們大部分人來說,要熟悉一個新科技都需要時間,但重點是我們的學習心態,以及採納新科技的接受程度,對每個人的工作應該是有所幫助的。避免重工,我覺得是 AI 工具目前帶給我們很重要的啟示之一。

以程式開發來說,除錯和查找資料、文件就是很花時間的事情,最適合AI在旁邊幫助你做,不妨試試看這個 GitHub Copilot X,用過上一代的人幾乎都說棒,基於 GPT 模型打造的程式開發AI輔助工具。

至於未來,真正的通用 AI 是否能夠更快出現呢? 通用AI 如果出現,配合適當的機器人動力科技,就能夠帶給我們類似 底特律:變人 這樣的仿生人了, GPT-4 模型的一些研究成果已經透露出端倪,且讓我們拭目以待。

延伸閱讀:

OpenAI 推出 ChatGPT Plugins 外掛支援啦 !

NVIDIA GTC 2023 – 生成式 AI 將日益成熟精進,AI 即 SaaS 成短期主流

GPT-4 橫空出世了,AI 技術再升級

連律師的工作Harvey AI都能包了,AI 能發揮的領域還包括哪些呢?

人工智慧以生成式AI成功切入各領域後,將如何影響人類生活呢?

歡迎留下您的想法與意見:
新網站新氣象,會想到緞帶教堂的美好
一直很喜歡的緞帶教堂 Ribbon Chapel
2023 年 3 月
 12345
6789101112
13141516171819
20212223242526
2728293031