(Woodward 8904-773)ChatGPT及其背后技術(shù),將如何重塑智能制造?
基于單模態(tài)GPT-3的ChatGPT 「地震」余波未平,多模態(tài)GPT-4「海嘯」又頃刻席卷朋友圈。
「這提醒我們,對人工智能的預測是非常困難的?!筄penAI CEO Sam Altman 曾在 DALL-E 2發(fā)布后講過這樣一句話。事實證明他是對的。基于符號主義的專家系統(tǒng)的衰落,讓人們一度認為人工智能已走到盡頭,2012年的深度學習又點燃了希望,如今它已統(tǒng)領(lǐng)AI領(lǐng)域。隨著系統(tǒng)規(guī)模越來越大,訓練時間和資金成本也在不斷膨脹。就在大家擔心向模型添加參數(shù)正達到邊際效益遞減時,GPT-3、GPT-4 相繼昭告世人,更大規(guī)模、更加復雜的深度學習系統(tǒng)確實可以釋放更為驚人的能力,而ChatGPT的誕生,更是讓人看到了「顛覆性」的應用成果(假消息甚至稱GPT4參數(shù)量100萬億)。
ChatGPT 的出現(xiàn)或許表明,在過去幾年被逐漸認為到達產(chǎn)業(yè)化瓶頸的AI行業(yè)仍是一片最具創(chuàng)新性的沃土,蘊含著巨大的機會。而隨著新生產(chǎn)力初顯雛形,以工業(yè)制造為代表的行業(yè)或許將迎來更深入的AI變革,迎來屬于產(chǎn)業(yè)的“ChatGPT時刻”,在這一過程中與技術(shù)趨勢契合的科技企業(yè)也有望率先出圈。
一、通用性的勝利
迄今為止,主導 AI 領(lǐng)域的模型仍然是面向特定任務的。AI企業(yè)開發(fā)的模型在特定范圍內(nèi)有不錯的表現(xiàn),但工程師們發(fā)現(xiàn)其泛化能力不足以支持部署到更廣泛場景。用業(yè)內(nèi)人士的話說,已經(jīng)訓練了很多模型,但仍然需要茫茫多的模型。
這一瓶頸在高度碎片化工業(yè)制造領(lǐng)域幾乎被 N 倍放大。因為工業(yè)制造中細分領(lǐng)域眾多,各領(lǐng)域在生產(chǎn)流程、工藝、生產(chǎn)線配置、原材料及產(chǎn)品類型上均具有較大差異性。鋰電池生產(chǎn)可分為十幾道工序,工藝點數(shù)以千計,一條產(chǎn)線至少有2500個關(guān)鍵的質(zhì)量控制點;液晶面板生產(chǎn)涉及上百道工序,生產(chǎn)過程中可能出現(xiàn)的面板缺陷種類多達120種;手機有幾百種零件,涉及幾百個供應商,每個零件可能有幾十種缺陷要做檢測。
現(xiàn)有的深度學習模型泛化程度低,即使在同一行業(yè),模型的可復用比例也比較低。比如,如果要服務一家全球領(lǐng)先的手機品牌的整個智能產(chǎn)線,可能需要打造幾十萬個算法模型(不包括后續(xù)軟硬件的迭代升級)。
現(xiàn)在,這個棘手的問題成了ChatGPT背后所代表的基礎(chǔ)模型(大模型)的典型場景。
在2022年,一篇來自谷歌、斯坦福大學、北卡羅來納大學教堂山分校以及 DeepMind 等機構(gòu)的研究論文[1],介紹了大模型的「Emergent Ability(涌現(xiàn)能力)」,即有些現(xiàn)象不存在于較小的模型中但存在于較大的模型中,他們認為模型的這種能力是涌現(xiàn)的。雖然這種能力目前主要體現(xiàn)在語言模型上,但它也激發(fā)了在視覺模型、多模態(tài)模型上未來的研究。
根據(jù)斯坦福大學以人為本人工智能中心(HAI)基礎(chǔ)模型研究中心(CRFM)的說法,「它(大模型)代表著構(gòu)建 AI 系統(tǒng)的一種新的成功范式,在大量數(shù)據(jù)上訓練一個模型,并使其適應多種應用」[2]。
這種通用能力正是工業(yè)制造所需要的。工業(yè)制造面對的場景五花八門,如何通過穩(wěn)定的技術(shù)體系,在高度碎片化的需求中打造通用的技術(shù)能力,成為任何一家試圖在此大展身手的科技企業(yè)的最大挑戰(zhàn)。
思謀科技創(chuàng)始人賈佳亞在公司成立之初曾提到 AI 2.0概念,其與在當下廣泛采用AI 1.0的AI 公司有所區(qū)別的一個核心要點,就是對通用性的強調(diào)?!肝覀兿胱鲂乱淮?AI 體系架構(gòu),把以前別人在單個場景做的事情,用統(tǒng)一的架構(gòu)去解決它,在不同場景里做到通用」,賈佳亞說,「從底層構(gòu)建更智能的算法,用標準化的手段解決分散的工業(yè)場景,克服可復制性和標準性等關(guān)鍵性問題。」
思謀科技最受歡迎的產(chǎn)品 SMore ViMo 工業(yè)平臺,就是通用性設(shè)計思維的典型例子,它是針對工業(yè)場景打造的首個跨行業(yè)中樞平臺,具有多場景通用性。不僅滿足新能源、半導體、汽車、消費電子等多個行業(yè)領(lǐng)域超過1000種細分應用場景需求,還靈活支持多種高難度工業(yè)視覺方案設(shè)計需求,比如產(chǎn)線的物料追蹤、缺陷定位、工件計數(shù)、外觀瑕疵檢測等等。
這條路的重要特點是比較好地平衡了敏捷、個性化與低邊際成本。借助 SMore ViMo平臺,思謀科技已經(jīng)可以同時支撐工業(yè)中不同行業(yè)的上百個項目,未來還有望再擴大十倍,同時支撐上千個項目,為AI的行業(yè)應用帶來效率上的突破。
在率先于大規(guī)模工業(yè)場景使用Transformer技術(shù),極大提高智能制造效率之后,思謀也再次第一時間擁抱大模型。思謀團隊是最早對大模型在工業(yè)領(lǐng)域的Emergent Ability開展研究和產(chǎn)業(yè)化的團隊,其工業(yè)大模型利用少量缺陷樣本進行in-context learning,從而使基礎(chǔ)模型快速適應特定工業(yè)場景,并完成特定任務。
在一些業(yè)內(nèi)人士看來,ChatGPT 及其背后更加具有通用性的技術(shù)的成功,將推動AI應用進入一個新的階段。在以工業(yè)制造為代表的各行各業(yè)中,過去扎根產(chǎn)業(yè),擁抱這一趨勢,完成數(shù)據(jù)與技術(shù)落地閉環(huán)的企業(yè)擁有更多優(yōu)勢,在未來應用大爆發(fā)的過程中亦會更受到青睞。
二、加速AI普惠
在工業(yè)制造領(lǐng)域,不同“語言”之間也有著深刻隔閡。有業(yè)內(nèi)人士表示,工業(yè)制造產(chǎn)業(yè)積累了很多數(shù)據(jù),但制造業(yè)的工程師(比如機械工程師、材料工程師)還是很少去寫程序來把這些數(shù)據(jù)利用起來,而AI開發(fā)者也面臨理解產(chǎn)業(yè)問題的挑戰(zhàn),這在很大程度上約束了技術(shù)的落地。
思謀科技的算法工程師表示,ChatGPT背后的技術(shù),如RLHF(Reinforcement Learning from Human Feedback,基于人類反饋的強化學習),讓他們看到可以在現(xiàn)有的工作上更進一步。
RLHF 是強化學習的一個擴展,它將人類的反饋納入訓練大模型的過程,為機器提供了一種自然的、人性化的互動學習過程,就像人類從另一個專業(yè)人士身上學習專業(yè)知識的方式一樣。通過在AI和人類之間架起一座橋梁,RLHF讓AI快速掌握了人類經(jīng)驗。
他們表示,工業(yè) AI 未來可以孕育出一個主動學習AIaaS(AI As a Service,人工智能即服務)平臺,通過算法工程師和標注專家的配合,利用RLHF技術(shù)訓練大模型,用人類知識讓AI理解工業(yè)問題,并滿足特定工業(yè)任務的要求,讓不會編程的工業(yè)專家也能訓練AI模型。
目前,思謀科技已經(jīng)在探索RLHF和工業(yè)結(jié)合的應用場景。
此外,ChatGPT 這種簡單的交互模式與工業(yè)制造中落地AI的策略亦十分相似。工業(yè)領(lǐng)域場景復雜,好的產(chǎn)品一定是簡單易用的,比如通過簡明的交互,一鍵化部署方案,減少交付過程中的培訓成本與學習負擔。
許多程序員表示,ChatGPT相當于重新構(gòu)建了一座宏偉的巴別塔,與計算機的交流,不再是程序員的專利,它已經(jīng)可以理解部分需求,并生產(chǎn)簡單的代碼方案。但現(xiàn)在,我們可以預見在不久的將來,制造領(lǐng)域的從業(yè)者也可以在AI平臺上實現(xiàn)自行編程,根據(jù)產(chǎn)線需求開發(fā)模型。這樣也能幫助解決制造業(yè)AI人才短缺的問題。
「只有當計算機系統(tǒng)可以突破工業(yè)落地中的幾大難題,實現(xiàn)自動算法組合和部署,人類僅需參與少量定制化算法設(shè)計時,AI 的跨領(lǐng)域規(guī)模產(chǎn)業(yè)化才具備實現(xiàn)的可能。」賈佳亞曾表示。
事實上,思謀科技很早開始便構(gòu)想打造一個可實現(xiàn)技術(shù)快速迭代的開發(fā)平臺,只需把圖片上傳,即可自動標注缺陷,一鍵測試得到產(chǎn)品級的模型或SDK,減少項目中大量投入的算法成本。
隨著項目的迭代,思謀科技逐漸把更加成熟的行業(yè)方案和實用經(jīng)驗整合到產(chǎn)品中,繼而推出了完整的產(chǎn)品類型,讓客戶無需在思謀科技員工的幫助下即可自行體驗與使用,從而形成了產(chǎn)品最早的商業(yè)化應用。
隨著技術(shù)的進步,無論是面向消費者,還是面向工業(yè)制造這樣的產(chǎn)業(yè),我們已經(jīng)看到了更普惠技術(shù)應用,正在帶來巨大的機遇。
三、ChatGPT只是一個起點
十年以來,AI技術(shù)的商業(yè)化受到了諸多質(zhì)疑。這一次,ChatGPT背后所代表的技術(shù)突破,預示著一場革命的到來,AI 有可能真的成為普世的生產(chǎn)力基礎(chǔ)設(shè)施。
「GPT(generative pre-trained transformer)也完全可以是 general - purpose technology (通用技術(shù))的縮寫」,《經(jīng)濟學人》的一篇文章中寫到,「一種翻天覆地的創(chuàng)新,可以像蒸汽機、電力和計算機那樣提升各行各業(yè)的生產(chǎn)率」[3]。
始于20世紀80年代的個人電腦革命,到90年代末開始真正提升生產(chǎn)力,因為這些機器變得更便宜、更強大,還能連接到互聯(lián)網(wǎng)。深度學習的轉(zhuǎn)折發(fā)生在2012年,彼時AlexNet神經(jīng)網(wǎng)絡(luò)在ImageNet比賽中獲得冠軍,至此大量研究開始鋪開,激發(fā)人們將其應用于各個領(lǐng)域。十多年的時間,深度學習技術(shù)正在跨越大規(guī)模賦能產(chǎn)業(yè)的門檻。
回顧工業(yè)制造智能化的發(fā)展歷程,技術(shù)能力和算法無法滿足實際應用需求、解決方案復制性較差難以落地、新技術(shù)公司與制造業(yè)企業(yè)溝通成本高等挑戰(zhàn)一直存在。而目前基礎(chǔ)模型(大模型)表現(xiàn)出多領(lǐng)域多任務的通用化能力,正在打破這些行業(yè)「壁壘」,并用低成本、普惠的方式,「席卷」容錯率極低、成本敏感的產(chǎn)業(yè)應用。
用AI解決產(chǎn)業(yè)問題蘊含著機會,ChatGPT是一個起點,隨著一些扎根產(chǎn)業(yè)的技術(shù)公司的持續(xù)深耕,越來越多的行業(yè)正在迎來AI應用的“ChatGPT時刻”。
[1] Wei, Jason, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama et al. "Emergent abilities of large language models." arXiv preprint arXiv:2206.07682 (2022).
[2] https://crfm.stanford.edu/
[3] https://www.businessreview.global/zh-CN/latest/63e5d63ef5aab0516567873c
同類文章排行
- 萬馬高分子助力,國內(nèi)首條公里級大長度環(huán)保
- 主營產(chǎn)品有哪些?
- 購買后產(chǎn)品發(fā)什么快遞?
- 機器手臂的創(chuàng)新應用:輕薄短小、智能高效
- 產(chǎn)品供貨周期需要多久?
- 更緊湊而高效的機器人世界
- 節(jié)能轉(zhuǎn)型,電機產(chǎn)業(yè)鏈有哪些變革性機會?
- 當半導體碰上 AMR,來一場智能化的精彩
- 堅持科技是第一生產(chǎn)力
- 通向智能工廠的硬核技術(shù),哪些和你有關(guān)?
最新資訊文章
- 英孚康是羅克韋爾的替代品?不止如此
- 歐洲航天局利用MVG設(shè)備大幅增強新型 H
- Profinet轉(zhuǎn)canopen網(wǎng)關(guān)連接
- DATALOGIC得利捷 | 物流之眼利
- 施耐德電氣與標領(lǐng)智能裝備強強聯(lián)合,共創(chuàng)電
- 【有現(xiàn)貨】KB-LS10N-C KB-L
- 華北工控打造網(wǎng)安專用主板,基于飛騰D20
- PLC通訊革新:EtherNetIP轉(zhuǎn)P
- 華北工控ATX-6152:高度集成化!提
- 巴斯夫成功完成Ethernet-APL試
- HRPG-1000N3 系列:1000W
- RQB60W12 系列:60W 1/4
- NPB-450-NFC 系列:450W
- VFD 系列:150W~750W 工業(yè)用
- NGE12/18 系列:12W/18W
- 工業(yè)現(xiàn)場ModbusTCP轉(zhuǎn)EtherN
- DJM / FT系列:12V/38~15
- SI06W8/DI06W8 系列:超寬壓
- NGE100 (U) 系列:100W 環(huán)
- LOP-200/300系列:200W &