導(dǎo)讀:北京2023年7月4日 -- 就在前段時間,繼ChatGPT迎來「iPhone時刻」之后,OpenAI又計劃推出LLM版的App Store。簡單來講,OpenAI打造獨屬的「大模型應(yīng)用商店」,就是要把市面上的大模型拉進(jìn)一個雙向?qū)拥钠脚_。這樣,開發(fā)者根據(jù)特殊用途,去出售基于ChatGPT定制的AI模型。而企業(yè)也能夠根據(jù)自身需求快速找到適配的LLM。
北京2023年7月4日 -- 就在前段時間,繼ChatGPT迎來「iPhone時刻」之后,OpenAI又計劃推出LLM版的App Store。簡單來講,OpenAI打造獨屬的「大模型應(yīng)用商店」,就是要把市面上的大模型拉進(jìn)一個雙向?qū)拥钠脚_。這樣,開發(fā)者根據(jù)特殊用途,去出售基于ChatGPT定制的AI模型。而企業(yè)也能夠根據(jù)自身需求快速找到適配的LLM。
OpenAI此舉,意味著生態(tài)系統(tǒng)將實現(xiàn)融合,大家能夠更容易去獲取使用各種應(yīng)用,無需重復(fù)「造輪子」。
無獨有偶,國內(nèi)的浪潮信息在走這樣的生態(tài)開放之路。更有趣的是,浪潮信息打造了AIStore,作為元腦生態(tài)的內(nèi)容承載平臺。LLM爆火之后,OpenAI也順勢打造了APPstore。
元腦AIStore,智算時代的「App Store」
浪潮信息的生態(tài)開放之路是怎么走的?其中一個生動的例子,就是它打造的元腦AIStore平臺。在這里,「左手伙伴」負(fù)責(zé)提供場景化應(yīng)用以及服務(wù);當(dāng)「右手伙伴」有業(yè)務(wù)創(chuàng)新需求時,就可以在平臺上根據(jù)提供的信息尋找合作。同時,「右手伙伴」也可以在平臺上發(fā)布自己的需求,由左手伙伴承接,然后提供定制服務(wù)。而作為「平臺」的AIStore,就是把二者連接起來,依托算力、算法、資源平臺等全棧化的生態(tài)優(yōu)勢,助力伙伴雙方實現(xiàn)技術(shù)和商業(yè)的雙融合,助力大家進(jìn)行更高效的合作與營銷。
如果說,小紅書是C端的種草內(nèi)容生態(tài),AIStore平臺可以理解成是B端應(yīng)用的線上社區(qū)化商城。
元腦生態(tài)致力于牽手伙伴輸出技術(shù)領(lǐng)先、落地性強的聯(lián)合方案,不斷提升方案的可服務(wù)性、開放性和易購性,滿足客戶需求的同時,助力伙伴獲取更多商機(jī)。這個過程中,體現(xiàn)的是連接、信任、合作,是這種合作模式的價值認(rèn)同。也正是在這樣的實踐探索中,浪潮信息的生態(tài)伙伴數(shù)量在不斷增加,據(jù)了解,截止至2022年底,浪潮信息的生態(tài)伙伴數(shù)量已達(dá)20000余家。
如今,在元腦AlStore平臺上,我們已經(jīng)可以看到很多面向不同AI業(yè)務(wù)場景的解決方案,其中有不少是兩家以上合作伙伴聯(lián)合開發(fā)的。此外,為了方便客戶獲得更直觀的體驗,浪潮信息還在元腦AIStore平臺加入了部分解決方案的demo。比如打開「合合信息OCR」,就可以一鍵試用各種票據(jù)和證件的識別。
據(jù)介紹,目前元腦AlStore已經(jīng)入駐了超過1200家伙伴,上線產(chǎn)品和解決方案超過150個,有幾十家伙伴的產(chǎn)品方案通過了元腦認(rèn)證。
其實早在2019年,浪潮信息便提出了智算時代之下的生態(tài)新范式——元腦生態(tài)。元腦AIStore正是元腦生態(tài)的內(nèi)容承載平臺,不僅如此,AIStore還是合作伙伴的營銷平臺。而2022年底生成式AI爆火后產(chǎn)生的產(chǎn)業(yè)需求,更是驗證了這一路線的前瞻性。
技術(shù)落地,建立開放產(chǎn)業(yè)生態(tài)環(huán)境
ChatGPT引爆技術(shù)革新,徹底帶火了生成式AI等新一代技術(shù)的突破。如何將技術(shù)和場景融合,賦能產(chǎn)業(yè),已經(jīng)成為新一輪時代科技革命的一個重點。那么在這樣大背景之下, 生態(tài)又將如何重構(gòu)?「變」與「不變」的革新又在于何處?這是新型產(chǎn)業(yè)化落地最后一公里面臨的困境。
我們看到,大型語言模型的發(fā)展越來越成熟,如何實現(xiàn)轉(zhuǎn)化,才是展現(xiàn)大模型真正實力的關(guān)鍵一環(huán)。技術(shù)與產(chǎn)業(yè)的關(guān)系猶如毛與皮的關(guān)系,有「皮」的存在,「毛」才有存在的可能和價值?!钙ぁ故钱a(chǎn)業(yè),更是市場需求,技術(shù)通過真正地賦能場景,解決市場需求,才能夠持續(xù)獲得收益而發(fā)展。對于一些特定場景,如果沒有定制化的適配,就無法100%發(fā)揮技術(shù)的價值。或者說,若沒有多配套的產(chǎn)線支撐與需求市場,做出的技術(shù)也將偏離產(chǎn)業(yè)化初衷。而OpenAI計劃打造的LLM「應(yīng)用商店」,正是要推動技術(shù)賦能場景的一個新生態(tài)的形成。
比如,教育APP制造商Khan Academy(可汗學(xué)院),就是在ChatGPT的基礎(chǔ)上,開發(fā)了個性化AI導(dǎo)師Khanmigo。而另一家企業(yè)AI平臺Aquant,則利用獨有數(shù)據(jù)微調(diào)了ChatGPT大模型,打造了聊天機(jī)器人應(yīng)用Service Copilot。開發(fā)的產(chǎn)品能夠智能回復(fù)客戶有關(guān)設(shè)備維護(hù)、維修等方面的問題。
由此可見,面向未來產(chǎn)業(yè)的發(fā)展,生態(tài)亟需應(yīng)勢而變,在變局中以「競爭、合作、開放」的姿態(tài)變革重構(gòu)。這樣做的優(yōu)勢在于:首先,從場景實踐中提升技術(shù)的創(chuàng)新能力。技術(shù)推動產(chǎn)業(yè)發(fā)展,進(jìn)而反哺技術(shù)創(chuàng)新。通過跨界融合,能夠促進(jìn)數(shù)據(jù)、技術(shù)、知識等業(yè)務(wù)共享和協(xié)同,由此再推動不同領(lǐng)域的創(chuàng)新。用「開放共贏」的姿態(tài)提升個體伙伴的競爭力,以此提升整體產(chǎn)業(yè)的效率與競爭力。其次,優(yōu)化產(chǎn)業(yè)布局,發(fā)揮生態(tài)內(nèi)的單一環(huán)節(jié)的競爭優(yōu)勢。未來的產(chǎn)業(yè)生態(tài),需要根據(jù)不同環(huán)節(jié)的發(fā)展特點和優(yōu)勢,將單一伙伴的價值最大化,實現(xiàn)產(chǎn)業(yè)優(yōu)化升級和可持續(xù)發(fā)展力。
浪潮信息的元腦生態(tài),從2019年開始,一直就走在這種合作新范式的路上。即用技術(shù)賦能場景,用「智算」聚生態(tài)之力,建立場景共同體,打通產(chǎn)業(yè)AI落地的最后一公里。
元腦生態(tài),智算時代的生態(tài)新范式
元腦生態(tài),正是要開啟一個新時代的生態(tài)范式?,F(xiàn)在,浪潮信息打造的元腦生態(tài)中,已經(jīng)有了500余個左手伙伴,4500余個右手伙伴。他們始終倡導(dǎo)所踐行的「聚合產(chǎn)業(yè)力量」,便是指具備AI開發(fā)核心能力的「左手伙伴」和具備行業(yè)AI整體方案交付能力的「右手伙伴」。
簡言之,元腦生態(tài)不獨屬于某一個企業(yè),而是左手伙伴+右手伙伴+浪潮信息的三元素結(jié)合,是熱帶雨林式的合作范式,從而實現(xiàn)優(yōu)勢互補、各取所需、合作共贏的局面。也就是說,元腦生態(tài)將成為一片肥沃的土壤,促進(jìn)AI行業(yè)融合和落地發(fā)展。這一生態(tài)構(gòu)建,已在具體實踐中取得了卓越成效。
聚生態(tài)之力,用AI賦能場景落地最后一公里
在金融行業(yè)中,許多業(yè)務(wù)已實現(xiàn)了數(shù)字化轉(zhuǎn)型,并實現(xiàn)效率提升。不得不承認(rèn)的是,目前仍存在一些無法用AI亟待解決的問題。比如,在票據(jù)處理方面,許多銀行還依舊采用人工錄入的方式,不僅耗時且成本高昂,柳州銀行便是其中一個的代表。
當(dāng)前,OCR技術(shù)的發(fā)展,已經(jīng)能夠?qū)D像文件中的字符快速識別,并轉(zhuǎn)化成文本。而且在算法的加持下,即便遇到票據(jù)背景復(fù)雜、清晰度不高、文字傾斜等情況,也能實現(xiàn)智能提取。
一直深耕智能文字識別領(lǐng)域的合合信息(左手伙伴)便是典型代表。它在智能文字識別技術(shù)上破解了傳統(tǒng)OCR應(yīng)用識別難題,推出的TextIn Studio智能文字訓(xùn)練平臺,能夠提供上百種文檔圖像處理服務(wù)。另外,與其他行業(yè)不同,「高網(wǎng)絡(luò)安全性、高數(shù)據(jù)備份要求性、高監(jiān)控和審計能力性、高應(yīng)急響應(yīng)能力」的銀行特性,讓金融行業(yè)落地的挑戰(zhàn)變得更加困難。而深耕金融隱私計算領(lǐng)域多年的可利邦(右手伙伴),能夠提供整體的IT、金融化信息的解決方案。
立于元腦生態(tài),合合信息和可利邦,能夠全面利用浪潮信息提供的AI計算平臺、AI資源平臺、AI工具平臺的能力。那么,有了這個行業(yè)AI大腦,浪潮信息的左右手伙伴在柳州銀行案例中是如何發(fā)揮所長,打造生態(tài)新范式?
在柳州銀行OCR智能平臺建設(shè)中,面臨著極為兩難的現(xiàn)實問題:一方面,銀行面臨數(shù)據(jù)繁多、場景復(fù)雜的核心瓶頸,隨著高爆發(fā)、高增長的數(shù)據(jù)量,都對模型訓(xùn)練和推理提出了更高要求。另一方面,就用戶數(shù)據(jù)安全維度考慮,定制模型的所有數(shù)據(jù)標(biāo)注、訓(xùn)練,都必須在銀行內(nèi)網(wǎng)完成。
由此,針對柳州銀行「算力資源少,場景應(yīng)用多」等實際落地的困難,合合信息攜手可利邦聯(lián)合打造了業(yè)內(nèi)領(lǐng)先的一站式智能OCR解決方案。這樣,通過生態(tài)的協(xié)同優(yōu)勢,跨越產(chǎn)業(yè)落地鴻溝,打通金融數(shù)智化轉(zhuǎn)型的最后一公里。那么,他們具體又是如何基于浪潮信息元腦生態(tài),幫助柳州銀行解決業(yè)務(wù)中的痛點?
首先,從算力方面入手。AIGC時代來臨,許多大語言模型基于海量數(shù)據(jù)集進(jìn)行訓(xùn)練和推理時,對算力提出極大需求。傳統(tǒng)銀行業(yè)務(wù)在技術(shù)側(cè)方面,對高爆發(fā)、高增長業(yè)務(wù)數(shù)據(jù)處理、以及大量定制模型訓(xùn)練提出了需求。只有底層算力系統(tǒng),足夠強大才能滿足這一極高的要求。然而,當(dāng)硬件性能已經(jīng)到頂,就需要用軟件平臺對算力實現(xiàn)更精細(xì)調(diào)度。通過優(yōu)化底層資源調(diào)度,實現(xiàn)算力最大化利用。針對柳州銀行業(yè)務(wù)流量潮汐特征,合合信息與可利邦進(jìn)行了解決方案算力調(diào)配的快速移植與優(yōu)化,從而實現(xiàn)算力資源均衡分配。具體來講,基于業(yè)務(wù)流量波峰波谷特征,進(jìn)行算力的自動彈性收縮,在保障業(yè)務(wù)不受影響的前提下,將資源利用率提升約40%。
另外,基于銀行多業(yè)務(wù)場景常規(guī)并發(fā)需求,通過算力資源的細(xì)粒度切分,實現(xiàn)一卡多用。最大化提高算力利用率,在幾乎零性能損失情況下(≈1%),將算力利用率提升至3-5倍。
其次,從算法框架來看。合合信息針對柳州銀行初始化樣本不足,缺少數(shù)據(jù)標(biāo)注、憑證板式復(fù)雜等問題,進(jìn)行了模型定制,然后針對復(fù)雜的單據(jù)、票證進(jìn)行針對性訓(xùn)練。由此,構(gòu)建了高敏強化學(xué)習(xí)訓(xùn)練機(jī)制,讓OCR票證識別精度和效率大幅提升。
這一方案,將合合信息的算法識別能力發(fā)揮至極致,實現(xiàn)了一站式覆蓋端到端AI業(yè)務(wù)。而元腦生態(tài)之下的資源平臺AIStation,則助力其實現(xiàn)了模型的一鍵部署,能夠?qū)⑷俗C核驗、圖像定損、單據(jù)識別等AI 應(yīng)用快速嵌入到銀行業(yè)務(wù)流程中。值得一提的是,整個過程中,模型訓(xùn)練時間也大幅縮短,從2天削減到4小時,部署時間也從2天縮短到5分鐘。
一站式智能OCR解決方案,能夠讓金融機(jī)構(gòu)「0門檻」開發(fā)OCR。基于幾十張票證小樣本,開發(fā)者便能完成OCR模型開發(fā),實現(xiàn)快速部署與訓(xùn)練。顯然,這可以大大加快金融機(jī)構(gòu)智能OCR應(yīng)用的開發(fā)與上線的速度。同時,最大化滿足特定場景智能OCR應(yīng)用需求。實踐證明,一站式智能OCR解決方案,將柳州銀行票證錄入效率提升百倍以上,人力資源成本節(jié)省數(shù)百萬元,實現(xiàn)業(yè)務(wù)提速。未來,這個OCR解決方案,也不僅限于柳州銀行,甚至在證券、保險等金融機(jī)構(gòu),同樣適用。除了算力、算法,在智能平臺運維方面,基于浪潮信息的AIStation平臺,通過建立穩(wěn)定的智能容錯機(jī)制,不斷強化上層應(yīng)用的業(yè)務(wù)安全保障能力。真正實現(xiàn)了為金融數(shù)智化轉(zhuǎn)型的最后一公里保駕護(hù)航。
全流程「保駕護(hù)航」:AIStation一鍵部署,高效算力平臺管理,加速技術(shù)迭代革新
可以看到,在方案的落地過程中,一套穩(wěn)健的人工智能應(yīng)用系統(tǒng)必不可少。而浪潮信息推出的智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺——AIStation,滿足的正是這個需求。具體來說,AIStation是專為人工智能開發(fā)和部署打造的端到端平臺,可以實現(xiàn)從模型開發(fā)、訓(xùn)練、部署、測試、發(fā)布、服務(wù)的全流程一站式高效交付?;谫Y源管理調(diào)度、平臺流程支持能力,它在異構(gòu)芯片、創(chuàng)新生產(chǎn)工具、行業(yè)伙伴應(yīng)用、客戶方案等不同層面,與元腦合作伙伴展開了大量適配對接認(rèn)證工作,并積累了大量經(jīng)驗、模式與方案,成為了元腦生態(tài)的重要承載平臺。
舉個例子,比如智源研究院的FlagAI一站式大模型工具,就是基于AIStation平臺進(jìn)行本地化部署的。我們都知道,大模型的訓(xùn)練,需要構(gòu)建包含計算、網(wǎng)絡(luò)、存儲、框架等在內(nèi)的系統(tǒng)性分布式訓(xùn)練環(huán)境。傳統(tǒng)的分散化管理,讓平臺的整體協(xié)同性較差,訓(xùn)練效率低。而AIStation實現(xiàn)了異構(gòu)算力集群的統(tǒng)一池化管理,通過自適應(yīng)系統(tǒng)將訓(xùn)練底層的計算、存儲、網(wǎng)絡(luò)環(huán)境自動化配置。通過多種資源高效管理和調(diào)度策略,AIStation能實現(xiàn)萬卡集群的毫秒級調(diào)度,提升整體資源利用率到70%以上。通過數(shù)據(jù)緩存機(jī)制,AIStation可以讓模型訓(xùn)練效率獲得200%-300%的提升。并且,還達(dá)到了健壯性與穩(wěn)定性這樣的大模型訓(xùn)練的強要求。根據(jù)服務(wù)資源需求的變化,AIStation可以及時調(diào)整資源配給,實現(xiàn)秒級服務(wù)擴(kuò)縮容,可支持百萬級高并發(fā)的大規(guī)模AI推理服務(wù)場景,服務(wù)響應(yīng)平均延遲低于1ms,突發(fā)的訪問高峰的響應(yīng)效率提升50%。
就在6月25日,AIStation憑借著專業(yè)的AI開發(fā)與部署能力支撐,有效降低大模型時代的大規(guī)模分布式AI算力平臺的配置與維護(hù)門檻,榮獲了2023全球人工智能產(chǎn)品應(yīng)用博覽會「產(chǎn)品金獎」。
水利萬物,普惠AIGC
從元腦生態(tài)的角度來看,浪潮信息布局產(chǎn)業(yè)AI是率先布局、并率先入局,從2019年到現(xiàn)在,短短四年間,獲得了極多合作伙伴的支持。今年AIGC才開始迸發(fā)出來,之前大家都處于探索期。在實踐中可以發(fā)現(xiàn),大家都在面臨著可落地的商業(yè)化途徑的問題,比如量化金融智能客服,大模型+數(shù)字人等等。許多客戶都有非常理想、非常美好的需求,但實現(xiàn)起來并不那么容易。
有的客戶是有數(shù)據(jù)、有資源,他們的訴求是希望基于自己的數(shù)據(jù)進(jìn)行挖掘,從而讓它變得更智能;有的客戶是有場景,希望能讓場景變成更智能化的體驗;有的是中間的集成方軟件服務(wù)商,希望被賦能。這就對生態(tài)提出了全方位的考驗。相對來說,元腦生態(tài)不是中心化的生態(tài),不強調(diào)誰依附于誰,更開放。不同企業(yè)的產(chǎn)品落地,所面臨的鴻溝,以及面臨的困境,是完全不同的。在快速迭代的時代背景下,生態(tài)需要去融合、去重塑。這也正是元腦生態(tài)中所謂「水利萬物」的要義。
而出乎意料的是,元腦生態(tài)真正上線之后,許多客戶都表現(xiàn)出了意想不到的熱情。這是因為,在此期間,客戶發(fā)現(xiàn)了浪潮信息具有的獨特優(yōu)勢——
1. 圍繞大模型提供的算力算法,具有一個全棧的基礎(chǔ)設(shè)施方案服務(wù)能力。尤其是在超大規(guī)模的算力集群中,可以圍繞遷移參數(shù)的算法進(jìn)行調(diào)優(yōu)優(yōu)化。浪潮信息作為基礎(chǔ)設(shè)施廠商,在這方面有得天獨厚的優(yōu)勢。有算力,但更懂如何去用好算力。猶如足球比賽中的教練,賽前根據(jù)「對手」情況部署戰(zhàn)術(shù)安排,臨場根據(jù)比賽進(jìn)程實時進(jìn)行人員和位置調(diào)整。此外,還要善于激發(fā)每名球員的潛能。
2. 作為多元化的算力平臺,浪潮信息信息提供的是更開放、更多元的平臺。既能支持目前國際領(lǐng)先的GPU,也能率先支持?jǐn)?shù)十種國產(chǎn)算力。不管是圍繞大模型的超大集群訓(xùn)練場景,還是針對于特定的AI推理場景,都有更多元化的算力產(chǎn)品和適配能力。
3. 通過元腦生態(tài),打造AIGC時代的生態(tài)鏈。不論是浪潮信息自身推廣的算力算法服務(wù),還是圍繞更多的合作伙伴,基于這種生態(tài)把伙伴的能力開放共享給更多的終端客戶。在這個過程中,或許有人是鎖,有人是鑰匙,一旦鎖找到了鑰匙,就是迸發(fā)中心的商業(yè)模型。To B領(lǐng)域的業(yè)務(wù)正在AIGC的時代被逐個重塑。也許新的商機(jī)就在不遠(yuǎn)處。
面對如雨后春筍般的大模型,我們是否真的已經(jīng)準(zhǔn)備好了掘金AIGC?除了面對技術(shù)的挑戰(zhàn)之外,在技術(shù)與產(chǎn)業(yè)的這臺天平上,通過生態(tài)形成協(xié)同優(yōu)勢的重要性,也漸漸顯露了出來。聚生態(tài)之力,普惠AIGC,讓AIGC真的成為像「水一樣的利萬物」,是當(dāng)下最好的答案。而這,也是浪潮信息元腦生態(tài)始終在踐行的。