導讀:2024年開春之際,AI圈熱度再次升溫,迎來顛覆性進展。
2022年底,ChatGPT橫空出世,掀起新一輪AI浪潮。
2023年,AI大模型風起云涌,全球范圍內(nèi)各大巨頭在AI領域動作頻頻,各類AI大模型層出不窮。
2024年開春之際,AI圈熱度再次升溫,迎來顛覆性進展。
2月16日,谷歌宣布推出全新的Gemini1.5 AI模型,這是迄今為止谷歌的最大模型。據(jù)了解,Gemini 1.5建立在谷歌基礎模型開發(fā)和基礎設施的研究與工程創(chuàng)新的基礎上,包括通過新的專家混合(MoE)架構(gòu)使Gemini 1.5的訓練和服務更加高效,并且可以處理128000個token的標準情境窗口。
無獨有偶。同一天里,OpenAI擲下一顆“深水炸彈”,毫無預兆地發(fā)布了文生視頻大模型Sora,并迅速成為了討論的焦點,引起業(yè)內(nèi)廣泛關注。
根據(jù)OpenAI官網(wǎng),Sora完美繼承了DALL·E3的畫質(zhì)和遵循指令能力,能夠根據(jù)用戶的一句話直接生成長達1分鐘的高質(zhì)量視頻,包含了高度細致的背景、復雜的多角度鏡頭,以及情感豐富的多個角色。OpenAI表示,他們正在教授AI理解和模擬運動中的物理世界,旨在幫助解決現(xiàn)實世界交互問題。
一位時髦的女士漫步在充滿霓虹燈光的東京街頭上;圖源:OpenAI官網(wǎng)
當前,OpenAI官網(wǎng)上已經(jīng)更新了48個視頻demo。在這些視頻demo中,Sora不僅能準確呈現(xiàn)細節(jié),還能理解物體在物理世界中的存在,并生成具有豐富情感的角色。而且該模型還可以根據(jù)提示、靜止圖像甚至填補現(xiàn)有視頻中的缺失幀來生成視頻。
不過,OpenAI也承認,Sora這個模型不是完美的,其仍存在一些局限性,在某些細節(jié)生成上還存在問題,比如復雜物理場景中的錯誤物體等。但Sora所展示出的強大的文生視頻能力,已足以讓影視行業(yè)感受到了前所未有的沖擊。
與此同時,自ChatGPT掀起全球浪潮以來,國內(nèi)AI大模型公司也迎來了迄今獲得的單輪最大金額融資。
據(jù)悉,AI創(chuàng)業(yè)公司“月之暗面”近期完成了新一輪超10億美元融資,投資方包括阿里巴巴、美團、小紅書和紅杉中國等。本輪融資后,月之暗面估值已達約25億美金,為國內(nèi)大模型領域的頭部企業(yè)之一。
公開資料顯示,月之暗面成立于2023年3月,致力于尋求將能源轉(zhuǎn)化為智能的最優(yōu)解,通過產(chǎn)品與用戶共創(chuàng)智能。公司創(chuàng)始團隊核心成員曾參與了Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發(fā),多項核心技術(shù)被Google PaLM、Meta LLaMa、Stable Diffusion等主流產(chǎn)品采用。
2023年10月,月之暗面正式推出了首個支持輸入20萬漢字的智能助手產(chǎn)品“Kimi Chat”,主打無損記憶,在“長文本”領域上實現(xiàn)了突破,而這也是月之暗面做To C超級應用的第一次嘗試。
龍年伊始之際,AI領域利好不斷,AI大模型迎來新進展并且正在加速落地。2024年,伴隨著技術(shù)的不斷革新發(fā)展,我們期待AI賽道帶來更多的驚喜,看到更多無限的可能。
欲了解更多行業(yè)動態(tài)以及行業(yè)最新、最前沿的產(chǎn)品、技術(shù)與解決方案,歡迎掃碼報名4月24-26日IOTE2024國際物聯(lián)網(wǎng)展·上海站。
掃碼報名參會