ChatGpt掀起了國內通用人工智能的技術浪潮。繼百度、阿里、華為、360之后,又一家大廠推出GPT大模型產品。
4月10日,商湯科技在技術交流日活動上發布了大模型體系“商湯日日新大模型”,推出自然語言處理、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力。
在參數方面,商湯科技的大模型是基于千億級參數的基礎大模型,商湯人工智能計算中心能支持20個千億參數超大模型同時訓練。而這背后也體現了商湯科技在“算力”上的優勢,商湯科技的AI大裝置SenseCore上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,據商湯科技董事長兼首席執行官徐立透露,其是亞洲目前最大的智能計算平臺之一。
(資料圖片僅供參考)
對此,北京社會科學院研究員王鵬對《華夏時報》記者表示:“商湯科技入局大模型有其自身優勢。它是國內AI四小龍之一,有相關的技術儲備,在算力算法、芯片方面有深耕。”
實際上,由于ChatGPT的火爆,國內外不少大廠也開始紛紛關注大模型。過去一個月,大模型密集發布,一直是市場的焦點。
“大模型會對傳統生產模式會產生顛覆式的影響,能夠更好地實現降本增效,促進經濟社會高質量發展。實際上,大模型密集發布的情況下反而不容易出現壟斷,另外,在充分競爭下才能提升品質,才能更好地實現商業化落地應用。”王鵬表示。
基于“大裝置”+“大算力”
“‘茍日新、日日新、又日新’,這句話出自《禮記·大學》中湯之《盤銘》,也是商湯‘日日新SenseNova’大模型體系的取名由來,這寓意商湯在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。”徐立在活動上如此介紹大模型名字的由來。
“日日新很像是一個超市,寓意也不錯,商湯將提供一個大模型的超市。”徐立表示。
對于“日日新”大模型的特點,商湯科技方面對《華夏時報》記者表示,一是該模型具有更好的通用性,二是開放生態合作,生態合作伙伴可以在該模型上做各種微調,得到各種風格不同的模型。未來,我們也希望能依靠社區的力量把目前的模型進行調教,從而更好地往前推進。
在活動現場,商湯科技展示了“日日新”模型賦能的多款自研產品,包括千億參數中文語言大模型“商量SenseChat”、文生圖創作平臺“秒畫SenseMirage”、AI數字人視頻生成平臺“如影SenseAvatar”、3D內容生成平臺“瓊宇SenseSpace”和“格物SenseThings”。
作為千億級參數的自然語言處理模型,“商量SenseChat”在活動上展示了出色的多輪對話和超長文本的理解能力,展示了其在編程、醫療等場景的應用。
據了解,在內部實測中,AI代碼助手可以讓代碼編寫效率提升62%,HumanEval測試集一次通過率40.2%。
在醫療場景,“我們也將進一步推動在新華醫院、瑞金醫院、華西醫院等醫院的在輔助診療、隨訪、健康咨詢等方面業務的上線。”徐立透露。
此外,商湯還演示了AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等AIGC(人工智能內容生成)大模型及應用。
“秒畫SenseMirage”是商湯科技自研的文生圖創作平臺。在活動現場,商湯科技演示了通過關鍵詞描述迅速生成圖片的能力,同時還可根據自身需求訓練生成模型。
在視頻生成方面,“如影SenseAvatar”是2D數字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數字人分身。它可應用為智能直播、教學、短視頻等多種場景。
值得注意的是,徐立在現場提到,“如影”的名字是由其“商量”自然語言處理模型提出的,“商量”表示,“如影隨形”是指一個東西與另一個東西伴生,因此很符合數字人的寓意。
而“瓊宇SenseSpace”和“格物SenseThings”則是3D內容生成平臺,可以高效低成本生成大規模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想象空間。在活動現場,商湯科技展示了其在空間創意中的應用。
值得注意的是,參數量、處理數據量是衡量大模型能力的主要因素,而這也對算力提出了極大的要求。
在參數方面,這些大模型是基于千億級參數的基礎大模型,其中“商量”為1800億參數,商湯人工智能計算中心能支持20個千億參數超大模型同時訓練。
而這背后體現了商湯科技在“算力”上的優勢。商湯科技的AI大裝置SenseCore上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,據徐立透露,其是亞洲目前最大的智能計算平臺之一。
在活動上,徐立也透露道,2023年商湯科技目標是訓練萬億級參數大模型。
在數據方面,商湯科技發布了最大的用于真實感知、重建和生成的多模態數據集,含190個類別6000個物體,均為全視角高清圖片,每個物體包括5條環繞視頻,支持神經渲染、表面重建、3D生成、點云識別等。
在商業變現方面,商湯科技方面對本報記者表示:“對于人工智能大模型,商業和技術并非脫節。我們會把整套的產品體系和技術體系往大模型去做支撐和傾斜,但我們也會在原有的各類的產品里面,按照用戶或客戶的需求,分層地提供適應于他們的應用場景的產品和服務。”
“從最底層來說,AI原生的基礎設施層會提供AI專用的算力存儲網絡的服務,在平臺層會提供自定義的,比如大模型的訓練、推理、數據管理。包括API Serving各種各樣的業務,在SaaS層我們也會提供基于人工智能大模型的各類的API.”商湯科技方面表示。
AIGC產業前景廣闊
據了解,如今,火爆全網的AI聊天大模型應用ChatGPT訪問量已飆升至8.89億次,它也是歷史上最快達到1億月活的應用。其浪潮很快蔓延到業內,國內外不少大廠開始關注大模型。
國內本輪大模型發布中首當其沖的是百度的“文心一言”,隨后不少大廠前后入局,360發布“360智腦”大模型,阿里發布“通義千問”大模型,騰訊發布“混元”大模型、華為發布“盤古”大模型。
“實際上,各家平臺各有特色和優勢,無法論其誰更好。百度最大的優勢是有大量的數據,淘寶最大的優勢是金融類數據,商湯的優勢則在語言處理、文本處理方面。”王鵬認為。
“大模型會對傳統生產模式會產生顛覆式的影響,能夠更好地實現降本增效,促進經濟社會高質量發展。實際上,大模型密集發布的情況下反而不容易出現壟斷,另外,在充分競爭下才能提升品質,才能更好地實現商業化落地應用”王鵬表示。
同時,在平安證券近期發布的研報中也提到,當前,我國大模型技術發展方興未艾,AIGC產業未來發展前景廣闊。算法方面,預計今年國內龍頭AI廠商將持續推出更多大模型產品;應用場景方面,預計國內將有辦公、教育、醫療、金融等越來越多的行業探索大模型產品的應用;算力是短板,由于供應鏈的問題,我國高端訓練芯片供給可能面對較大的壓力,AI算力不足的問題可能顯現,相關設備研發和基礎設施建設企業可能繼續受益。同時,AIGC新技術也會帶來新的安全挑戰,國產安全廠商也將受益。
此外,4月11日,國家互聯網辦公室就《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見。這也預示著,AI產業的發展路徑更清晰,有望沿著更標準化、規范化的軌道發展。
(文章來源:華夏時報)
標簽: