RTE2024 AI 專(zhuān)場(chǎng):從大模型廠商到B/C端的應(yīng)用 生成式AI的新質(zhì)生產(chǎn)力
生成式AI的大模端的高速發(fā)展,不僅持續(xù)驅(qū)動(dòng)著大模型本身的型廠新質(zhì)變革,更為各行各業(yè)創(chuàng)造了無(wú)數(shù)令人激動(dòng)和無(wú)限想象的商到生成式A生產(chǎn)空間。
在生成式 AI 的應(yīng)用驅(qū)動(dòng)下,實(shí)時(shí)互動(dòng)體驗(yàn)正在邁向一個(gè)全新的大模端的高度。
企業(yè)新的型廠新質(zhì)競(jìng)爭(zhēng)力=基座模型+組織+數(shù)據(jù)資產(chǎn)+業(yè)務(wù)場(chǎng)景。
AI 社交將成為社交新方式的商到生成式A生產(chǎn)補(bǔ)充。
IM產(chǎn)品有望借助大模型的應(yīng)用能力,滿(mǎn)足用戶(hù)對(duì)社交產(chǎn)品的大模端的期望......
從情緒價(jià)值到新質(zhì)生產(chǎn)力、從社交新方式到社交新構(gòu)想。型廠新質(zhì)一場(chǎng)圍繞 AI 自身進(jìn)化與賦能的商到生成式A生產(chǎn) RTE2024 AI 專(zhuān)場(chǎng)10月25日在北京成功舉辦。聲網(wǎng) AI RTE 產(chǎn)品線負(fù)責(zé)人姚光華、應(yīng)用阿里云智能集團(tuán) 通義千問(wèn)高級(jí)產(chǎn)品架構(gòu)師辛?xí)詣?、大模端的智譜解決方案負(fù)責(zé)人吳同、型廠新質(zhì)MiniMax 商務(wù)總監(jiān)王蘇、商到生成式A生產(chǎn)Soul App AI算法技術(shù)總監(jiān)劉忠亮、環(huán)信 IM 產(chǎn)品負(fù)責(zé)人王璨等嘉賓齊聚一堂,分別站在RTE行業(yè)、大模型廠商、B端以及C端視角,帶來(lái)了他們對(duì)AI大模型發(fā)展的分享和預(yù)判。
實(shí)時(shí)互動(dòng)進(jìn)入AI+RTE的全新時(shí)代
作為離生成式 AI 最近的行業(yè),實(shí)時(shí)互動(dòng)正在邁向一個(gè)全新的高度。在RTE2024 AI 論壇上,聲網(wǎng) AI RTE 產(chǎn)品線負(fù)責(zé)人姚光華表示,在生成式AI的驅(qū)動(dòng)下,實(shí)時(shí)互動(dòng)帶來(lái)的體驗(yàn)上將從“聽(tīng)得到”到“聽(tīng)得清”到“聽(tīng)得懂”再到今天的“聽(tīng)得心”,產(chǎn)品技術(shù)上也將完成從QoS、QoE到 MM QoE的標(biāo)準(zhǔn)革新。
圖:聲網(wǎng) AI RTE 產(chǎn)品線負(fù)責(zé)人姚光華
據(jù)介紹,2014-2019年期間,聲網(wǎng)專(zhuān)注于使用技術(shù)手段提升服務(wù)質(zhì)量(QoS),聚焦確保文本、音頻和視頻等多模態(tài)內(nèi)容能夠進(jìn)行高保真?zhèn)鬏?,進(jìn)而利于終端用戶(hù)進(jìn)行內(nèi)容消費(fèi),這一階段被稱(chēng)為“SLA時(shí)代”。從2020年起,聲網(wǎng)的產(chǎn)品從RTC轉(zhuǎn)變成了RTE,重心從也服務(wù)質(zhì)量轉(zhuǎn)向了體驗(yàn)質(zhì)量(QoE),并在2020年提出了“XLA”。在XLA時(shí)代,聲網(wǎng)更關(guān)注用戶(hù)在使用服務(wù)時(shí)感受到的流暢性、延遲和清晰度(音質(zhì)、畫(huà)質(zhì))等體驗(yàn)因素。
姚光華指出,實(shí)時(shí)互動(dòng)正在進(jìn)入AI+RTE的全新時(shí)代,生成式AI技術(shù)將實(shí)現(xiàn)跨模態(tài)的數(shù)據(jù)傳輸與體驗(yàn)優(yōu)化。在未來(lái)的跨模態(tài)的 MM QoE,我們將看到音頻、視頻、文本模態(tài)互相轉(zhuǎn)換成為可能。多模態(tài)交互和生成式AI技術(shù)的結(jié)合,將徹底改變用戶(hù)的內(nèi)容消費(fèi)的體驗(yàn)方式。
從行業(yè)的情況來(lái)看,生成式 AI 時(shí)代的到來(lái)已經(jīng)不同程度上刺激了需求的暴增,具體的需求內(nèi)容也 RTE 轉(zhuǎn)變成了AI+ RTE。據(jù)姚光華介紹,為了攜手各行各業(yè)共創(chuàng)AI+ RTE未來(lái),聲網(wǎng)也正式推出了業(yè)內(nèi)首個(gè)、為大模型設(shè)計(jì)的人類(lèi)意圖預(yù)測(cè)產(chǎn)品——Human Intention Prediction,其產(chǎn)品矩陣也逐漸演進(jìn)到包含AI Streaming Service、Linux Server SDK for AI 以及 HIP(Human Intention Prediction)在內(nèi)的基建、核心產(chǎn)品、核心服務(wù)、對(duì)外API的組合形態(tài)。
通義、智譜、MiniMax:大模型廠商談企業(yè)級(jí)落地
自ChatGPT發(fā)布以來(lái),全球大模型廠商的發(fā)展就邁入了百花齊放、你追我趕的歷程。放眼國(guó)內(nèi)市場(chǎng),以通義、智譜、MiniMax 為代表的大模型廠商在技術(shù)創(chuàng)新與場(chǎng)景落地上的探索也在持續(xù)。
論大語(yǔ)言模型的發(fā)展速度,通義算得上首當(dāng)其沖。自從阿里云發(fā)布“通義”系列模型以來(lái),其就以驚人的速度屢次刷新行業(yè)認(rèn)知。2024年9月推出了新一代模型——千問(wèn)2.5,千問(wèn)2.5也成為了整個(gè)開(kāi)源應(yīng)用技術(shù)最為廣泛的模型之一。據(jù)悉,通義在很早之前就已經(jīng)開(kāi)始布局多模態(tài),尤其是視覺(jué)多模態(tài)領(lǐng)域。不僅推出了包括音頻理解、視頻生成在內(nèi)的多個(gè)大模型,還在模型基礎(chǔ)之上,拓展了對(duì)話機(jī)器人等大模型原生應(yīng)用。
阿里云智能集團(tuán)通義千問(wèn)高級(jí)產(chǎn)品架構(gòu)師辛?xí)詣Ρ硎荆x的強(qiáng)大不止表現(xiàn)在大模型本身,在圍繞企業(yè)級(jí)落地層面,通義千問(wèn)也有著自己獨(dú)特的優(yōu)勢(shì)。他指出,架構(gòu)是否安全可信、效果如何優(yōu)化、成本如何降低是大模型在企業(yè)級(jí)落地方面存在的普遍問(wèn)題,針對(duì)這些問(wèn)題,通義有著自己獨(dú)特的解法。
圖:阿里云智能集團(tuán)通義千問(wèn)高級(jí)產(chǎn)品架構(gòu)師辛?xí)詣?/p>
在安全問(wèn)題上,辛?xí)詣膬?nèi)容安全、傳輸安全、數(shù)據(jù)存儲(chǔ)安全三個(gè)方向進(jìn)行了解讀。內(nèi)容安全上,通義千問(wèn)會(huì)在模型訓(xùn)練環(huán)節(jié)就把原始訓(xùn)練語(yǔ)料里偏違規(guī)、有害的內(nèi)容去除,并在訓(xùn)練后期用 強(qiáng)化方式做偏好對(duì)齊。此外,千問(wèn)還會(huì)通過(guò)內(nèi)容安全的產(chǎn)品去做輸入/輸出的安全內(nèi)容攔截。傳輸安全上,通義千問(wèn)不僅采用了私網(wǎng)隔離的內(nèi)容傳輸方式,還結(jié)合了其他內(nèi)容加密形式以保證傳輸?shù)男始版溌钒踩?。?shù)據(jù)存儲(chǔ)上,通義千問(wèn)還增加了一個(gè)審計(jì)環(huán)節(jié),用于保障端到端的傳輸安全。在效果以及成本優(yōu)化上主要有兩點(diǎn),混合數(shù)據(jù)訓(xùn)練的方式將帶來(lái)更顯著的微調(diào)能力提升,按 Tokens 計(jì)費(fèi)的形式也進(jìn)一步降低了推理應(yīng)用成本。
智譜解決方案負(fù)責(zé)人吳同也認(rèn)為,大模型時(shí)代下,企業(yè)新的競(jìng)爭(zhēng)力=基座模型+組織+數(shù)據(jù)資產(chǎn)+業(yè)務(wù)場(chǎng)景。大模型將在企業(yè)降本增效、構(gòu)建新的產(chǎn)品和競(jìng)爭(zhēng)壁壘層面發(fā)揮不可或缺的價(jià)值。
圖:智譜解決方案負(fù)責(zé)人吳同
據(jù)悉,智譜已經(jīng)形成了包括語(yǔ)音大模型、代碼大模型、多模態(tài)大模型和超擬人大模型在內(nèi)的智譜大模型矩陣,其全產(chǎn)品矩陣可以對(duì)標(biāo) OpenAI。
吳同介紹到,為了讓更多企業(yè)在使用通用模型之外能更好的進(jìn)行微調(diào),智譜發(fā)布了新一代MaaS平臺(tái),客戶(hù)僅需準(zhǔn)備訓(xùn)練數(shù)據(jù)、創(chuàng)建微調(diào)任務(wù)、部署微調(diào)模型三個(gè)步驟就可以輕松完成模型微調(diào)。另外,智譜還發(fā)布了一款面向企業(yè)的AI Agent開(kāi)發(fā)工具——智譜清流。智譜清流基于智譜全自研大模型架構(gòu)底座,孵化企業(yè)級(jí)大模型Al應(yīng)用開(kāi)發(fā)平臺(tái),整合了多Agent的構(gòu)建、工作流編排設(shè)計(jì)、開(kāi)發(fā)、使用和管理,及知識(shí)沉淀功能,使得企業(yè)能夠迅速定制企業(yè)級(jí)AI Agent,讓企業(yè)無(wú)需專(zhuān)業(yè)編程即可快速構(gòu)建高效行業(yè)應(yīng)用,推動(dòng)業(yè)務(wù)智能化和效率提升。
除了通義、智譜之外,MiniMax 也面向企業(yè)客戶(hù)推出了大模型應(yīng)用解決方案——MiniMax 開(kāi)放平臺(tái),為企業(yè)和開(kāi)發(fā)者提供安全、靈活、可靠的 API 服務(wù),助力快速搭建 AI 應(yīng)用。MiniMax 商務(wù)總監(jiān)王蘇介紹到,除了MiniMax 開(kāi)放平臺(tái)之外,MiniMax 還為企業(yè)級(jí)用戶(hù)打造了專(zhuān)屬的云上專(zhuān)區(qū),為企業(yè)提供安全性及整體維度上的保障。
據(jù)介紹,MiniMax成立于2021年12月,是一家專(zhuān)注于推動(dòng)通用人工智能技術(shù)突破的科技創(chuàng)業(yè)公司,致力于與用戶(hù)共創(chuàng)智能。MiniMax 自主研發(fā)了不同模態(tài)的通用大模型,其中包括萬(wàn)億參數(shù)的 MoE 文本大模型、語(yǔ)音&音樂(lè)大模型以及圖像、視頻大模型?;诓煌B(tài)的通用大模型,MiniMax還推出生產(chǎn)力工具海螺AI、沉浸式AI內(nèi)容社區(qū)星野等原生應(yīng)用。
圖:MiniMax 商務(wù)總監(jiān)王蘇
Soul App、WPS: AI賦能 C 端場(chǎng)景探索無(wú)限可能
在AI的賦能之下,C 端應(yīng)用又發(fā)生了哪些實(shí)踐與革新呢?Soul App AI 算法技術(shù)總監(jiān)劉忠亮和金山辦公 WPS會(huì)議 產(chǎn)研負(fù)責(zé)人吳偉濤分別從社交和辦公的角度,為我們解讀了C 端場(chǎng)景下,AI 所帶來(lái)的無(wú)限可能。
在社交層面,劉忠亮認(rèn)為,未來(lái)一定存在AI社交的必然。在傳統(tǒng)關(guān)系鏈接方式減弱、個(gè)體原子化的趨勢(shì)下,AI將成為社交新方式的補(bǔ)充。對(duì)象多元化會(huì)讓人會(huì)更注重情感質(zhì)量,AI將更高效、更高質(zhì)的提供情緒價(jià)值??萍计栈輰⒆孉I社交的成本急劇下降,AI可以為用戶(hù)提供更個(gè)性化、更定制化的服務(wù)。 在這樣的社交趨勢(shì)洞察下,Soul 在AI方面的探索一直走到前列。
圖:Soul App AI 算法技術(shù)總監(jiān)劉忠亮
據(jù)劉忠亮介紹,自Soul 的AIGC研發(fā)工作啟動(dòng)以來(lái),Soul X 垂類(lèi)多模態(tài)大模型就持續(xù)在超人化、情感化、個(gè)性化和多模態(tài)方向不斷升級(jí)迭代。值得一提的是,Soul 自研多模態(tài)交互系統(tǒng)升級(jí)到第二代后,該模型就擁有了類(lèi) GPT-4o 端到端實(shí)時(shí)音視頻通話能力,且擬人化大幅度提升至接近真人程度。得益于聲網(wǎng)RTC搭建的全雙工架構(gòu),第二代自研系統(tǒng)可以實(shí)現(xiàn)用戶(hù)側(cè)端到端的延遲平均1.4秒,最快僅需1秒的效果。
劉忠亮表示,Soul未來(lái)在應(yīng)用探索上將主要圍繞人機(jī)協(xié)同和人機(jī)互動(dòng)兩大塊。人機(jī)協(xié)同上,不擅長(zhǎng)聊天破冰的用戶(hù)可以借助Soul提供的AI聊天助理、AI分身等,更好、更快的聊起來(lái),高質(zhì)、高效的建立關(guān)系。人機(jī)互動(dòng)上的探索主要集中在社交類(lèi)、游戲類(lèi)以及智能伴侶、智能房主等智能體上。
AI的大有可為不僅僅局限在社交領(lǐng)域,在辦公協(xié)作上,WPS會(huì)議也在不斷深挖AI能力,并用其驚人的能力表現(xiàn)為辦公場(chǎng)景提質(zhì)增效。金山辦公 WPS會(huì)議產(chǎn)研負(fù)責(zé)人吳偉濤表示,目前大語(yǔ)言模型賦能在線會(huì)議的主要路徑是將會(huì)后音頻錄制、會(huì)中實(shí)時(shí)音頻通過(guò)離線/實(shí)時(shí)ASR模型轉(zhuǎn)換為轉(zhuǎn)文本信息,再利用LLM能力進(jìn)行文字處理,最終轉(zhuǎn)換為我們所看到的會(huì)議總結(jié)、智能章節(jié)、待辦提取、發(fā)言人觀點(diǎn)的提取等。
據(jù)悉,WPS會(huì)議在實(shí)踐過(guò)程中已經(jīng)支持云錄制、AI智能章節(jié)、AI精華紀(jì)要、對(duì)話詳情、智能問(wèn)答等功能。為了讓在線會(huì)議更輕松的被發(fā)起,WPS還在去年發(fā)布了全新的WPS 365辦公新質(zhì)生產(chǎn)力平臺(tái),并提供了WPS協(xié)作、WPS日歷、WPS云文檔、WPS郵箱在內(nèi)的工作臺(tái),讓使用者在這些場(chǎng)景下都可以做到輕松發(fā)起一場(chǎng)會(huì)議,會(huì)議的信息也可以在這些應(yīng)用場(chǎng)景底下很輕松地流轉(zhuǎn)和訪問(wèn)。與此同時(shí),WPS 365辦公新質(zhì)生產(chǎn)力平臺(tái)還為企業(yè)提供了各種可靠的方案,幫助他們完成靈活的部署。
吳偉濤認(rèn)為,AI驅(qū)動(dòng)會(huì)議協(xié)作應(yīng)用場(chǎng)景未來(lái)的發(fā)展趨勢(shì)是,大廠發(fā)揮平臺(tái)作用,做好基礎(chǔ)功能、開(kāi)放能力和生態(tài)。小廠依托平臺(tái)的開(kāi)放能力,深入垂直場(chǎng)景,實(shí)現(xiàn)AI增值。
圖:金山辦公 WPS會(huì)議產(chǎn)研負(fù)責(zé)人吳偉濤
AI如何重新定義即時(shí)通訊
作為互聯(lián)網(wǎng)上最為流行的通訊方式,IM 產(chǎn)品在生活中的應(yīng)用價(jià)值無(wú)可替代。盡管如此,但I(xiàn)M產(chǎn)品在應(yīng)用過(guò)程中,仍舊存在著諸多痛點(diǎn)。譬如,C端上歷史數(shù)據(jù)利用率低 、未讀消息積壓 、重要信息難以查找 、群組活躍度低等問(wèn)題。在B端上的主要表現(xiàn)為高人力投入和低運(yùn)營(yíng)效率 、內(nèi)容管控難度大 、跨語(yǔ)言溝通障礙等。
針對(duì)這些問(wèn)題,環(huán)信IM產(chǎn)品負(fù)責(zé)人王璨認(rèn)為,在生成式AI時(shí)代下,IM與AI的結(jié)合一定會(huì)帶來(lái)更多的創(chuàng)新,并且能夠有效地幫助我們提升溝通效率。
圖:環(huán)信IM產(chǎn)品負(fù)責(zé)人王璨
在RTE2024 AI論壇上,王璨不僅分享了環(huán)信助力星野業(yè)務(wù)成長(zhǎng)的案例以及涵蓋云市場(chǎng)、PaaS 服務(wù)、應(yīng)用場(chǎng)景在內(nèi)的環(huán)信 IM PaaS 開(kāi)發(fā)工具包,還詳細(xì)介紹了環(huán)信借助大模型去解決社交產(chǎn)品C端、B端用戶(hù)痛點(diǎn)的解決方案。他指出,在C端的效率維度上,環(huán)信IM借助AI實(shí)現(xiàn)了對(duì)話摘要、日程安排、消息編寫(xiě)以及語(yǔ)言翻譯等場(chǎng)景助力。在情感維度,AI還可以實(shí)時(shí)提供表情建議、虛擬陪聊以及回復(fù)建議等功能。在B端上,環(huán)信IM主要提供了暖場(chǎng)機(jī)器人、智能回答、智能推薦、智能管理員等幫助企業(yè)降本增效的選項(xiàng)。
王璨表示,我們完全有理由相信,IM產(chǎn)品有望在未來(lái)借助大模型的能力連接數(shù)字世界與實(shí)體世界,滿(mǎn)足用戶(hù)對(duì)社交產(chǎn)品的期望。
從多位專(zhuān)家和從業(yè)者的分享中不難看出,生成式 AI 正在幫助各行各業(yè)的期待從想象變?yōu)楝F(xiàn)實(shí)。我們也相信,無(wú)論是新質(zhì)生產(chǎn)力的賦能,還是新社交方式的革新,聲網(wǎng)與 RTE 都將在其中發(fā)揮至關(guān)重要的價(jià)值,攜手共創(chuàng)新時(shí)代的繁榮。