RTE2024 AI 專場:從大模型廠商到B/C端的應(yīng)用 生成式AI的新質(zhì)生產(chǎn)力
生成式AI的大模端的高速發(fā)展,不僅持續(xù)驅(qū)動著大模型本身的型廠新質(zhì)變革,更為各行各業(yè)創(chuàng)造了無數(shù)令人激動和無限想象的商到生成式A生產(chǎn)空間。
在生成式 AI 的應(yīng)用驅(qū)動下,實時互動體驗正在邁向一個全新的大模端的高度。
企業(yè)新的型廠新質(zhì)競爭力=基座模型+組織+數(shù)據(jù)資產(chǎn)+業(yè)務(wù)場景。
AI 社交將成為社交新方式的商到生成式A生產(chǎn)補充。
IM產(chǎn)品有望借助大模型的應(yīng)用能力,滿足用戶對社交產(chǎn)品的大模端的期望......
從情緒價值到新質(zhì)生產(chǎn)力、從社交新方式到社交新構(gòu)想。型廠新質(zhì)一場圍繞 AI 自身進化與賦能的商到生成式A生產(chǎn) RTE2024 AI 專場10月25日在北京成功舉辦。聲網(wǎng) AI RTE 產(chǎn)品線負(fù)責(zé)人姚光華、應(yīng)用阿里云智能集團 通義千問高級產(chǎn)品架構(gòu)師辛?xí)詣?、大模端的智譜解決方案負(fù)責(zé)人吳同、型廠新質(zhì)MiniMax 商務(wù)總監(jiān)王蘇、商到生成式A生產(chǎn)Soul App AI算法技術(shù)總監(jiān)劉忠亮、環(huán)信 IM 產(chǎn)品負(fù)責(zé)人王璨等嘉賓齊聚一堂,分別站在RTE行業(yè)、大模型廠商、B端以及C端視角,帶來了他們對AI大模型發(fā)展的分享和預(yù)判。
實時互動進入AI+RTE的全新時代
作為離生成式 AI 最近的行業(yè),實時互動正在邁向一個全新的高度。在RTE2024 AI 論壇上,聲網(wǎng) AI RTE 產(chǎn)品線負(fù)責(zé)人姚光華表示,在生成式AI的驅(qū)動下,實時互動帶來的體驗上將從“聽得到”到“聽得清”到“聽得懂”再到今天的“聽得心”,產(chǎn)品技術(shù)上也將完成從QoS、QoE到 MM QoE的標(biāo)準(zhǔn)革新。
圖:聲網(wǎng) AI RTE 產(chǎn)品線負(fù)責(zé)人姚光華
據(jù)介紹,2014-2019年期間,聲網(wǎng)專注于使用技術(shù)手段提升服務(wù)質(zhì)量(QoS),聚焦確保文本、音頻和視頻等多模態(tài)內(nèi)容能夠進行高保真?zhèn)鬏?,進而利于終端用戶進行內(nèi)容消費,這一階段被稱為“SLA時代”。從2020年起,聲網(wǎng)的產(chǎn)品從RTC轉(zhuǎn)變成了RTE,重心從也服務(wù)質(zhì)量轉(zhuǎn)向了體驗質(zhì)量(QoE),并在2020年提出了“XLA”。在XLA時代,聲網(wǎng)更關(guān)注用戶在使用服務(wù)時感受到的流暢性、延遲和清晰度(音質(zhì)、畫質(zhì))等體驗因素。
姚光華指出,實時互動正在進入AI+RTE的全新時代,生成式AI技術(shù)將實現(xiàn)跨模態(tài)的數(shù)據(jù)傳輸與體驗優(yōu)化。在未來的跨模態(tài)的 MM QoE,我們將看到音頻、視頻、文本模態(tài)互相轉(zhuǎn)換成為可能。多模態(tài)交互和生成式AI技術(shù)的結(jié)合,將徹底改變用戶的內(nèi)容消費的體驗方式。
從行業(yè)的情況來看,生成式 AI 時代的到來已經(jīng)不同程度上刺激了需求的暴增,具體的需求內(nèi)容也 RTE 轉(zhuǎn)變成了AI+ RTE。據(jù)姚光華介紹,為了攜手各行各業(yè)共創(chuàng)AI+ RTE未來,聲網(wǎng)也正式推出了業(yè)內(nèi)首個、為大模型設(shè)計的人類意圖預(yù)測產(chǎn)品——Human Intention Prediction,其產(chǎn)品矩陣也逐漸演進到包含AI Streaming Service、Linux Server SDK for AI 以及 HIP(Human Intention Prediction)在內(nèi)的基建、核心產(chǎn)品、核心服務(wù)、對外API的組合形態(tài)。
通義、智譜、MiniMax:大模型廠商談企業(yè)級落地
自ChatGPT發(fā)布以來,全球大模型廠商的發(fā)展就邁入了百花齊放、你追我趕的歷程。放眼國內(nèi)市場,以通義、智譜、MiniMax 為代表的大模型廠商在技術(shù)創(chuàng)新與場景落地上的探索也在持續(xù)。
論大語言模型的發(fā)展速度,通義算得上首當(dāng)其沖。自從阿里云發(fā)布“通義”系列模型以來,其就以驚人的速度屢次刷新行業(yè)認(rèn)知。2024年9月推出了新一代模型——千問2.5,千問2.5也成為了整個開源應(yīng)用技術(shù)最為廣泛的模型之一。據(jù)悉,通義在很早之前就已經(jīng)開始布局多模態(tài),尤其是視覺多模態(tài)領(lǐng)域。不僅推出了包括音頻理解、視頻生成在內(nèi)的多個大模型,還在模型基礎(chǔ)之上,拓展了對話機器人等大模型原生應(yīng)用。
阿里云智能集團通義千問高級產(chǎn)品架構(gòu)師辛?xí)詣Ρ硎?,通義的強大不止表現(xiàn)在大模型本身,在圍繞企業(yè)級落地層面,通義千問也有著自己獨特的優(yōu)勢。他指出,架構(gòu)是否安全可信、效果如何優(yōu)化、成本如何降低是大模型在企業(yè)級落地方面存在的普遍問題,針對這些問題,通義有著自己獨特的解法。
圖:阿里云智能集團通義千問高級產(chǎn)品架構(gòu)師辛?xí)詣?/p>
在安全問題上,辛?xí)詣膬?nèi)容安全、傳輸安全、數(shù)據(jù)存儲安全三個方向進行了解讀。內(nèi)容安全上,通義千問會在模型訓(xùn)練環(huán)節(jié)就把原始訓(xùn)練語料里偏違規(guī)、有害的內(nèi)容去除,并在訓(xùn)練后期用 強化方式做偏好對齊。此外,千問還會通過內(nèi)容安全的產(chǎn)品去做輸入/輸出的安全內(nèi)容攔截。傳輸安全上,通義千問不僅采用了私網(wǎng)隔離的內(nèi)容傳輸方式,還結(jié)合了其他內(nèi)容加密形式以保證傳輸?shù)男始版溌钒踩?shù)據(jù)存儲上,通義千問還增加了一個審計環(huán)節(jié),用于保障端到端的傳輸安全。在效果以及成本優(yōu)化上主要有兩點,混合數(shù)據(jù)訓(xùn)練的方式將帶來更顯著的微調(diào)能力提升,按 Tokens 計費的形式也進一步降低了推理應(yīng)用成本。
智譜解決方案負(fù)責(zé)人吳同也認(rèn)為,大模型時代下,企業(yè)新的競爭力=基座模型+組織+數(shù)據(jù)資產(chǎn)+業(yè)務(wù)場景。大模型將在企業(yè)降本增效、構(gòu)建新的產(chǎn)品和競爭壁壘層面發(fā)揮不可或缺的價值。
圖:智譜解決方案負(fù)責(zé)人吳同
據(jù)悉,智譜已經(jīng)形成了包括語音大模型、代碼大模型、多模態(tài)大模型和超擬人大模型在內(nèi)的智譜大模型矩陣,其全產(chǎn)品矩陣可以對標(biāo) OpenAI。
吳同介紹到,為了讓更多企業(yè)在使用通用模型之外能更好的進行微調(diào),智譜發(fā)布了新一代MaaS平臺,客戶僅需準(zhǔn)備訓(xùn)練數(shù)據(jù)、創(chuàng)建微調(diào)任務(wù)、部署微調(diào)模型三個步驟就可以輕松完成模型微調(diào)。另外,智譜還發(fā)布了一款面向企業(yè)的AI Agent開發(fā)工具——智譜清流。智譜清流基于智譜全自研大模型架構(gòu)底座,孵化企業(yè)級大模型Al應(yīng)用開發(fā)平臺,整合了多Agent的構(gòu)建、工作流編排設(shè)計、開發(fā)、使用和管理,及知識沉淀功能,使得企業(yè)能夠迅速定制企業(yè)級AI Agent,讓企業(yè)無需專業(yè)編程即可快速構(gòu)建高效行業(yè)應(yīng)用,推動業(yè)務(wù)智能化和效率提升。
除了通義、智譜之外,MiniMax 也面向企業(yè)客戶推出了大模型應(yīng)用解決方案——MiniMax 開放平臺,為企業(yè)和開發(fā)者提供安全、靈活、可靠的 API 服務(wù),助力快速搭建 AI 應(yīng)用。MiniMax 商務(wù)總監(jiān)王蘇介紹到,除了MiniMax 開放平臺之外,MiniMax 還為企業(yè)級用戶打造了專屬的云上專區(qū),為企業(yè)提供安全性及整體維度上的保障。
據(jù)介紹,MiniMax成立于2021年12月,是一家專注于推動通用人工智能技術(shù)突破的科技創(chuàng)業(yè)公司,致力于與用戶共創(chuàng)智能。MiniMax 自主研發(fā)了不同模態(tài)的通用大模型,其中包括萬億參數(shù)的 MoE 文本大模型、語音&音樂大模型以及圖像、視頻大模型?;诓煌B(tài)的通用大模型,MiniMax還推出生產(chǎn)力工具海螺AI、沉浸式AI內(nèi)容社區(qū)星野等原生應(yīng)用。
圖:MiniMax 商務(wù)總監(jiān)王蘇
Soul App、WPS: AI賦能 C 端場景探索無限可能
在AI的賦能之下,C 端應(yīng)用又發(fā)生了哪些實踐與革新呢?Soul App AI 算法技術(shù)總監(jiān)劉忠亮和金山辦公 WPS會議 產(chǎn)研負(fù)責(zé)人吳偉濤分別從社交和辦公的角度,為我們解讀了C 端場景下,AI 所帶來的無限可能。
在社交層面,劉忠亮認(rèn)為,未來一定存在AI社交的必然。在傳統(tǒng)關(guān)系鏈接方式減弱、個體原子化的趨勢下,AI將成為社交新方式的補充。對象多元化會讓人會更注重情感質(zhì)量,AI將更高效、更高質(zhì)的提供情緒價值。科技普惠將讓AI社交的成本急劇下降,AI可以為用戶提供更個性化、更定制化的服務(wù)。 在這樣的社交趨勢洞察下,Soul 在AI方面的探索一直走到前列。
圖:Soul App AI 算法技術(shù)總監(jiān)劉忠亮
據(jù)劉忠亮介紹,自Soul 的AIGC研發(fā)工作啟動以來,Soul X 垂類多模態(tài)大模型就持續(xù)在超人化、情感化、個性化和多模態(tài)方向不斷升級迭代。值得一提的是,Soul 自研多模態(tài)交互系統(tǒng)升級到第二代后,該模型就擁有了類 GPT-4o 端到端實時音視頻通話能力,且擬人化大幅度提升至接近真人程度。得益于聲網(wǎng)RTC搭建的全雙工架構(gòu),第二代自研系統(tǒng)可以實現(xiàn)用戶側(cè)端到端的延遲平均1.4秒,最快僅需1秒的效果。
劉忠亮表示,Soul未來在應(yīng)用探索上將主要圍繞人機協(xié)同和人機互動兩大塊。人機協(xié)同上,不擅長聊天破冰的用戶可以借助Soul提供的AI聊天助理、AI分身等,更好、更快的聊起來,高質(zhì)、高效的建立關(guān)系。人機互動上的探索主要集中在社交類、游戲類以及智能伴侶、智能房主等智能體上。
AI的大有可為不僅僅局限在社交領(lǐng)域,在辦公協(xié)作上,WPS會議也在不斷深挖AI能力,并用其驚人的能力表現(xiàn)為辦公場景提質(zhì)增效。金山辦公 WPS會議產(chǎn)研負(fù)責(zé)人吳偉濤表示,目前大語言模型賦能在線會議的主要路徑是將會后音頻錄制、會中實時音頻通過離線/實時ASR模型轉(zhuǎn)換為轉(zhuǎn)文本信息,再利用LLM能力進行文字處理,最終轉(zhuǎn)換為我們所看到的會議總結(jié)、智能章節(jié)、待辦提取、發(fā)言人觀點的提取等。
據(jù)悉,WPS會議在實踐過程中已經(jīng)支持云錄制、AI智能章節(jié)、AI精華紀(jì)要、對話詳情、智能問答等功能。為了讓在線會議更輕松的被發(fā)起,WPS還在去年發(fā)布了全新的WPS 365辦公新質(zhì)生產(chǎn)力平臺,并提供了WPS協(xié)作、WPS日歷、WPS云文檔、WPS郵箱在內(nèi)的工作臺,讓使用者在這些場景下都可以做到輕松發(fā)起一場會議,會議的信息也可以在這些應(yīng)用場景底下很輕松地流轉(zhuǎn)和訪問。與此同時,WPS 365辦公新質(zhì)生產(chǎn)力平臺還為企業(yè)提供了各種可靠的方案,幫助他們完成靈活的部署。
吳偉濤認(rèn)為,AI驅(qū)動會議協(xié)作應(yīng)用場景未來的發(fā)展趨勢是,大廠發(fā)揮平臺作用,做好基礎(chǔ)功能、開放能力和生態(tài)。小廠依托平臺的開放能力,深入垂直場景,實現(xiàn)AI增值。
圖:金山辦公 WPS會議產(chǎn)研負(fù)責(zé)人吳偉濤
AI如何重新定義即時通訊
作為互聯(lián)網(wǎng)上最為流行的通訊方式,IM 產(chǎn)品在生活中的應(yīng)用價值無可替代。盡管如此,但IM產(chǎn)品在應(yīng)用過程中,仍舊存在著諸多痛點。譬如,C端上歷史數(shù)據(jù)利用率低 、未讀消息積壓 、重要信息難以查找 、群組活躍度低等問題。在B端上的主要表現(xiàn)為高人力投入和低運營效率 、內(nèi)容管控難度大 、跨語言溝通障礙等。
針對這些問題,環(huán)信IM產(chǎn)品負(fù)責(zé)人王璨認(rèn)為,在生成式AI時代下,IM與AI的結(jié)合一定會帶來更多的創(chuàng)新,并且能夠有效地幫助我們提升溝通效率。
圖:環(huán)信IM產(chǎn)品負(fù)責(zé)人王璨
在RTE2024 AI論壇上,王璨不僅分享了環(huán)信助力星野業(yè)務(wù)成長的案例以及涵蓋云市場、PaaS 服務(wù)、應(yīng)用場景在內(nèi)的環(huán)信 IM PaaS 開發(fā)工具包,還詳細(xì)介紹了環(huán)信借助大模型去解決社交產(chǎn)品C端、B端用戶痛點的解決方案。他指出,在C端的效率維度上,環(huán)信IM借助AI實現(xiàn)了對話摘要、日程安排、消息編寫以及語言翻譯等場景助力。在情感維度,AI還可以實時提供表情建議、虛擬陪聊以及回復(fù)建議等功能。在B端上,環(huán)信IM主要提供了暖場機器人、智能回答、智能推薦、智能管理員等幫助企業(yè)降本增效的選項。
王璨表示,我們完全有理由相信,IM產(chǎn)品有望在未來借助大模型的能力連接數(shù)字世界與實體世界,滿足用戶對社交產(chǎn)品的期望。
從多位專家和從業(yè)者的分享中不難看出,生成式 AI 正在幫助各行各業(yè)的期待從想象變?yōu)楝F(xiàn)實。我們也相信,無論是新質(zhì)生產(chǎn)力的賦能,還是新社交方式的革新,聲網(wǎng)與 RTE 都將在其中發(fā)揮至關(guān)重要的價值,攜手共創(chuàng)新時代的繁榮。
本文地址:http://www.qzaqs.com/news/0e67399326.html
版權(quán)聲明
本文僅代表作者觀點,不代表本站立場。
本文系作者授權(quán)發(fā)表,未經(jīng)許可,不得轉(zhuǎn)載。