10 月 29 日,三合一已經(jīng)預(yù)熱半年的訊飛星火虛擬新定 Apple Intelligence 終于登臺(tái)亮相,不過(guò)僅支持部分地區(qū)的首發(fā)視覺(jué)時(shí)代英語(yǔ)語(yǔ)言,也還只是語(yǔ)音義萬(wàn) Beta 版本。當(dāng)下,人交全球包括中國(guó)的互重大部分國(guó)家及地區(qū)的消費(fèi)者仍無(wú)法享受到 Apple Intelligence。
在此前秋季新品發(fā)布會(huì)上,物智蘋(píng)果用了超過(guò)一半篇幅來(lái)展示新系統(tǒng)在 Apple Intelligence 加持下的聯(lián)新威力,一些功能看起來(lái)頗具未來(lái)感,三合一比如可以使用攝像頭感知周圍環(huán)境的訊飛星火虛擬新定多模態(tài)交互能力,將手機(jī)發(fā)布會(huì)活生生開(kāi)成了一場(chǎng) AI 產(chǎn)品說(shuō)明會(huì)。首發(fā)視覺(jué)時(shí)代
事實(shí)上,語(yǔ)音義萬(wàn)在不少大模型廠商看來(lái),人交蘋(píng)果在發(fā)布會(huì)所展示的互重 Apple Intellignce 也沒(méi)有那么新鮮。比如多模態(tài)交互能力,物智國(guó)內(nèi)外已有不少大模型都實(shí)現(xiàn)了對(duì)周圍環(huán)境的實(shí)時(shí)感知,并且兼具更加個(gè)性化的互動(dòng)能力。
10 月 24 日科大訊飛對(duì)外發(fā)布的訊飛星火 4.0 Turbo 就是其中之一。在多模態(tài)交互能力的基礎(chǔ)上,訊飛星火首發(fā)語(yǔ)音視覺(jué)虛擬人交互的「三合一」,不僅能夠具備語(yǔ)音、視頻、圖文的全聯(lián)動(dòng)的多模態(tài)交互,還加入了超擬人數(shù)字人功能,重新定義萬(wàn)物智聯(lián)時(shí)代的多模 AIUI 交互標(biāo)準(zhǔn),讓 AI 在「栩栩如生」的基礎(chǔ)上,還可以具備像人類一樣的個(gè)性化能力。
蘋(píng)果展示的 Apple Intelligence 實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)環(huán)境的基礎(chǔ)感知能力,比如 AI 只是簡(jiǎn)單地識(shí)別了周圍物體后給出回答,演示功能局限在回答餐廳評(píng)價(jià)、動(dòng)物品種等基礎(chǔ)問(wèn)答上,國(guó)內(nèi)的大模型廠商則不滿足于此。
在訊飛星火升級(jí)發(fā)布會(huì)的演示中,訊飛星火的超擬人數(shù)字人甚至可以根據(jù)現(xiàn)實(shí)情況的不斷變化,來(lái)一場(chǎng)實(shí)地「解說(shuō)」??拼笥嶏w研究院院長(zhǎng)劉聰在現(xiàn)場(chǎng)擺放了三個(gè)玩偶,分別是孫悟空、奧特曼和怪獸。他在現(xiàn)場(chǎng)不斷調(diào)整玩偶的位置、動(dòng)作,超擬人數(shù)字人通過(guò)攝像頭馬上可以給出「解說(shuō)」,「孫悟空舉起了金箍棒,奧特曼正在防御」「怪獸來(lái)了,孫悟空和奧特曼開(kāi)始聯(lián)合對(duì)抗怪獸」……
蘋(píng)果在發(fā)布會(huì)上展示的比如識(shí)別自行車品牌等購(gòu)物場(chǎng)景,星火超擬人數(shù)字人也能做得更好。在科大訊飛的發(fā)布會(huì)上,超擬人數(shù)字人不只是識(shí)別面前的美妝品牌,還能夠根據(jù)用戶的實(shí)際需求,給出針對(duì)性的挑選建議,什么樣的節(jié)日適合挑選什么禮物、什么價(jià)位的酒類產(chǎn)品口感更好,仿佛是一個(gè)精通萬(wàn)物的金牌導(dǎo)購(gòu)員。
最新的訊飛星火還支持用戶創(chuàng)新自己的個(gè)性化數(shù)字人,只需要在后臺(tái)進(jìn)行基礎(chǔ)的編輯、定義,用戶就可以快速生成專屬于自己的數(shù)字人形象。
不用擔(dān)心創(chuàng)建的數(shù)字人形象是否會(huì)雷同,訊飛星火目前支持超過(guò) 1300 種不同的人設(shè),加上此前訊飛星火推出的一句話復(fù)刻聲音功能,每個(gè)人都可以擁有專屬于自己的個(gè)性化數(shù)字人。
語(yǔ)音是萬(wàn)物互聯(lián)的入口,事實(shí)上,作為國(guó)內(nèi)語(yǔ)音產(chǎn)業(yè)的王者,科大訊飛一直在引領(lǐng)語(yǔ)音交互的變革。早在 8 月全民開(kāi)放的星火極速超擬人交互,就憑借更快響應(yīng)速度的反應(yīng)力、更具情感共鳴的感性力,更靈活可控的表達(dá)里以及更多種人設(shè)的角色扮演力,讓萬(wàn)千用戶體驗(yàn)到了 AI 超擬人化的魅力。而此次超擬人虛擬人交互,或?qū)⒊瑪M人技術(shù)與虛擬人技術(shù)進(jìn)行融合,讓虛擬人交互更具人類特性,進(jìn)一步打破現(xiàn)實(shí)世界與數(shù)字世界的邊界。此前虛擬人技術(shù)已在訊飛多款軟硬件產(chǎn)品中得到應(yīng)用,比如搭載星火大模型訊飛 AI 學(xué)習(xí)機(jī)就通過(guò)虛擬教師實(shí)現(xiàn)引導(dǎo)式伴學(xué),星火語(yǔ)伴通過(guò)伴讀老師提升用戶口語(yǔ)能力,訊飛智作更讓虛擬主播走進(jìn)現(xiàn)實(shí),降低自媒體創(chuàng)業(yè)門檻。
在今年的發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛預(yù)告,在硬件產(chǎn)品端,內(nèi)嵌了星火多模 AIUI 能力的訊飛 AI 學(xué)習(xí)機(jī)閱讀伙伴即將上線,孩子們「指哪讀哪」,書(shū)中的文字可以馬上「變身」成個(gè)性化數(shù)字人,躍然紙上,啟發(fā)孩子思考和提問(wèn)。相信隨著訊飛星火多模 AIUI 能力的進(jìn)一步集成,將重塑人機(jī)交互新體驗(yàn)。