11月20日消息,阿里阿里云百煉宣布,云百最新的煉上Qwen2.5-Turbo模型已在平臺(tái)上線,即日起所有用戶(hù)可在阿里云百煉調(diào)用Qwen2.5-Turbo API,阿里百萬(wàn)tokens僅需0.3元,云百同時(shí)還免費(fèi)為用戶(hù)贈(zèng)送1000萬(wàn)tokens額度。煉上
該模型支持100萬(wàn)超長(zhǎng)上下文,阿里相當(dāng)于100萬(wàn)個(gè)英文單詞或150萬(wàn)個(gè)漢字,云百并且在多個(gè)長(zhǎng)文本評(píng)測(cè)集中的煉上性能表現(xiàn)超越GPT-4。
據(jù)介紹,阿里Qwen2.5-Turbo可應(yīng)用于長(zhǎng)篇小說(shuō)深入理解、云百倉(cāng)庫(kù)級(jí)別代碼助手、煉上多篇論文閱讀等場(chǎng)景,阿里可一次性處理10本長(zhǎng)篇小說(shuō),云百150小時(shí)的煉上演講稿,3萬(wàn)行代碼。
具體來(lái)看,Qwen2.5-Turbo在1M長(zhǎng)度的超長(zhǎng)文本檢索(Passkey Retrieval)任務(wù)中的準(zhǔn)確率可達(dá)到100%,在長(zhǎng)文本評(píng)測(cè)集RULER上獲得93.1分,超越GPT-4。
在LV-Eval、LongBench-Chat等更加接近真實(shí)場(chǎng)景的長(zhǎng)文本任務(wù)中,Qwen2.5-Turbo在多數(shù)維度超越了GPT-4o-mini。
不僅是長(zhǎng)文本,在MMU、LiveBench等短文本基準(zhǔn)上Qwen2.5-Turbo的表現(xiàn)也非常優(yōu)秀,在大部分任務(wù)上的表現(xiàn)顯著超越之前上下文長(zhǎng)度為1M tokens的開(kāi)源模型。
在推理速度方面,團(tuán)隊(duì)利用稀疏注意力機(jī)制將注意力部分的計(jì)算量壓縮了約12.5倍,將處理1M tokens上下文時(shí)的首字返回時(shí)間從4.9分鐘降低到68秒,速度大幅提升了4.3倍。
不過(guò)通義千問(wèn)團(tuán)隊(duì)也表示,長(zhǎng)文本任務(wù)處理依然存在諸多挑戰(zhàn),未來(lái)將進(jìn)一步探索長(zhǎng)序列人類(lèi)偏好對(duì)齊,優(yōu)化推理效率以減少運(yùn)算時(shí)間,并繼續(xù)研發(fā)更大、更強(qiáng)的長(zhǎng)文本模型。