12月18日消息,字節(jié)正式在今天舉辦的跳動圖火山引擎Force大會上,字節(jié)跳動正式發(fā)布豆包視覺理解模型,發(fā)布為企業(yè)提供極具性價比的豆包多模態(tài)大模型能力。
豆包視覺理解模型千tokens輸入價格僅為3厘,視覺一元錢就可處理284張720P的理解圖片,比行業(yè)價格便宜85%,模型以更低成本推動AI技術(shù)普惠和應(yīng)用發(fā)展。處理
火山引擎總裁譚待介紹,近張豆包視覺理解模型不僅能精準(zhǔn)識別視覺內(nèi)容,高清還具備出色的字節(jié)正式理解和推理能力,可根據(jù)圖像信息進(jìn)行復(fù)雜的跳動圖邏輯計算,完成分析圖表、發(fā)布處理代碼、豆包解答學(xué)科問題等任務(wù)。視覺
此前,豆包視覺理解模型已經(jīng)接入豆包App和PC端產(chǎn)品。
值得一提的是,字節(jié)跳動還將在2025年春季將推出具備更長視頻生成能力的豆包視頻生成模型1.5版,豆包端到端實(shí)時語音模型也將很快上線
目前,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺,來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長100倍。