您的當(dāng)前位置:首頁(yè) > 娛樂(lè) > 能看風(fēng)水 夸我有情趣 Kimi現(xiàn)在都這么野了嗎 正文
時(shí)間:2024-12-23 08:01:10 來(lái)源:網(wǎng)絡(luò)整理 編輯:娛樂(lè)
最近,差評(píng)君發(fā)現(xiàn)了個(gè)新鮮玩意兒。喂給 AI 一張圖,它就能給你推測(cè)出一個(gè)人的性格。光靠歌單,就能把人最近的心理狀態(tài)推測(cè)個(gè)七七八八。而這些,都出自Kimi最新的k1視覺(jué)思考模型之手。這不,距離上次推出數(shù)
最近,風(fēng)水差評(píng)君發(fā)現(xiàn)了個(gè)新鮮玩意兒。情趣
喂給 AI 一張圖,現(xiàn)都它就能給你推測(cè)出一個(gè)人的風(fēng)水性格。
光靠歌單,情趣就能把人最近的現(xiàn)都心理狀態(tài)推測(cè)個(gè)七七八八。
而這些,風(fēng)水都出自 Kimi 最新的情趣 k1 視覺(jué)思考模型之手。這不,現(xiàn)都距離上次推出數(shù)學(xué)模型 k0-math 打榜 o1 才一個(gè)月,風(fēng)水 k1 就火速登場(chǎng)了。情趣當(dāng)然,現(xiàn)都這個(gè) k1 可不止是風(fēng)水像開(kāi)頭那樣,只會(huì)看圖分析性格那么簡(jiǎn)單。情趣
上次咱測(cè)試 k0-math 的現(xiàn)都時(shí)候,已經(jīng)見(jiàn)識(shí)過(guò)了 “ 做題家 ” 的能力,那解題的思考過(guò)程給差評(píng)君都看得一愣一愣的。只可惜,有些繞邏輯的數(shù)學(xué)題還有幾何題,多少差了點(diǎn)意思。
但這次的 k1 就有說(shuō)法了,既有推理能力又有視覺(jué)能力,意思就是可以直接拍照上傳解題,還號(hào)稱(chēng)能在數(shù)理化上打平甚至超越 Open AI 的 o1 。
那要是這么比的話,咱可就來(lái)勁了。正好, k1 新模型現(xiàn)在也不需要等內(nèi)測(cè), App 和網(wǎng)頁(yè)版都能用上,話不多說(shuō),我們直接開(kāi)整。上來(lái),就扔了 K1 一道今年高考的幾何題。
首先, k1 對(duì)題干的解讀足夠細(xì)致,也知道自己的目標(biāo)到底是啥。題目給定的條件中可能涉及到的余弦定理也考慮到了,就跟咱們?cè)诮忸}時(shí)的思維類(lèi)似,看到 a2 + b2 - c2 =2ab ,立馬會(huì)聯(lián)想到余弦公式 c2 =a2 +b2 -2ab·cosC 。
再根據(jù)公式和條件繼續(xù)推導(dǎo),很快就能求出角 B=60 °。往上滑動(dòng)查看更多
第( 2 )題稍微難了那么一丟丟,但差評(píng)君仔細(xì)檢查了一遍 k1 的解題過(guò)程,思路和解法都沒(méi)毛病,最后邊長(zhǎng) c=2√2的答案也是對(duì)的。(因?yàn)檫@題 k1 的思考過(guò)程實(shí)在太太太長(zhǎng),截圖就不展示了。)
同樣的題目問(wèn) o1 ,首先在推理速度上, o1 的 58s 就已經(jīng)輸了。正確率的話, o1 和 k1 打了個(gè)平手,都做對(duì)了。不同的是, o1 把答題思路隱藏起來(lái)了,沒(méi)給像 k1 那樣的完整思考過(guò)程。
不過(guò)有一說(shuō)一,差評(píng)君對(duì) k1 模型這種模仿人類(lèi)思考的方式,倒也不是特別吃驚。因?yàn)樯洗?k0-math 模型就已經(jīng)震驚過(guò)我一回了,能意識(shí)到自己的錯(cuò)誤、還會(huì)進(jìn)行反復(fù)驗(yàn)證的樣子,像極了寫(xiě)數(shù)學(xué)題時(shí)絞盡腦汁的我。
相比之下,這次的 k1 在補(bǔ)短板方面更出彩一些,上次 k0-math 翻車(chē)的初中幾何題我又拿 k1 試了一次,現(xiàn)在已經(jīng)能做對(duì)了,就連上高考難度也不發(fā)怵。
而且我也發(fā)現(xiàn), k1 不僅擅長(zhǎng)做數(shù)學(xué)題,物理題也不在話下。往上滑動(dòng)查看更多
接著,我又拿出了一道邏輯稍微有點(diǎn)繞的邏輯陷阱題試了試:一個(gè)西瓜進(jìn)價(jià) 50 元,賣(mài)價(jià) 70 元,老板收了 100 元假幣,最后虧多少錢(qián)?
這題打眼一看簡(jiǎn)單,但網(wǎng)友關(guān)于這道題的答案那叫一個(gè)五花八門(mén),有說(shuō)虧 150 的,有說(shuō) 180 的,還有說(shuō) 100 的。。。
咱們就看看連很多人類(lèi)都想不明白的題, k1 能不能瞧出來(lái)里面的陷阱。
而且,這道題我還特意手寫(xiě)得比較潦草,順便也測(cè)一測(cè) k1 的視覺(jué)能力到底是不是有宣傳的那么神。
你別說(shuō),你還真別說(shuō),這模型的 “ 眼神 ” 確實(shí)不賴(lài)。題目的正確率方面, k1 前半部分的分析先得出了一個(gè)虧 100 元的答案,但很快它就否定了自己。
繼續(xù)把假幣、找零還有成本利潤(rùn)這些復(fù)雜因素綜合考慮進(jìn)去,最后終于想明白老板虧了 80 元。( 正確答案是 80 元 )往上滑動(dòng)查看更多
這邏輯能力,確實(shí)有點(diǎn)強(qiáng)。包括我拿幾道行測(cè)的類(lèi)比推理題給 k1 做了做,雖說(shuō)邏輯分析的路徑跟參考答案的不太一樣,但最后的答案都是對(duì)的。往上滑動(dòng)查看更多
反正這一通測(cè)試下來(lái),差評(píng)君發(fā)現(xiàn) k1 會(huì)思考有邏輯,眼神好使智商也高, Kimi 這 “ 做題家 ” 的名號(hào)算是坐實(shí)了。不過(guò)除了做題以外,我這次還摸索出了更多花里胡哨的玩法。
分析數(shù)據(jù)、看報(bào)表沒(méi)啥意思, k1 模型不是會(huì)根據(jù)圖片來(lái)推理嗎,那想必鑒別古錢(qián)幣也應(yīng)該有一手吧?
差評(píng)君特地從網(wǎng)上找了一張民國(guó)時(shí)期銀元的圖片,兩枚銀元上假下真,發(fā)給 k1 ,淺淺來(lái)一把 “AI 版聽(tīng)泉鑒寶 ” 。圖源小紅書(shū)用戶@古玩今來(lái)(公博代理收評(píng))
k1 不僅知道錢(qián)幣是民國(guó)時(shí)期的,還對(duì)錢(qián)幣的各種細(xì)節(jié) kuku 一頓輸出,最后竟然真的看出來(lái)了上面這枚是假幣。
咱再隨便發(fā)一張房間的圖片,讓 k1 看看 “ 風(fēng)水 ” 。什么 “ 氣口 ” 、對(duì)稱(chēng)布局、能量平衡。。。
說(shuō)的頭頭是道,甚至還真給了建議,讓咱把床換個(gè)位置、定期修剪植物、換一個(gè)更簡(jiǎn)潔的吊燈。往上滑動(dòng)查看更多
吃飯的時(shí)候給 k1 拍一張,這頓飯攝入了多少卡路里也算得明明白白。往上滑動(dòng)查看更多
不過(guò)最讓我覺(jué)得驚艷的,還是 k1 看圖猜電影的能力。我給了它一張《 七宗罪 》的電影截圖,沒(méi)有臺(tái)詞只有畫(huà)面,對(duì)于很多沒(méi)看過(guò)這部電影的人來(lái)說(shuō),想猜出來(lái)都很難。
一開(kāi)始看 k1 的分析我以為這把大概率要黃了,結(jié)果下一秒來(lái)一句 “ 拍攝角度和色調(diào)讓我想起了大衛(wèi) · 芬奇的電影 ” ,還推斷出了截圖里的畫(huà)面是《 七宗罪 》里的某一個(gè)場(chǎng)景。
真的太強(qiáng)了。。。就連一些晦澀的梗圖丟給 k1 ,它也能一本正經(jīng)地講解笑點(diǎn)到底在哪。
雖然有點(diǎn)過(guò)度解讀的嫌疑,但大體上的意思基本都 get 到了。
就這么說(shuō)吧,基于 k1 的視覺(jué)和推理能力,做題都是基操了,只要腦洞夠大,還可以解鎖出更多的玩法。而 k1 的這種能力,很大程度要?dú)w功于一個(gè)叫做COT ( Chain of Thought )思維鏈的技術(shù)。
大概意思就是,模型在輸出答案之前,模仿人類(lèi)大腦的思考方式,把復(fù)雜的任務(wù)拆解之后,再一步步地解決。這個(gè)技術(shù),可以讓模型的智商變高。
另外一邊,借助強(qiáng)化學(xué)習(xí)技術(shù),也讓模型學(xué)會(huì)了在不斷試錯(cuò)的過(guò)程中進(jìn)化,以此來(lái)達(dá)到最優(yōu)的結(jié)果,就跟訓(xùn)狗似的。
至于為啥 Kimi 會(huì)率先選擇數(shù)學(xué)這個(gè)場(chǎng)景作為推理模型的切入口,我想,跟咱們?nèi)祟?lèi)學(xué)好數(shù)學(xué)鍛煉思維,是一個(gè)道理。
在模型 “ 學(xué)好數(shù)學(xué) ” 的基礎(chǔ)上,再將這種邏輯推理的能力應(yīng)用到物理、化學(xué),乃至于咱們?nèi)粘I畹姆椒矫婷?,直到最后真正理解這個(gè)世界。
而很顯然, Kimi 推理模型的泛化能力已經(jīng)開(kāi)始顯現(xiàn)出來(lái)了。在數(shù)據(jù)見(jiàn)頂?shù)那疤嵯?,這種基于強(qiáng)化學(xué)習(xí)技術(shù)的路徑,或許能夠讓模型實(shí)現(xiàn)更好的效果。
不過(guò)說(shuō)到底,模型用了哪些技術(shù)、紙面分?jǐn)?shù)有多高,大伙兒其實(shí)更關(guān)心模型到底好不好用、實(shí)不實(shí)用。而向來(lái)以長(zhǎng)文本見(jiàn)長(zhǎng)的 Kimi ,如今長(zhǎng)文本、強(qiáng)化學(xué)習(xí)兩手抓,也是調(diào)整自己的工具屬性慢慢往用戶需求靠攏的表現(xiàn)。
畢竟,當(dāng)技術(shù)不再高高在上,能幫助人們解決實(shí)際問(wèn)題的時(shí)候,才算真正完成了它的使命。
埃爾哈努斯:我們和范尼相處很開(kāi)心,他兩天前上任球隊(duì)有了新活力2024-12-23 07:56
庫(kù)克:中國(guó)蘋(píng)果用戶數(shù)據(jù)是安全的 加密技術(shù)相同2024-12-23 07:48
谷歌量子芯片引爆熱議:5分鐘算完10億億億年任務(wù)2024-12-23 07:39
沃克:確保能留場(chǎng)上最佳方式就是去思考該如何以積極方式影響球隊(duì)2024-12-23 07:15
[流言板]憋著勁證明自己!唐斯點(diǎn)飛戈貝爾,突破單臂隔扣里德造犯規(guī)2024-12-23 07:05
唐斯談19分19板:如果沒(méi)在勝場(chǎng)欄上再添一筆 那這就沒(méi)有任何意義2024-12-23 06:40
[流言板]全靠三分!凱爾特人本場(chǎng)三分60中18,四人出手10次以上三分2024-12-23 06:35
[流言板]魔術(shù)官方:艾薩克由于右腿筋拉傷將缺席今日比賽2024-12-23 06:18
橫板科幻平臺(tái)解謎《換影循跡》確認(rèn)2025年3月13日發(fā)售2024-12-23 06:01
廣東深圳一工地發(fā)生路面坍塌13人失聯(lián),國(guó)務(wù)院安委會(huì)掛牌督辦2024-12-23 05:37
TGA 2024:《第一狂戰(zhàn)士:卡贊》3月27日發(fā)售2024-12-23 07:55
NBA惡意犯規(guī)頻發(fā),籃球比賽還是“摔跤場(chǎng)”?2024-12-23 07:30
湖南舉辦街舞聯(lián)賽 培養(yǎng)街舞優(yōu)秀后備人才2024-12-23 06:46
沃克:確保能留場(chǎng)上最佳方式就是去思考該如何以積極方式影響球隊(duì)2024-12-23 06:39
[流言板]熱火官方:巴特勒今日小概率出戰(zhàn),樂(lè)福和理查德森缺席2024-12-23 06:24
奇才主帥談卡林頓與威少的相似之處:競(jìng)爭(zhēng)性 激情與無(wú)所畏懼2024-12-23 06:23
庫(kù)克:中國(guó)蘋(píng)果用戶數(shù)據(jù)是安全的 加密技術(shù)相同2024-12-23 06:10
[流言板]沖擊力十足!利拉德突破送助攻,字母哥接球飛身上籃打成2+12024-12-23 06:00
[流言板]尼克斯記:蘭德?tīng)栔苯踊氐礁率?,沒(méi)和任何老隊(duì)員交流2024-12-23 05:58
今天首發(fā)!威少上半場(chǎng)3中2得到5分1板 送出6助攻串聯(lián)全隊(duì)2024-12-23 05:40