11月25日消息,電腦動搞定崩據(jù)媒體報道,操控測評常還近日新加坡國立大學團隊,完整在20多個場景下對Claude的全自電腦操控能力進行了全面測試。
結果顯示,鐵日AI不僅能自動完成手游日常任務,建爐還能執(zhí)行復雜的電腦動搞定崩辦公任務。
研究中選用了米哈游《崩壞:星穹鐵道》,操控測評常還可以跟它說”幫我完成今天的完整模擬宇宙”,Claude就能自動完成各種任務,全自甚至包括啟動自動戰(zhàn)斗和等待戰(zhàn)斗結束后退出,鐵日操作行云流水。建爐
特別值得一提的電腦動搞定崩是,這并不是操控測評常還傳統(tǒng)游戲外掛那樣的機械操作,Claude還能智能理解游戲規(guī)則和目標,完整根據(jù)界面上不同的任務進行調整。
除了《崩壞:星穹鐵道》,AI還能自動玩《爐石傳說》,包括創(chuàng)建和重命名牌組、使用英雄技能等。
團隊基于Claude Computer Use的API設計了一個自動化GUI框架,該框架包括系統(tǒng)提示、狀態(tài)觀察、推理范式等六個部分。
AI通過這個框架能夠執(zhí)行網(wǎng)頁搜索、工作流程模型、辦公生產力軟件等日常辦公場景下的任務。
例如,在Amazon和Apple官方網(wǎng)站上成功完成下單購物的任務,選擇顏色配置、填寫地址等操作。
雖然AI在復雜網(wǎng)頁操作和辦公軟件中有部分任務失敗,但整體表現(xiàn)已相當出色,團隊還公開了所有測試用例的具體信息,供有興趣的研究者和開發(fā)者進一步探索。
作者:知識