近日,阿里阿里云通義萬相團(tuán)隊(duì)推出全新的云通義萬圖像編輯模型ACE,只需說一句話就能生成圖片和修改圖片,相推像編型A現(xiàn)鍵可應(yīng)用于風(fēng)格化寫真、出圖分鏡制作、輯模室內(nèi)設(shè)計(jì)等場(chǎng)景。可實(shí)該模型已面向全球開發(fā)者開源,阿里其局部風(fēng)格化功能已上線通義APP。云通義萬
圖像編輯是相推像編型A現(xiàn)鍵圖像生成模型的重要輔助功能,此前業(yè)界常用的出圖方案是將LoRA、ControlNets 和 T2I 模型組合,輯模從而實(shí)現(xiàn)圖像編輯能力??蓪?shí)但該方案流程相對(duì)復(fù)雜,阿里且使用門檻較高,云通義萬大多用戶無法直接體驗(yàn)。相推像編型A現(xiàn)鍵與傳統(tǒng)圖像編輯模型不同,ACE模型可同時(shí)支持文生圖和圖像編輯,用戶輸入口語化指令,可完成可控視覺編輯、元素編輯、區(qū)域重繪編輯、分層編輯等任務(wù),僅用對(duì)話的方式就能實(shí)現(xiàn)PS的功能,例如輸入文字即可一鍵除水印、修改證件照背景等,極大地提高了編輯效率。
上傳一張照片即可對(duì)圖中特定對(duì)象的風(fēng)格化處理
公開論文顯示,該團(tuán)隊(duì)提出了Long-context Condition Unit模塊(LCU),能支持通用編輯任務(wù)所需的各種多模態(tài)條件輸入,并且搭建了全面的編輯成對(duì)數(shù)據(jù)構(gòu)造鏈路和指令集生成鏈路,最終達(dá)到精準(zhǔn)、高質(zhì)量的圖像指令編輯效果。測(cè)試結(jié)果顯示,ACE模型在MagicBrush的單輪/多輪編輯的多項(xiàng)指標(biāo)和EMU Edit數(shù)據(jù)集的單輪編輯指標(biāo)上都取得了領(lǐng)先成績(jī)。
據(jù)悉,ACE模型在魔搭社區(qū)、Github、Huggingface等開源社區(qū)和社交平臺(tái)引起了國(guó)內(nèi)外開發(fā)者的熱議,一度登上Huggingface周榜第二,總榜第五。同時(shí),該模型局部風(fēng)格化功能已正式上線通義APP,用戶上傳一張照片就能實(shí)現(xiàn)對(duì)圖中特定對(duì)象的風(fēng)格化處理。
ACE登上Huggingface周榜第二,總榜第五
通義萬相算法團(tuán)隊(duì)表示:“未來將進(jìn)一步提升ACE編輯模型的準(zhǔn)確性,同時(shí)將逐步開放重繪、定制化生成、組合生成等能力,讓用戶更便捷地實(shí)現(xiàn)創(chuàng)意設(shè)計(jì)。” 目前通義萬相已推出圖像生成、圖像編輯、視頻生成等能力,累計(jì)生成超2億張圖片。
開源地址:
魔搭社區(qū):https://www.modelscope.cn/models/iic/ACE-0.6B-1024px
Github:https://github.com/ali-vilab/ACE
Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat