您現在的位置是:下愚不移網 > 綜合
阿里云通義萬相推出圖像編輯模型ACE 可實現一鍵P圖
下愚不移網2024-12-23 04:01:32【綜合】0人已圍觀
簡介近日,阿里云通義萬相團隊推出全新的圖像編輯模型ACE,只需說一句話就能生成圖片和修改圖片,可應用于風格化寫真、分鏡制作、室內設計等場景。該模型已面向全球開發(fā)者開源,其局部風格化功能已上線通義APP。圖
近日,阿里阿里云通義萬相團隊推出全新的云通義萬圖像編輯模型ACE,只需說一句話就能生成圖片和修改圖片,相推像編型A現鍵可應用于風格化寫真、出圖分鏡制作、輯模室內設計等場景??蓪嵲撃P鸵衙嫦蛉蜷_發(fā)者開源,阿里其局部風格化功能已上線通義APP。云通義萬
圖像編輯是相推像編型A現鍵圖像生成模型的重要輔助功能,此前業(yè)界常用的出圖方案是將LoRA、ControlNets 和 T2I 模型組合,輯模從而實現圖像編輯能力??蓪嵉摲桨噶鞒滔鄬碗s,阿里且使用門檻較高,云通義萬大多用戶無法直接體驗。相推像編型A現鍵與傳統圖像編輯模型不同,ACE模型可同時支持文生圖和圖像編輯,用戶輸入口語化指令,可完成可控視覺編輯、元素編輯、區(qū)域重繪編輯、分層編輯等任務,僅用對話的方式就能實現PS的功能,例如輸入文字即可一鍵除水印、修改證件照背景等,極大地提高了編輯效率。
上傳一張照片即可對圖中特定對象的風格化處理
公開論文顯示,該團隊提出了Long-context Condition Unit模塊(LCU),能支持通用編輯任務所需的各種多模態(tài)條件輸入,并且搭建了全面的編輯成對數據構造鏈路和指令集生成鏈路,最終達到精準、高質量的圖像指令編輯效果。測試結果顯示,ACE模型在MagicBrush的單輪/多輪編輯的多項指標和EMU Edit數據集的單輪編輯指標上都取得了領先成績。
據悉,ACE模型在魔搭社區(qū)、Github、Huggingface等開源社區(qū)和社交平臺引起了國內外開發(fā)者的熱議,一度登上Huggingface周榜第二,總榜第五。同時,該模型局部風格化功能已正式上線通義APP,用戶上傳一張照片就能實現對圖中特定對象的風格化處理。
ACE登上Huggingface周榜第二,總榜第五
通義萬相算法團隊表示:“未來將進一步提升ACE編輯模型的準確性,同時將逐步開放重繪、定制化生成、組合生成等能力,讓用戶更便捷地實現創(chuàng)意設計。” 目前通義萬相已推出圖像生成、圖像編輯、視頻生成等能力,累計生成超2億張圖片。
開源地址:
魔搭社區(qū):https://www.modelscope.cn/models/iic/ACE-0.6B-1024px
Github:https://github.com/ali-vilab/ACE
Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat
很贊哦!(56961)