蘋果近日在macOS Tahoe 26.1、iPadOS 26.1及iOS 26.1的首個開發(fā)者測試版中,對AI圖像生成工具Image Playground進(jìn)行了底層架構(gòu)重構(gòu),為第三方模型接入掃清技術(shù)障礙。通過代碼挖掘發(fā)現(xiàn),此次升級新增兩大核心功能模塊:一是「估算延遲」(estimated latency)指標(biāo),可實時評估不同模型的響應(yīng)效率,幫助用戶根據(jù)創(chuàng)作需求選擇合適工具;二是「提供商標(biāo)識」系統(tǒng),能清晰標(biāo)注生成結(jié)果的模型來源,兼顧版權(quán)追溯與用戶知情權(quán)。?
這一架構(gòu)調(diào)整標(biāo)志著Image Playground從「單一模型工具」向「多引擎聚合平臺」的轉(zhuǎn)型。此前該應(yīng)用僅依賴蘋果自研模型,2025年上半年接入OpenAI的ChatGPT 后,新增油畫、水彩、吉卜力風(fēng)格動漫等十余種創(chuàng)作選項,但受限于單一外部模型的能力邊界。此次底層升級后,應(yīng)用可同時兼容不同技術(shù)路徑的生成模型,形成「自研+多第三方」的混合引擎矩陣。?
盡管蘋果尚未公布具體合作名單,但行業(yè)普遍認(rèn)為谷歌Gemini 2.5 Flash Image(又稱 Nano Banana)是首批接入的熱門模型。該模型以精準(zhǔn)的人物特征還原能力著稱,此前推動谷歌 Gemini 應(yīng)用登頂多個國家的App Store,其輕量化特性也與蘋果設(shè)備的本地運行需求高度匹配。?
從技術(shù)互補(bǔ)性來看,新增模型將填補(bǔ)現(xiàn)有能力空白:ChatGPT擅長藝術(shù)風(fēng)格遷移,但在真實場景渲染上存在短板;蘋果自研模型優(yōu)化了設(shè)備端運行效率,卻受限于訓(xùn)練數(shù)據(jù)的多樣性。而谷歌Gemini的人像生成優(yōu)勢、Playground Research最新發(fā)布的PGv3模型的專業(yè)圖形設(shè)計能力(支持RGB顏色精確控制與復(fù)雜提示遵循),都可能成為蘋果生態(tài)的重要補(bǔ)充。有分析指出,蘋果或借鑒與Shutterstock的版權(quán)合作模式,通過內(nèi)容授權(quán)解決第三方模型的訓(xùn)練數(shù)據(jù)合規(guī)問題。?
此次擴(kuò)展是蘋果AI生態(tài)開放戰(zhàn)略的關(guān)鍵落子。2024年WWDC 上,蘋果首次提出向開發(fā)者開放設(shè)備內(nèi)置基礎(chǔ)AI模型的計劃,而 Image Playground 的多模型接入則是這一戰(zhàn)略在創(chuàng)作工具領(lǐng)域的具體實踐。通過開放API接口,開發(fā)者未來可將不同模型的生成能力嵌入郵件、iMessage等原生應(yīng)用,形成「創(chuàng)作-分發(fā)-應(yīng)用」的閉環(huán)。?
用戶體驗層面,多模型集成將解決當(dāng)前痛點:例如ChatGPT生成速度較慢且免費賬戶有次數(shù)限制,用戶可切換至響應(yīng)更快的本地模型完成快速草圖,再用第三方模型優(yōu)化細(xì)節(jié);面對 logo設(shè)計等專業(yè)需求時,可調(diào)用參數(shù)量達(dá)240億的PGv3模型,其文本渲染準(zhǔn)確率和圖形設(shè)計能力已被證實超越人類設(shè)計師。這種「按需選擇」的模式,將大幅提升工具的場景適配性。