
阿里巴巴旗下AI旗艦應(yīng)用夸克AI超級框有了重大動作,其發(fā)布了全新AI相機(jī),并特別推出 “拍照問夸克” 功能。此次更新基于強(qiáng)大的視覺理解與思考推理模型能力,將為用戶帶來一系列全新體驗(yàn),推動智能搜索進(jìn)入新的發(fā)展階段。?
在日常生活、學(xué)習(xí)和工作場景中,用戶常常會面臨復(fù)雜物體、表格和圖形等難以用語言準(zhǔn)確描述真實(shí)需求的情況。全新的夸克AI相機(jī)憑借其強(qiáng)大的功能,能夠深入洞察用戶意圖,讓視覺搜索、多輪問答、圖像處理與創(chuàng)作變得更加輕松便捷。?
“拍照問夸克” 功能基于AI超級框背后先進(jìn)的視覺理解和推理模型能力,用戶無論是在手機(jī)還是電腦端,都可以利用這一功能進(jìn)行圖片搜索、問答、思考、編輯以及創(chuàng)作。這一全新的多模態(tài)產(chǎn)品入口和交互體驗(yàn),正逐漸成為AI時(shí)代用戶表達(dá)問題和獲取信息的關(guān)鍵方式。
該功能的識別精準(zhǔn)度令人驚嘆,它能夠精準(zhǔn)識別圖片中的人物、物體以及各種細(xì)微細(xì)節(jié),并且能夠深入理解用戶需求,聯(lián)想出與之相關(guān)的問題。舉例來說,當(dāng)用戶拍照搜索文物時(shí),它會自動關(guān)聯(lián)該文物的歷史背景等相關(guān)信息;要是上傳商品圖片,系統(tǒng)則會一鍵跳轉(zhuǎn)至淘寶同款鏈接。不管是人物、動物、植物、建筑、風(fēng)景、美食、藝術(shù)品、商品、外文資料,還是故障代碼等,夸克都能在極短的時(shí)間內(nèi)完成識別,并且經(jīng)過多輪問答和深度思考,給出在同類產(chǎn)品中極具優(yōu)勢的回答。?
過去,用戶若要完成圍繞 “圖片” 的復(fù)雜任務(wù),往往需要在多個(gè)AI工具之間來回切換,操作繁瑣。如今,夸克對“超級Agent”在視覺搜索方面的產(chǎn)品體驗(yàn)和使用場景進(jìn)行了大幅提升,致力于滿足用戶對現(xiàn)實(shí)物理世界的解讀、處理和創(chuàng)作需求?!芭恼諉柨淇恕?功能將搜索、掃描、修圖、翻譯、創(chuàng)作等多種能力聚合在一個(gè)統(tǒng)一入口。對于較為復(fù)雜的圖像,用戶一次最多可上傳10張圖片,讓AI進(jìn)行深度推理,從而完成各類復(fù)雜任務(wù)。目前,夸克擁有超百個(gè)專業(yè)Agent和原子能力,涵蓋搜索、健康、學(xué)習(xí)、旅游、商品、創(chuàng)作等多個(gè)領(lǐng)域,并持續(xù)通過模型能力升級來優(yōu)化Agent 組合策略,以滿足用戶對圖像信息的個(gè)性化需求。?
在實(shí)際應(yīng)用場景中,“拍照問夸克” 功能展現(xiàn)出了強(qiáng)大的實(shí)用性。在旅行場景中,它就像一位如影隨形的 “專業(yè)導(dǎo)游”,用戶邊逛邊拍,就能獲取文物講解、景點(diǎn)攻略等信息;工作中,它可以輔助分析數(shù)據(jù)圖表、優(yōu)化代碼邏輯,還能生成工作總結(jié)文檔;在健康領(lǐng)域,用戶上傳體檢報(bào)告,它會給出指標(biāo)異常分析以及康復(fù)方案建議;娛樂場景里,它支持棋牌指導(dǎo)、截圖找劇、情頭配對等趣味功能,同時(shí)還能一鍵完成高清化、去水印、原文溯源等操作。此外,“拍照問夸克” 還支持多種語言提問和翻譯解讀,方便不同語言背景的用戶使用。








