
阿里巴巴旗下AI旗艦應(yīng)用夸克AI超級框有了重大動作,其發(fā)布了全新AI相機,并特別推出 “拍照問夸克” 功能。此次更新基于強大的視覺理解與思考推理模型能力,將為用戶帶來一系列全新體驗,推動智能搜索進入新的發(fā)展階段。?
在日常生活、學(xué)習(xí)和工作場景中,用戶常常會面臨復(fù)雜物體、表格和圖形等難以用語言準確描述真實需求的情況。全新的夸克AI相機憑借其強大的功能,能夠深入洞察用戶意圖,讓視覺搜索、多輪問答、圖像處理與創(chuàng)作變得更加輕松便捷。?
“拍照問夸克” 功能基于AI超級框背后先進的視覺理解和推理模型能力,用戶無論是在手機還是電腦端,都可以利用這一功能進行圖片搜索、問答、思考、編輯以及創(chuàng)作。這一全新的多模態(tài)產(chǎn)品入口和交互體驗,正逐漸成為AI時代用戶表達問題和獲取信息的關(guān)鍵方式。
該功能的識別精準度令人驚嘆,它能夠精準識別圖片中的人物、物體以及各種細微細節(jié),并且能夠深入理解用戶需求,聯(lián)想出與之相關(guān)的問題。舉例來說,當用戶拍照搜索文物時,它會自動關(guān)聯(lián)該文物的歷史背景等相關(guān)信息;要是上傳商品圖片,系統(tǒng)則會一鍵跳轉(zhuǎn)至淘寶同款鏈接。不管是人物、動物、植物、建筑、風(fēng)景、美食、藝術(shù)品、商品、外文資料,還是故障代碼等,夸克都能在極短的時間內(nèi)完成識別,并且經(jīng)過多輪問答和深度思考,給出在同類產(chǎn)品中極具優(yōu)勢的回答。?
過去,用戶若要完成圍繞 “圖片” 的復(fù)雜任務(wù),往往需要在多個AI工具之間來回切換,操作繁瑣。如今,夸克對“超級Agent”在視覺搜索方面的產(chǎn)品體驗和使用場景進行了大幅提升,致力于滿足用戶對現(xiàn)實物理世界的解讀、處理和創(chuàng)作需求?!芭恼諉柨淇恕?功能將搜索、掃描、修圖、翻譯、創(chuàng)作等多種能力聚合在一個統(tǒng)一入口。對于較為復(fù)雜的圖像,用戶一次最多可上傳10張圖片,讓AI進行深度推理,從而完成各類復(fù)雜任務(wù)。目前,夸克擁有超百個專業(yè)Agent和原子能力,涵蓋搜索、健康、學(xué)習(xí)、旅游、商品、創(chuàng)作等多個領(lǐng)域,并持續(xù)通過模型能力升級來優(yōu)化Agent 組合策略,以滿足用戶對圖像信息的個性化需求。?
在實際應(yīng)用場景中,“拍照問夸克” 功能展現(xiàn)出了強大的實用性。在旅行場景中,它就像一位如影隨形的 “專業(yè)導(dǎo)游”,用戶邊逛邊拍,就能獲取文物講解、景點攻略等信息;工作中,它可以輔助分析數(shù)據(jù)圖表、優(yōu)化代碼邏輯,還能生成工作總結(jié)文檔;在健康領(lǐng)域,用戶上傳體檢報告,它會給出指標異常分析以及康復(fù)方案建議;娛樂場景里,它支持棋牌指導(dǎo)、截圖找劇、情頭配對等趣味功能,同時還能一鍵完成高清化、去水印、原文溯源等操作。此外,“拍照問夸克” 還支持多種語言提問和翻譯解讀,方便不同語言背景的用戶使用。








