xAI為iOS版Grok語音模式推出視覺功能

?? 由 文心大模型 生成的文章摘要

xAI正積極為iOS版Grok語音模式帶來創(chuàng)新性的視覺功能。這一舉措旨在進一步提升用戶與人工智能的交互體驗,讓Grok能更好地理解和響應(yīng)用戶需求。?

目前,iOS版Grok已開放攝像頭訪問權(quán)限,用戶可利用設(shè)備攝像頭捕捉視覺輸入,Grok則通過語音響應(yīng)分析和描述所捕捉到的畫面。例如,用戶拍攝一張風景照片,Grok能夠?qū)φ掌械木吧M行描述,像 “照片中是一片廣闊的藍色海洋,海浪拍打著金色沙灘,遠處有幾艘白色帆船在航行”,或者用戶拍攝一張物品照片,Grok能識別物品并提供相關(guān)信息。不過,完整的視覺分析功能仍在開發(fā)中,后續(xù)還將加入語速調(diào)節(jié)選項,以滿足不同用戶的使用習慣。?
此前,Grok已具備一定的圖像相關(guān)能力。去年,xAI就為Grok增添了圖像理解功能,X平臺付費用戶可向AI助手上傳圖片并進行相關(guān)提問,馬斯克展示過Grok不僅能理解圖片內(nèi)容,還能解讀其中的幽默元素。通過與黑森林實驗室(Black Forest Labs)的FLUX.1模型合作,Grok也已具備圖像生成能力。此次在iOS版語音模式中加入視覺功能,是Grok功能的又一次重要拓展。?

在模型方面,xAI已在API中上線grok – 3 – beta、grok – 3 – mini – beta及其fast版本,充值5美元并參與計劃的用戶可使用每月 150 美元贈金訪問這些模型。這一系列動作顯示出xAI 在不斷推動Grok的發(fā)展,提升其在人工智能市場中的競爭力。
?
隨著iOS版Grok語音模式視覺功能的逐步完善,未來用戶有望獲得更加智能、便捷且多元化的交互體驗,無論是在日常生活中的信息獲取,還是在工作學習中的資料分析等方面,Grok 都可能發(fā)揮更大的作用。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」