美國專利局公開了蘋果一項專利申請,該申請聚焦于用于被動判定圖像捕獲設備上相機鏡頭存在污跡概率的設備、系統(tǒng)及方法。其核心在于,通過對圖像捕獲設備所拍攝圖像的分析(無需任何參考圖像)來實現(xiàn)這一判定。?
蘋果專利背景闡述表明,當前缺乏能夠自我診斷相機(即圖像捕捉設備)是否處于良好工作狀態(tài)的有效方法。舉例來說,當設備相機鏡頭沾染油跡和(或)灰塵時,鏡頭 “污跡” 便可能致使圖像質量下滑。此類污跡會在污跡與第一光學層之間引發(fā)額外的光線散射現(xiàn)象,進而造成圖像模糊、清晰度降低等質量問題。?
又如,相機鏡頭上留存的人體汗液(或其他形式的水分)同樣可能導致圖像質量下降。這種情況通常發(fā)生在相機工作時距離用戶身體過近,或是給定設備的工作溫度由冷驟變?yōu)闊岬臅r候。?
總體而言,蘋果該項專利申請涵蓋了被動識別相機污跡的設備與方法,其獨特之處在于無需借助參考圖像便能確定相機是否存在污跡。實施例中還包含運用時間一致性和(或)傳感器響應一致性約束來識別相機污跡的方法。?
從一個方面來看,該專利所涉及的設備包含顯示器、圖像捕獲設備,以及一個或多個與存儲器可實現(xiàn)操作耦合的處理器。這些處理器被設定為執(zhí)行特定指令,指令執(zhí)行過程包括:驅使處理器運用圖像捕獲設備獲取圖像,并在圖像的高強度區(qū)域內識別出感興趣區(qū)域(ROI);隨后判定 ROI圖像梯度是否大于閾值;指令還促使處理器提取ROI的多個子ROI,并確定圖像捕獲設備鏡頭上出現(xiàn)污跡的概率,最終將該概率輸出至顯示器。而確定圖像捕獲設備鏡頭上出現(xiàn)污跡概率的方式,既可以通過對多個子ROI中的每一個進行對比度測量來實現(xiàn),也能夠借助針對多個子ROI中的每一個運用神經(jīng)網(wǎng)絡的卷積塊來達成。
加拿大韋仕敦大學研究人員開發(fā)出了一種新技術,基于數(shù)學來準確理解神經(jīng)網(wǎng)絡以做出決策——這是機器學習領域一個被廣泛認可但又不太理解的過程。
當今的許多技術,從Siri和ChatGPT等數(shù)字助理到醫(yī)學成像和自動駕駛汽車,都由機器學習驅動。然而,支持這些機器學習系統(tǒng)的神經(jīng)網(wǎng)絡(受人類大腦啟發(fā)的計算機模型)一直難以理解,研究人員稱之為“黑匣子”。
“我們創(chuàng)建了可以執(zhí)行特定任務的神經(jīng)網(wǎng)絡,同時還使我們能夠解決控制網(wǎng)絡活動的方程式,”數(shù)學教授、韋仕敦大學菲爾茲網(wǎng)絡科學實驗室主任Lyle Muller表示,該實驗室隸屬于新成立的菲爾茲-西部合作中心?!霸摂?shù)學解決方案讓我們能夠‘打開黑匣子’,準確了解網(wǎng)絡是如何運作的?!?/p>
該研究結果發(fā)表在《PNAS》雜志上,研究團隊首先在圖像分割任務中展示了這一新進展。圖像分割是計算機視覺的一個基本過程,其中機器學習系統(tǒng)將圖像分成不同的部分,例如將圖像中的物體與背景分離。
從正方形和三角形等簡單的幾何形狀開始,他們創(chuàng)建了一個可以分割這些基本圖像的神經(jīng)網(wǎng)絡。
這種數(shù)學方法讓團隊能夠精確理解計算的每個步驟是如何進行的。團隊隨后發(fā)現(xiàn),該網(wǎng)絡還可以分割(或查看和解釋)一些自然圖像,例如北極熊在雪地中行走的照片或野生鳥類的照片。
韋仕敦大學神經(jīng)科學研究所成員Muller說:“通過簡化流程來獲得數(shù)學洞察力,我們可構建一個比以前的方法更靈活的網(wǎng)絡,并且在從未見過的新輸入上也表現(xiàn)良好。”
機器學習技術研發(fā)商V7完成了由Radical Ventures和淡馬錫領投,現(xiàn)有投資者Air Street Capital、Amadeus Capital Partners、Partech及包括Francois Chollet(Keras創(chuàng)始人)、Oriol Vinyals(DeepMind)、Jose Valim(Elixir創(chuàng)始人)、Ashish Vaswani以及OpenAI、Twitter和亞馬遜未披露個人在內眾多天使投資者參投的3300萬美元A輪融資。
V7基于人工智能技術,推出了圖像標記平臺,用于為電腦視覺項目創(chuàng)建培訓數(shù)據(jù),可應用于醫(yī)療保健、生命科學、制造業(yè)、自動駕駛、農業(yè)科技等領域。

V7如今的發(fā)展重點是計算機視覺以及自動識別和分類對象及其他數(shù)據(jù),以加快AI 模型的訓練速度。目前,V7在醫(yī)學和科學領域具有強大的號召力,其平臺被用于幫助訓練人工智能模型識別癌癥和其他問題。
V7首席執(zhí)行官 Alberto Rizzoli表示,這是迄今為止該領域規(guī)模最大的A輪融資,這筆資金還用于聘請更多工程師、擴大業(yè)務運營以滿足美國客戶的需求。盡管拒絕就估值發(fā)表評論,但該初創(chuàng)公司已融資了約3600萬美元,預計其估值約為2億美元。
V7——以人工智能作為處理圖像的“第七”區(qū)域而命名,繼人類大腦中形成其視覺皮層的六個區(qū)域(V1 至 V6)之后——正在構建服務以解決特定挑戰(zhàn):訓練模型的概念以及數(shù)據(jù)輸入的方式。
V7的特殊賣點是自動化。據(jù)估計,工程團隊大約80%的時間花在管理訓練數(shù)據(jù)上:標記、識別錯誤標記的時間、重新思考分類等等,因此V7建立了一個模型來自動化該過程。
V7將其提出的過程稱為“程序化標簽”:使用通用人工智能和算法來分割和標記圖像,并只需100“人工引導”示例,自動標簽便能生效。
來源:雅虎
著名未來學家托馬斯·弗雷(Thomas Frey)曾說過,“如果你改變了對未來的愿景,你也會改變自己今天的決策方式?!备ダ讓ξ磥韺W領域的見解已經(jīng)引起谷歌、IBM和AT&T等全球公司的關注,上周在今年的創(chuàng)新、機遇和投資(iO2)峰會上,弗雷也表達了類似的觀點,他在那里討論了房地產的未來。
該年會由美國全國房地產經(jīng)紀人協(xié)會(NAR)主辦,歡迎來自全國各地的專業(yè)人士探討前言技術領域的最新突破性想法。今年的話題廣泛,從非替代代幣(NFT)到經(jīng)濟適用房再到保險。以下是今年iOi峰會上最矚目的幾個創(chuàng)意。
機器學習
目前,AI正在幕后徹底改變行業(yè)收集和分析數(shù)據(jù)的過程,房地產行業(yè)也不例外。算法可以在幾秒鐘內瀏覽數(shù)百萬份公共文檔,查看房產價值、債務水平和房屋翻新情況,以使購房者與正確的房屋和抵押最匹配。借助機器學習,數(shù)字平臺上許多信息列表的收集和監(jiān)控數(shù)據(jù)比以往任何時候都更有效率。
僅憑照片,像亞馬遜Rekognition這樣的自動圖像分析就可以提取和組織有關房產的信息,例如壁爐、游泳池或法式門的數(shù)據(jù),這些數(shù)據(jù)可以用來了解消費者趨勢或對在線物品進行最佳排序。對于購房者來說,這意味著更準確、更專業(yè)的搜索。
除了數(shù)據(jù)提取外,這些圖像和視頻分析服務還可以檢測和調節(jié)平臺不需要的內容,為在線平臺提供內容調節(jié)工具,這些工具對于以用戶生成內容為特色的房地產平臺而言至關重要。此外,在AI的支持下,房產抵押處理也可以變得更快更容易,AI可以立即檢測錯誤并驗證信息以防止欺詐。
數(shù)字孿生
正如許多經(jīng)紀人所言,讓客戶走進房子,自己環(huán)顧四周,房產交易的成交就已經(jīng)完成了一半。現(xiàn)在,隨著VR技術的進步,購房者無需走進門就能看到房子。
由于疫情封控和社交距離的拉大,對房產的虛擬內容的需求仍然是商業(yè)和住宅開發(fā)商和經(jīng)紀人的優(yōu)先事項,他們才剛剛開始發(fā)掘這項新興技術的潛力。
通過分析用戶如何與不同種類的列表交互,算法可以創(chuàng)建專門的…[+]搜索。
題圖所示的令人身臨其境的3D模型被稱為數(shù)字孿生,可以讓購房者與包括期房在內的房產進行互動。雖然這一概念并不新鮮,但最近的技術進步是顯著的,先進的數(shù)字孿生技術比以往任何時候都更容易獲得和令人負擔得起。
像3D媒體初創(chuàng)公司Matterport這樣的公司正在將產品推向市場,使各種規(guī)模的房產經(jīng)紀公司都能利用這項日益流行的技術,其產品包括3D掃描和360度攝像頭以及支持手機3D掃描的電動支架。
隨著虛擬現(xiàn)實技術的發(fā)展,買家可以從世界任何地方觀看房產。而對于開發(fā)商來說,數(shù)字孿生可以提供最具成本效益和生態(tài)友好的施工方法,并可以早期發(fā)現(xiàn)以前無法預見的問題。
本文節(jié)選自外媒Virtual Reality Insider相關稿件。
據(jù)VentureBeat報道,美國AI/機器學習電子競技游戲初創(chuàng)公司Regression Games完成了由New Enterprise Associates(NEA)領投,Andreessen Horowitz、BBQ Capital、Roosh Ventures以及天使投資人參投的420萬美元融資,該筆資金將用于開發(fā)結合了AI與機器學習技術的電競游戲。
大多數(shù) AI 游戲所體現(xiàn)的AI角色均為非玩家操作的NPC,屬于電腦控制的“炮灰”,以供玩家體驗刷怪娛樂,而在元宇宙概念火熱的當下,構成元宇宙基礎技術之一的AI及機器學習,同樣也被應用于開發(fā)新型游戲。

Regression Games創(chuàng)始人Aaron Vontell表示:“我一直對人工智能、機器學習和電子競技充滿熱情,我們正在創(chuàng)建一個新生態(tài)系統(tǒng),玩家在其中娛樂的同時還能與人工智能互相競爭,因此,這意味玩家并不是死板的使用控制器或鍵盤進行游戲,而是創(chuàng)建基于代碼以實際控制的人工智能角色。我們旨在將這種全新、令人興奮的技術引入游戲,從而使玩家深入了解AI游戲。”
Vontell計劃與現(xiàn)有游戲工作室合作,并基于新資金壯大開發(fā)團隊、加速測試支持AI游戲的初始平臺的開發(fā)。與傳統(tǒng)采用控制器或鼠標、鍵盤的游戲方式不同,Regression Games還支持玩家編寫算法和機器學習模型與其他玩家展開對戰(zhàn)。
Regression Games表示,全球有超過32億游戲玩家,而美國有175個大學電子競技項目,超過47%的美國高中開設了計算機科學課程,這使得游戲和代碼的交匯點有望在未來幾年快速增長。到2028年,游戲行業(yè)規(guī)模將超過4350億美元,到2030年游戲程序員將達到4500萬名。
據(jù)UploadVR報道,Meta研究人員正通過先進的機器學習技術打造“Codec Avatars 2.0”。
Facebook(Meta)在2019年3月首次展示了“Codec Avatars”,其由多個神經(jīng)網(wǎng)絡提供支持,基于171個攝像頭捕獲生成,生成之后,“Codec Avatars”將由一個配置了5個攝像頭的原型VR頭顯實時驅動(其中2個攝像頭用于內部觀察、3個攝像頭觀察外部),而隨著版本迭代,研究人員陸續(xù)展示了該系統(tǒng)例如更逼真眼動追蹤以及支持麥克風的demo。
今年4月,在麻省理工學院“虛擬人與虛擬存在”研討會上,Codec Avatars團隊負責人Yaser Sheikh展示了該項目最新版本demo——“Codec Avatars 2.0”。
Sheikh表示:“我認為,未來十年的一個重大挑戰(zhàn)是,我們是否可以實現(xiàn)沉浸式遠程互動?”
去年發(fā)表的一篇論文中,Sheikh團隊聲稱,Codec Avatars最新模型將更小、效率更高,神經(jīng)網(wǎng)絡現(xiàn)在只計算頭顯可見的像素,有了這一進展,Quest 2頭顯將能以每秒50幀的速度在空場景中渲染5個虛擬化身。

不過,要到逼真級別的保真度,Meta研發(fā)團隊還有段路要走,如今的虛擬化身呈現(xiàn)卡通形象,非常適配于「Horizon Worlds」等大型VR社交應用環(huán)境。
可以預見的是,Codec Avatars將會演變?yōu)榭蛇x選項,而不是最終的卡通化身形象,在接受Lex Fridman采訪時,扎克伯格描述了這樣一個未來:用戶可以在休閑游戲中使用“表現(xiàn)主義”虛擬化身,而在工作會議中使用“現(xiàn)實主義”虛擬化身。

值得一提的是,研討會期間,Sheikh指出,無法預測Codec Avatars最終形態(tài)的誕生預期,不過,Sheikh相信Codec Avatars是公司項目的“奇跡之光”。
據(jù)外媒VRScout報道,近日美國智能樂器廠商Artiphon發(fā)布了旗下首款Snapchat透鏡Scan Band。
Scan Band結合了AR和機器學習功能,可將日常對象轉換為交互式虛擬儀器,借助Snap的Scan異物識別技術,Scan Band能掃描和識別現(xiàn)實世界中的物體,并將其轉換為“折紙風格”貼紙。根據(jù)Artiphon的說法,可掃描的物體包括了植物、寵物、食物碎片在內的各類隨機物體。
Artiphon表示:“Scan Band支持用戶創(chuàng)作各類創(chuàng)意音樂視頻,通過該透鏡,用戶可以掃描一個橙子,然后像彈吉他一樣彈奏它,只要你愿意,氣球及香蕉都能變成虛擬合成樂器,從簡單的觸屏交互到編排音樂,Scan Band賦予了用戶極大的音樂想象力?!?/p>
Scan Band是首批使用Snap全新AudioML技術的Snap透鏡之一,這使得Artiphon可以推出基于該技術的專業(yè)音樂ML模型。
Scan Band透鏡已在2021 Snap合作伙伴峰會上亮相,而近來Snap也是好消息不斷,不僅推出了Connected Lenses(一種新型透鏡,支持用戶在本地或遠程與其他用戶進行實時交互),日前Snap更發(fā)布了Spectacles AR智能眼鏡,這無疑助推了AR音樂技術的發(fā)展。
Artiphon創(chuàng)始人兼CEO Mike Butera博士表示:“過去幾年我們一直在秘密研究AR音樂技術,通過Scan Band我們可以向全球用戶展示我們的AR音樂創(chuàng)作理念,這使得普通用戶也可以借助Scan Band創(chuàng)作AR互動音樂,這將是一種顛覆傳統(tǒng)的全新音樂體驗?!?/p>