AR眼鏡新突破:助力聽障人士與健聽人實(shí)現(xiàn)雙向溝通

?? 由 文心大模型 生成的文章摘要

近日,在央視頗具影響力的《贏在AI+》節(jié)目中,智音無礙科技創(chuàng)始人凌志鵬帶來了一項(xiàng)令人矚目的AR眼鏡新“玩法”,吸引了眾多目光,為聽障人士的溝通難題提供了創(chuàng)新性的解決方案。?

凌志鵬團(tuán)隊(duì)精心研發(fā)的知音AR眼鏡,集成了先進(jìn)的語音識(shí)別與反向手語識(shí)別技術(shù),猶如一座跨越無聲與有聲世界的橋梁,為聽障人士與健聽人之間的順暢交流帶來了曙光。當(dāng)聽障人士打手語時(shí),眼鏡能夠迅速捕捉手部動(dòng)作,通過內(nèi)置的智能算法和強(qiáng)大的AI大模型,將手語實(shí)時(shí)翻譯成語音,清晰地傳達(dá)給健聽人,讓他們能夠理解聽障人士想要表達(dá)的意思;而當(dāng)健聽人說話時(shí),眼鏡的語音識(shí)別功能即刻啟動(dòng),把聲音轉(zhuǎn)化為文字,直觀地顯示在鏡片上,幫助聽障人士獲取信息,從而實(shí)現(xiàn)了雙方之間雙向、多輪的復(fù)雜溝通,極大地提升了交流的效率和質(zhì)量。?

為了讓知音AR眼鏡達(dá)到如此出色的性能,智音無礙科技團(tuán)隊(duì)付出了巨大的努力。他們不辭辛勞,進(jìn)行了上千次的手語數(shù)據(jù)采集工作,深入到聽障群體中,記錄各種場(chǎng)景下的手語表達(dá),涵蓋了日常生活、工作交流、社交互動(dòng)等多個(gè)方面,積累了海量且豐富的數(shù)據(jù)資源。同時(shí),經(jīng)過無數(shù)次的大模型訓(xùn)練,不斷優(yōu)化算法,調(diào)整參數(shù),讓AI模型對(duì)手語和語音的理解與轉(zhuǎn)換能力日益精準(zhǔn),最終從零構(gòu)建出了知音聾啞人AI無障礙系統(tǒng),并配套研發(fā)出了這款具有劃時(shí)代意義的知音AR眼鏡。?

這款眼鏡搭載的語音識(shí)別功能,在具備市面上常見語音識(shí)別能力的基礎(chǔ)上,還實(shí)現(xiàn)了功能升級(jí),新增了提示詞敏感詞識(shí)別與聲源定位功能。想象一下,當(dāng)有人呼叫聽障人士姓名時(shí),佩戴的眼鏡會(huì)敏銳地捕捉到這一關(guān)鍵信息,突出顯示敏感點(diǎn),同時(shí)利用四個(gè)精心布局的麥克風(fēng)進(jìn)行聲場(chǎng)測(cè)試,如同擁有了“順風(fēng)耳”一般,能夠精準(zhǔn)判斷聲源位置,甚至還能進(jìn)一步識(shí)別音色特征,分辨出呼叫者是男是女、年長還是年幼等,為聽障人士提供更全面的聲音信息。此外,對(duì)于汽車鳴笛、鳥叫、流水等各類生活中常見的聲音,產(chǎn)品也別出心裁地用特定小符號(hào)代表其含義并顯示在眼鏡上,讓聽障人士能夠“看見”聲音,感知周圍豐富的環(huán)境音,更好地融入生活場(chǎng)景。?

而反向手語識(shí)別技術(shù)更是這款產(chǎn)品的一大突破性亮點(diǎn)。眼鏡上配備的廣角攝像頭,猶如一雙智能的眼睛,能夠高效捕捉聽障人士前方95度左右的手語動(dòng)作,將這些動(dòng)作信息迅速傳輸給AI大模型。AI大模型在接收到信息后,憑借強(qiáng)大的運(yùn)算和推斷能力,快速理解手語所表達(dá)的語義,并將其精準(zhǔn)翻譯成語音輸出。這一技術(shù)填補(bǔ)了國內(nèi)相關(guān)領(lǐng)域的技術(shù)空白,為聽障人士與健聽人之間的交流提供了前所未有的便利,讓雙方能夠更加自然、流暢地進(jìn)行溝通,極大地改善了聽障人士的社交體驗(yàn)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」