?? 由 文心大模型 生成的文章摘要

Whispr平臺有三個(gè)核心組件。第一個(gè)是Guide Builder,一個(gè)基于桌面的應(yīng)用程序,用于將標(biāo)準(zhǔn)操作程序(SOP),清單,手冊等從PDF和其他格式傳輸?shù)絎hispr系統(tǒng)。Whispr將這些文檔轉(zhuǎn)換為語音指導(dǎo),然后通過專用移動應(yīng)用程序?yàn)锳ndroid和iOS設(shè)備上的前線工作人員部署。
對于文本到語音(TTS)元素,Whispr使用Google的WaveNet合成語音,而其所有自動語音識別(ASR)都在設(shè)備上運(yùn)行,這意味著服務(wù)不需要互聯(lián)網(wǎng)。
雖然Whispr仍然處于萌芽階段,但看到它的語音指導(dǎo)平臺與基于視覺的技術(shù)(如增強(qiáng)現(xiàn)實(shí)眼鏡)相結(jié)合將會很有趣。
第三個(gè)關(guān)鍵組件是數(shù)據(jù)。隨著時(shí)間的推移,Whispr能夠更好地理解所詢問的問題,可以使用此數(shù)據(jù)來改進(jìn)指導(dǎo)和流程。
此外,Whispr最終將推出應(yīng)用程序編程接口(API),以便公司可以將其集成到自己的軟件中。這感覺它可能是該技術(shù)的更好用例,特別是對于那些可能更傾向于將語音指導(dǎo)智能集成到他們自己的現(xiàn)有應(yīng)用程序中的大公司。
我們已經(jīng)看到微軟如何使用遠(yuǎn)程協(xié)助等混合現(xiàn)實(shí)應(yīng)用程序,讓技術(shù)人員和專家遠(yuǎn)程查看前線工作人員可以看到的內(nèi)容并幫助他們解決遠(yuǎn)程的問題。通過觀察視覺數(shù)據(jù)和AI語音可以改善口頭指導(dǎo)。此外,Whispr正在研發(fā)其用于“感官數(shù)據(jù)收集”的AR頭顯的測試版。
【93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明及回鏈】
【93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明及回鏈】








