Cerence AI擴大與英偉達在CaLLM系列語言模型方面的合作

?? 由 文心大模型 生成的文章摘要

Cerence宣布與英偉達擴大合作,以提升CaLLM系列語言模型功能,包括基于云的Cerence Automotive大型語言模型和CaLLM Edge嵌入式小型語言模型。

通過此次合作,CaLLM由端到端、云原生軟件平臺NVIDIA AI Enterprise提供支持,而CaLLM Edge的某些方面則由NVIDIA DRIVE AGX Orin提供支持。

將代理框架與云端和嵌入式形式的車載對話相集成需要結(jié)合硬件、軟件和UX領(lǐng)域?qū)I(yè)知識的全面、跨學(xué)科努力。

與英偉達硬件和軟件工程師合作,Cerence AI增強了其滿足生產(chǎn)時間表和將汽車生成式AI創(chuàng)新產(chǎn)品化的能力。

具體而言,Cerence AI利用NVIDIA AI Enterprise軟件平臺(包括NVIDIA TensorRT-LLM和 NVIDIA NeMo,這是一個用于構(gòu)建、定制和部署生成式AI應(yīng)用的端到端框架)加速了CaLLM 的開發(fā)和部署。

因此,Cerence AI優(yōu)化并定制了其CaLLM系列模型,以在NVIDIA加速計算和SoC上提供更快的車載助手性能;開發(fā)針對汽車優(yōu)化的NVIDIA NeMo Guardrails實施,幫助確保由Cerence 提供支持的系統(tǒng)能夠處理車內(nèi)交互的細微差別;通過NVIDIA DRIVE AGX Orin在CaLLM Edge 上實施和優(yōu)化代理架構(gòu),以推進下一代車載用戶體驗。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」