小米Mi – BRAG知識(shí)庫問答框架亮相,重構(gòu)知識(shí)處理范式

?? 由 文心大模型 生成的文章摘要

5月6日,小米官方對(duì)外詳細(xì)介紹了其自主研發(fā)的Mi – BRAG知識(shí)庫問答框架。該框架憑借獨(dú)特的四大核心技術(shù)體系,成功重構(gòu)知識(shí)處理范式,目前已在小愛同學(xué)的個(gè)人信息問答、汽車問答助手、商品問答等多個(gè)關(guān)鍵場(chǎng)景中實(shí)現(xiàn)落地應(yīng)用,為用戶帶來了全新的智能交互體驗(yàn)。?

在當(dāng)下人工智能領(lǐng)域,大模型(LLM)雖展現(xiàn)出強(qiáng)大的生成能力,但其知識(shí)更新成本高、對(duì)企業(yè)私有知識(shí)理解不足以及存在數(shù)據(jù)安全隱患等問題,也逐漸暴露出來。而檢索增強(qiáng)生成(RAG)技術(shù)的出現(xiàn),為這些困境提供了有效解決方案。小米正是敏銳捕捉到這一趨勢(shì),順勢(shì)推出Mi – BRAG框架。?

Mi – BRAG框架的四大核心技術(shù)體系亮點(diǎn)十足。其搭載的智能解析引擎,具備全格式兼容能力,能夠無損處理 PDF、Word、Excel 等十余種常見文檔格式,這為企業(yè)構(gòu)建統(tǒng)一知識(shí)庫奠定了堅(jiān)實(shí)基礎(chǔ),不同格式的文檔無需復(fù)雜轉(zhuǎn)換,即可被框架高效識(shí)別利用。在解析層面,它實(shí)現(xiàn)全模態(tài)解析,打破傳統(tǒng)僅局限于文本的桎梏,能夠精準(zhǔn)解析復(fù)雜圖片、表格以及圖文混排等多元信息,無論是產(chǎn)品的設(shè)計(jì)圖紙,還是包含數(shù)據(jù)的復(fù)雜表格,都能被準(zhǔn)確理解。同時(shí),該框架支持主流語言的文檔解析與交互問答,實(shí)現(xiàn)多語種問答,有效打破知識(shí)流通的語種壁壘,讓全球范圍內(nèi)不同語言背景的用戶都能順暢使用。

尤為值得一提的是,Mi – BRAG采用動(dòng)態(tài)溯源定位技術(shù),擁有細(xì)粒度溯源能力,對(duì)每個(gè)生成結(jié)果標(biāo)注原始文檔及引用位置,用戶可一鍵追溯信息源頭,構(gòu)建起可信知識(shí)生態(tài),確保信息的準(zhǔn)確性與可靠性。

在RAG基礎(chǔ)框架之上,Mi – BRAG有著諸多技術(shù)創(chuàng)新。在知識(shí)庫創(chuàng)建(B)環(huán)節(jié),實(shí)現(xiàn)跨模態(tài)的知識(shí)融合,并構(gòu)建 “金字塔型” 動(dòng)態(tài)知識(shí)體系,使知識(shí)結(jié)構(gòu)更加合理高效;知識(shí)檢索(R – A)階段,對(duì)用戶Query理解進(jìn)行增強(qiáng),實(shí)現(xiàn)多維語義增強(qiáng),讓檢索結(jié)果更貼合用戶需求;回復(fù)生成(G)部分,為知識(shí)注入場(chǎng)景定制模型,強(qiáng)化無關(guān)信息的拒答功能,同時(shí)具備精細(xì)化的溯源能力。?

第三方評(píng)測(cè)機(jī)構(gòu)SuperCLUE通過單文檔問答、多文檔問答及搜索問答三大典型場(chǎng)景對(duì)眾多產(chǎn)品進(jìn)行綜合評(píng)估。在 SuperCLUE – RAG 生成能力評(píng)測(cè)中,小米Mi – BRAG憑借在抗噪聲數(shù)據(jù)處理與信息整合方面創(chuàng)新的數(shù)據(jù)構(gòu)建方法,以及突破性的模型訓(xùn)練范式,成功登上榜首。在ASQA長(zhǎng)格式事實(shí)類數(shù)據(jù)集測(cè)試中,面對(duì)需綜合多份文件信息回答問題的挑戰(zhàn),Mi – BRAG在多文檔生成溯源準(zhǔn)召率方面表現(xiàn)出色,展現(xiàn)出強(qiáng)大的實(shí)力。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」