國(guó)內(nèi)首部AI中醫(yī)藥大模型評(píng)測(cè)團(tuán)體標(biāo)準(zhǔn)發(fā)布

?? 由 文心大模型 生成的文章摘要

據(jù)央視新聞報(bào)道,中國(guó)中醫(yī)科學(xué)院攜手中國(guó)信息通信研究院、中國(guó)科學(xué)院自動(dòng)化研究所等多家權(quán)威研究機(jī)構(gòu),共同公布了國(guó)內(nèi)首部AI中醫(yī)藥大模型評(píng)測(cè)團(tuán)體標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)的問世,猶如一顆璀璨的啟明星,為中醫(yī)藥大模型的發(fā)展照亮了前行的道路。?

在當(dāng)今數(shù)字化、智能化飛速發(fā)展的時(shí)代,中醫(yī)藥行業(yè)也在積極探索與人工智能技術(shù)的深度融合,中醫(yī)藥大模型應(yīng)運(yùn)而生。然而,在其蓬勃發(fā)展的過程中,如何科學(xué)、準(zhǔn)確地評(píng)估這些模型的性能與價(jià)值,成為了亟待解決的關(guān)鍵問題。此次發(fā)布的評(píng)測(cè)團(tuán)體標(biāo)準(zhǔn),正是為破解這一難題而精心打造的 “金鑰匙”。?

該標(biāo)準(zhǔn)覆蓋了場(chǎng)景豐富度、能力支持度、應(yīng)用成熟度三大能力域。在場(chǎng)景豐富度方面,全面考量中醫(yī)藥大模型在各類實(shí)際場(chǎng)景中的應(yīng)用廣度,從日常的中醫(yī)門診診療,到復(fù)雜的中醫(yī)住院治療流程,再到中醫(yī)藥科研實(shí)驗(yàn)場(chǎng)景等,確保模型能夠適應(yīng)多樣化的現(xiàn)實(shí)需求。能力支持度則聚焦于模型本身所具備的技術(shù)能力,例如其對(duì)海量中醫(yī)藥數(shù)據(jù)的處理與分析能力,能否精準(zhǔn)識(shí)別和理解中醫(yī)經(jīng)典文獻(xiàn)中的晦澀術(shù)語(yǔ),以及在模擬中醫(yī)辨證論治過程中的邏輯推理能力等。應(yīng)用成熟度維度主要評(píng)估模型在實(shí)際推廣應(yīng)用過程中的穩(wěn)定性、可靠性以及用戶體驗(yàn)等方面。?

針對(duì)中醫(yī)藥大模型技術(shù)適配性、功能實(shí)現(xiàn)能力和實(shí)際應(yīng)用價(jià)值這三個(gè)重要維度,標(biāo)準(zhǔn)進(jìn)行了深入且全面的綜合評(píng)價(jià)。在技術(shù)適配性上,檢測(cè)模型是否能與現(xiàn)有的中醫(yī)藥信息化系統(tǒng)無(wú)縫對(duì)接,是否能夠高效利用各類硬件資源等。功能實(shí)現(xiàn)能力方面,詳細(xì)考察模型在諸如名醫(yī)醫(yī)案挖掘、輔助診療、中藥生產(chǎn)加工優(yōu)化指導(dǎo)、個(gè)性化診療方案制定等關(guān)鍵功能上的實(shí)現(xiàn)效果。而實(shí)際應(yīng)用價(jià)值,則通過觀察模型在醫(yī)療機(jī)構(gòu)、科研單位等實(shí)際場(chǎng)景中應(yīng)用后所帶來(lái)的效益提升、成本降低等指標(biāo)來(lái)衡量。

為了更細(xì)致、精準(zhǔn)地進(jìn)行評(píng)價(jià),標(biāo)準(zhǔn)進(jìn)一步設(shè)置了中醫(yī)臨床診療、中醫(yī)教育、中藥研究等13個(gè)能力子域。以中醫(yī)臨床診療為例,細(xì)分為疾病診斷輔助、方劑推薦、療效預(yù)測(cè)等具體能力項(xiàng);中醫(yī)教育領(lǐng)域涵蓋了智能教學(xué)輔助、學(xué)生學(xué)習(xí)效果評(píng)估等能力項(xiàng);中藥研究方面則包括中藥成分分析、新藥研發(fā)輔助等能力項(xiàng),總計(jì)30余個(gè)能力項(xiàng)。通過對(duì)這些能力項(xiàng)的逐一評(píng)測(cè),能夠全方位、深層次地剖析中醫(yī)藥大模型的優(yōu)勢(shì)與不足,為其持續(xù)優(yōu)化提供科學(xué)依據(jù)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」