數(shù)據(jù)質(zhì)量是人工智能生成優(yōu)質(zhì)內(nèi)容的關(guān)鍵

?? 由 文心大模型 生成的文章摘要

人工智能生成內(nèi)容(AIGC)的迅速崛起,正在重塑中國乃至全球的數(shù)字經(jīng)濟(jì)格局。在生成模型、自然語言處理和深度學(xué)習(xí)等人工智能技術(shù)取得突破的推動下,AIGC正在徹底變革內(nèi)容的生產(chǎn)與消費(fèi)方式。

在中國,得益于政府與私營部門的共同努力,人工智能和移動互聯(lián)網(wǎng)以前所未有的速度蓬勃發(fā)展。根據(jù)中國信息通信研究院的一份報告,到今年年底,中國數(shù)字經(jīng)濟(jì)市場價值很可能超過60萬億元人民幣。在一定程度上,人工智能和移動互聯(lián)網(wǎng)的發(fā)展推動了這一增長。

處于這場變革前沿的中國科技巨頭,如百度、阿里巴巴和騰訊,正在大力投資人工智能內(nèi)容生成應(yīng)用,這些應(yīng)用廣泛用于電子商務(wù)、媒體和教育等行業(yè)。市場營銷、娛樂和客戶服務(wù)等領(lǐng)域?qū)ψ詣踊瘍?nèi)容創(chuàng)作的需求日益增長,推動了這一行業(yè)的快速發(fā)展。然而,這種增長也帶來了諸多挑戰(zhàn),尤其是在內(nèi)容真實性、知識產(chǎn)權(quán)以及建立健全監(jiān)管框架以解決這些問題等方面。

AIGC發(fā)展過程中面臨的一個關(guān)鍵挑戰(zhàn),在于這些系統(tǒng)所依賴的數(shù)據(jù)質(zhì)量。盡管AIGC背后的算法和計算能力令人矚目,但這些系統(tǒng)的有效性歸根結(jié)底取決于其處理的數(shù)據(jù)。因此,數(shù)據(jù)質(zhì)量管理(DQM)變得至關(guān)重要。低質(zhì)量的數(shù)據(jù)可能會導(dǎo)致不準(zhǔn)確的結(jié)果,這在醫(yī)療保健和社會服務(wù)等敏感行業(yè)中尤為棘手。一個典型案例凸顯了低質(zhì)量數(shù)據(jù)的危害,即谷歌的流感趨勢模型。2013年2月,由于數(shù)據(jù)問題,該模型預(yù)測的流感樣疾病就診比例,比官方估計值高出一倍多。

AIGC的數(shù)據(jù)質(zhì)量問題不容忽視。人工智能系統(tǒng)有時會生成 “幻覺內(nèi)容”,即虛假或編造的內(nèi)容,這引發(fā)了人們對錯誤信息的擔(dān)憂。OpenAI在2023 年發(fā)布的一份報告顯示,其人工智能文本檢測器能夠正確識別出26%的人工智能生成文本為 “可能由人工智能撰寫”。

此外,德勤2024年的報告強(qiáng)調(diào),超過50%的組織表示,在其環(huán)境、社會和治理(ESG)報告的數(shù)據(jù)質(zhì)量方面面臨重大挑戰(zhàn)。這可能會影響決策所依據(jù)數(shù)據(jù)的可靠性,并可能導(dǎo)致錯誤信息和假新聞傳播等問題。

應(yīng)對這些挑戰(zhàn)對于充分發(fā)揮AIGC的潛力至關(guān)重要。DQM的重要性怎么強(qiáng)調(diào)都不為過。在中國快速增長的數(shù)字經(jīng)濟(jì)中,DQM的作用是培養(yǎng)對AIGC技術(shù)信任的關(guān)鍵。高質(zhì)量的數(shù)據(jù)為可靠的見解和更好的決策奠定了基礎(chǔ),這對于各個行業(yè)采用AIGC至關(guān)重要。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」