
國內(nèi)人工智能公司正在降低成本以創(chuàng)建具有競(jìng)爭(zhēng)力的模型。零一萬物和北京深度求索等初創(chuàng)公司通過采取一些策略來降低價(jià)格,例如專注于較小的數(shù)據(jù)集來訓(xùn)練人工智能模型,以及聘請(qǐng)?jiān)擃I(lǐng)域經(jīng)驗(yàn)豐富的計(jì)算機(jī)工程師。
阿里、百度和字節(jié)跳動(dòng)等大型科技集團(tuán)也展開了價(jià)格戰(zhàn),以降低模型“推理”成本(即調(diào)用大型語言模型生成響應(yīng)的價(jià)格),從而使價(jià)格下降了90%以上,僅為美國同行的一小部分。
零一萬物由前谷歌中國區(qū)總裁李開復(fù)領(lǐng)導(dǎo),該公司表示,通過構(gòu)建以較少數(shù)據(jù)量進(jìn)行訓(xùn)練、需要較少算力的模型并優(yōu)化硬件,公司已經(jīng)降低了模型推理成本。
李開復(fù)向英國《金融時(shí)報(bào)》表示:“中國的優(yōu)勢(shì)在于制造出真正價(jià)格實(shí)惠的推理引擎,然后讓其應(yīng)用廣泛傳播?!?/p>
本周,在加州大學(xué)伯克利分校發(fā)布的排名中,零一萬物的Yi-Lightning模型與x.AI的Grok-2在LLM公司中并列第三,但落后于OpenAI和谷歌。
評(píng)估基于用戶對(duì)不同模型對(duì)查詢答案的評(píng)分。字節(jié)跳動(dòng)、阿里和北京深度求索等其他中國公司也在LLM排名榜上名列前茅。
Yi-Lightning的推理成本為每百萬代幣14美分,而OpenAI的較小模型GPT o1-mini的推理成本為26美分。與此同時(shí),OpenAI規(guī)模更大的GPT 4o的推理成本為每百萬代幣4.40美元,用于生成響應(yīng)的代幣數(shù)量取決于查詢的復(fù)雜性。
李開復(fù)還表示,Yi-Lightning的“預(yù)訓(xùn)練”成本為300萬美元,初始模型訓(xùn)練之后可以針對(duì)不同用例進(jìn)行微調(diào)或定制。這只是OpenAI等公司對(duì)其大型模型所報(bào)成本的一小部分,他補(bǔ)充,其目標(biāo)不是擁有“最佳模型”,而是一個(gè)具有競(jìng)爭(zhēng)力的模型,開發(fā)者使用它來構(gòu)建應(yīng)用的成本“要低5到10倍”。
目前,零一萬物、北京深度求索、上海稀宇科技、上海階躍星辰等許多中國人工智能公司都采用了“專家模型”方法,這一策略首先由美國研究人員推廣。
該方法不是在從互聯(lián)網(wǎng)和其他來源抓取數(shù)據(jù)的龐大數(shù)據(jù)庫上一次性訓(xùn)練一個(gè)“密集模型”,而是結(jié)合了許多針對(duì)行業(yè)特定數(shù)據(jù)進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
研究人員認(rèn)為,專家模型方法是實(shí)現(xiàn)與密集模型相同智能水平但算力較低的關(guān)鍵方法。但這種方法更容易失敗,因?yàn)楣こ處煴仨殔f(xié)調(diào)多個(gè)“專家”的訓(xùn)練過程,而不是在一個(gè)模型中。
由于難以獲得穩(wěn)定充足的高端人工智能芯片供應(yīng),國內(nèi)人工智能企業(yè)在過去一年中一直在競(jìng)相開發(fā)最高質(zhì)量的數(shù)據(jù)集,以訓(xùn)練這些“專家”,旨在從競(jìng)爭(zhēng)中脫穎而出。
李表示,零一萬物的數(shù)據(jù)收集方法超越了傳統(tǒng)的互聯(lián)網(wǎng)抓取方法,包括掃描書籍和抓取通訊應(yīng)用微信上的文章,而這些在開放網(wǎng)絡(luò)上是無法訪問的。
他說,工程師對(duì)數(shù)據(jù)進(jìn)行標(biāo)記和排序“需要做很多吃力不討好的工作”,“中國的優(yōu)勢(shì)不在于在預(yù)算不受限制的情況下,進(jìn)行前所未有的突破性研究。中國模型的優(yōu)勢(shì)在于更好、更快、更可靠、更平價(jià)?!?/p>








