微軟推出新生成式AI模型Phi-4

?? 由 文心大模型 生成的文章摘要

微軟公布了其Phi系列生成式AI模型的最新成員。

微軟聲稱,該模型名為Phi-4,在多個方面比其前代模型有所改進(jìn),尤其是在解決數(shù)學(xué)問題方面;這在一定程度上得益于更好的訓(xùn)練數(shù)據(jù)質(zhì)量。

目前Phi-4僅在微軟最近推出的Azure AI Foundry開發(fā)平臺上以非常有限的方式提供訪問,并且僅根據(jù)微軟研究許可協(xié)議用于研究目的。

這是微軟最新的小型語言模型,其參數(shù)大小為140億,其將與其他小型模型(如GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku)競爭。這些較小的AI模型通常運行速度更快、成本更低,而且性能在過去幾年中逐漸提高。

在這種情況下,微軟將Phi-4的性能飛躍歸因于使用“高質(zhì)量合成數(shù)據(jù)集”以及人類生成內(nèi)容的高質(zhì)量數(shù)據(jù)集,以及一些未指定的訓(xùn)練后改進(jìn)。

如今,許多人工智能實驗室都在密切關(guān)注圍繞合成數(shù)據(jù)和后訓(xùn)練可以做出的創(chuàng)新。Scale AI首席執(zhí)行官Alexandr Wang表示,“我們已經(jīng)遇到了訓(xùn)練前數(shù)據(jù)瓶頸”,證實了過去幾周有關(guān)該主題的幾份報告。

值得注意的是,Phi-4是Sébastien Bubeck 離職后推出的首款Phi系列模型。Bubeck曾是微軟AI副總裁之一,也是該公司Phi模型開發(fā)的關(guān)鍵人物,他于10月離開公司加入OpenAI。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」