微軟公布了其Phi系列生成式AI模型的最新成員。
微軟聲稱,該模型名為Phi-4,在多個(gè)方面比其前代模型有所改進(jìn),尤其是在解決數(shù)學(xué)問(wèn)題方面;這在一定程度上得益于更好的訓(xùn)練數(shù)據(jù)質(zhì)量。
目前Phi-4僅在微軟最近推出的Azure AI Foundry開(kāi)發(fā)平臺(tái)上以非常有限的方式提供訪問(wèn),并且僅根據(jù)微軟研究許可協(xié)議用于研究目的。
這是微軟最新的小型語(yǔ)言模型,其參數(shù)大小為140億,其將與其他小型模型(如GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku)競(jìng)爭(zhēng)。這些較小的AI模型通常運(yùn)行速度更快、成本更低,而且性能在過(guò)去幾年中逐漸提高。
在這種情況下,微軟將Phi-4的性能飛躍歸因于使用“高質(zhì)量合成數(shù)據(jù)集”以及人類生成內(nèi)容的高質(zhì)量數(shù)據(jù)集,以及一些未指定的訓(xùn)練后改進(jìn)。
如今,許多人工智能實(shí)驗(yàn)室都在密切關(guān)注圍繞合成數(shù)據(jù)和后訓(xùn)練可以做出的創(chuàng)新。Scale AI首席執(zhí)行官Alexandr Wang表示,“我們已經(jīng)遇到了訓(xùn)練前數(shù)據(jù)瓶頸”,證實(shí)了過(guò)去幾周有關(guān)該主題的幾份報(bào)告。
值得注意的是,Phi-4是Sébastien Bubeck 離職后推出的首款Phi系列模型。Bubeck曾是微軟AI副總裁之一,也是該公司Phi模型開(kāi)發(fā)的關(guān)鍵人物,他于10月離開(kāi)公司加入OpenAI。