
Inflection AI宣布將其備受歡迎的Pi聊天機(jī)器人更新至2.5版。此次更新引入的全新模型,不僅延續(xù)了Pi聊天機(jī)器人卓越的情商表現(xiàn),在智力水平上更是實(shí)現(xiàn)了質(zhì)的飛躍,足以與行業(yè)內(nèi)的頂尖模型GPT-4和Gemini相抗衡。令人矚目的是,訓(xùn)練這一強(qiáng)大模型所需的計(jì)算代價(jià)僅為GPT-4的40%,這一突破性進(jìn)展為人工智能的發(fā)展開(kāi)辟了新的路徑。?
自2023年5月推出以來(lái),Pi聊天機(jī)器人憑借其獨(dú)特的同理心、實(shí)用性和安全性,迅速在用戶中積累了極高的人氣。去年11月推出的基礎(chǔ)模型Inflection-2,已然在當(dāng)時(shí)的大語(yǔ)言模型(LLM)領(lǐng)域中占據(jù)了領(lǐng)先地位。而此次推出的Inflection-2.5模型,更是將Pi的能力提升到了一個(gè)全新的高度。它融合了強(qiáng)大的基礎(chǔ)能力,能夠在各種復(fù)雜任務(wù)中表現(xiàn)出色,與GPT-4、Gemini等世界頂尖的LLM不相上下,同時(shí)還保留了Pi標(biāo)志性的個(gè)性化特點(diǎn)和獨(dú)特的同理心微調(diào),為用戶提供更加貼心、智能的交互體驗(yàn)。?
在性能測(cè)試中,Inflection-2.5展現(xiàn)出了令人驚嘆的實(shí)力。此前的Inflection-1模型僅使用了GPT-4訓(xùn)練計(jì)算量(FLOPs)的4%,就在多項(xiàng)以智力為核心的任務(wù)上達(dá)到了GPT-4水平的72%。而全新的Inflection-2.5,在僅使用GPT-440%訓(xùn)練FLOPs的情況下,平均性能超過(guò)了GPT-4的94%。尤其在科學(xué)、技術(shù)、工程和數(shù)學(xué)等STEM領(lǐng)域,Inflection-2.5的進(jìn)步尤為顯著。在MMLU基準(zhǔn)測(cè)試中,該模型相比Inflection-1有了巨大的提升;在極端困難的專家級(jí)基準(zhǔn)測(cè)試GPQADiamond中,Inflection-2.5也表現(xiàn)出色,在maj@8的評(píng)分標(biāo)準(zhǔn)下,其表現(xiàn)達(dá)到了所有參考人群的第85百分位,在maj@32的評(píng)分標(biāo)準(zhǔn)下,更是幾乎拿到了95百分位的高分。在BIG-Bench-Hard測(cè)試中,Inflection-2.5比初代Inflection-1提升了超過(guò)10%,與GPT-4的差距縮小至僅有0.9%。?
在實(shí)際應(yīng)用場(chǎng)景中,Pi聊天機(jī)器人的能力也得到了充分驗(yàn)證。隨著Inflection-2.5的上線,用戶與Pi的對(duì)話話題變得更加廣泛。他們不僅能夠與Pi討論最新的時(shí)事,獲取本地餐廳的推薦,還能借助Pi備考生物學(xué)考試、草擬商業(yè)計(jì)劃、進(jìn)行編程,甚至在準(zhǔn)備重要對(duì)話或分享興趣愛(ài)好時(shí),Pi都能提供有價(jià)值的建議和幫助。目前,Inflection每天擁有一百萬(wàn)活躍用戶,每月活躍用戶數(shù)更是高達(dá)六百萬(wàn)。這些用戶與Pi的互動(dòng)信息已經(jīng)超過(guò)了四十億條,平均對(duì)話時(shí)長(zhǎng)達(dá)到33分鐘,每天有十分之一的用戶與Pi的對(duì)話時(shí)長(zhǎng)超過(guò)一小時(shí)。每周約有60%的用戶在與Pi交流后,會(huì)在下周繼續(xù)回來(lái)與它對(duì)話,用戶粘性明顯高于其他競(jìng)品。








