
大型語言模型(LLM)供應(yīng)商已發(fā)展出獨特的超能力——這將導(dǎo)致2025年出現(xiàn)逐漸增加的差異化和競爭的等級制度。
2024年,大型模型競賽的關(guān)鍵在于與GPT-4相提并論。如今,有五家公司實現(xiàn)了這一目標(biāo)(或足夠接近),從而成為“決賽選手”:微軟/OpenAI、亞馬遜/Anthropic、谷歌、Meta和xAI。
為了達到GPT-4的質(zhì)量,這些公司采用了大致相同的策略:收集盡可能多的數(shù)據(jù),在盡可能多的GPU上進行訓(xùn)練,并改進訓(xùn)練前/訓(xùn)練后架構(gòu)以最大限度提高性能。隨著2024年人才在企業(yè)間流動,幾乎沒有商業(yè)秘密可言。
隨著每個參與者為下一輪LLM擴展做準(zhǔn)備(這很可能涉及計算規(guī)模的再次增加10倍),實驗室正在發(fā)展差異化的超級能力??梢哉f,已經(jīng)為未來的戰(zhàn)斗“選擇了武器”;到2025年,這些不同的策略應(yīng)該會導(dǎo)致截然不同的結(jié)果,一些參與者會領(lǐng)先,而另一些則會落后。
谷歌:谷歌在2025年的優(yōu)勢在于垂直整合。谷歌是唯一一家擁有一流芯片的廠商:TPU有機會在2025年與NVDA GPU一較高下。谷歌還建立了自己的數(shù)據(jù)中心,訓(xùn)練專屬模型,并擁有一支非常強大的內(nèi)部研究團隊。與分別與OpenAI和Anthropic合作的微軟和亞馬遜不同,谷歌通過擁有價值鏈的各部分以爭取勝利。
OpenAI:OpenAI在人工智能領(lǐng)域擁有最強大的品牌,這是毫無疑問的。這使其成為大型人工智能公司中最強大的收入引擎,據(jù)報道,OpenAI的收入超過36億美元。如果人工智能的成功最終取決于消費者的認知度和企業(yè)分銷,OpenAI可能會繼續(xù)擴大與競爭對手之間的差距。
Anthropic :2024年,OpenAI的研究人才大量外流,而Anthropic則迎來大量人才。隨著Jon Schulman、Durk Kingma和Jan Leike于2024年離開OpenAI加盟Anthropic,Anthropic的研究人才數(shù)量不斷增加。該公司還聘請了一些高管,包括Instagram聯(lián)合創(chuàng)始人Mike Kreiger擔(dān)任首席產(chǎn)品官。在GPT-3發(fā)明者Dario Amodei的領(lǐng)導(dǎo)下,Anthropic已成為人工智能科學(xué)家的首選目的地。
xAI:我們在“鋼鐵、服務(wù)器和電力”一文中寫到了數(shù)據(jù)中心建設(shè)對下一階段人工智能競賽的重要性。隨著xAI以創(chuàng)紀錄的速度推出10萬GPU Colossus集群,該公司現(xiàn)在已成為數(shù)據(jù)中心擴展的領(lǐng)跑者。xAI及其競爭對手的下一個里程碑將是20萬集群,然后是30萬集群。如果“規(guī)模就是一切”最終成為現(xiàn)實,那么xAI就完全有能力繼續(xù)快速崛起。
Meta: Meta已經(jīng)通過Instagram、WhatsApp和Facebook獲得了強大的分發(fā)優(yōu)勢,現(xiàn)在它選擇全力投入開源。Meta是該領(lǐng)域唯一一家采用這種方式的大型企業(yè)。Meta Llama模型擁有忠實的粉絲,而閉源與開源的爭論仍在繼續(xù)。如果前沿技術(shù)的發(fā)展開始放緩,Meta將能夠充分利用其開源模型來快速傳播這些功能。








