Lambda是一家成立12年的舊金山公司,以向機器學習研究人員以及AI模型構(gòu)建者和訓練人員按需提供圖形處理單元(GPU)而聞名。
如今,該公司推出了Lambda Inference API (應(yīng)用程序編程接口),將其產(chǎn)品更進一步,該公司聲稱這是市場上同類服務(wù)中成本最低的。該API允許企業(yè)將AI模型和應(yīng)用程序部署到最終用戶的生產(chǎn)中,而無需擔心采購或維護計算。
此次發(fā)布補充了Lambda目前專注于提供用于訓練和微調(diào)機器學習模型的GPU集群的重點。
Lambda營收副總裁Robert Brooks表示:“我們的平臺完全垂直化,這意味著與OpenAI等其他供應(yīng)商相比,我們可以為最終用戶節(jié)省大量成本。此外,沒有任何速率限制會阻礙擴展,無需與銷售人員交談即可開始使用?!?/p>
事實上,正如Robert所描述,開發(fā)者可前往Lambda新推理API網(wǎng)頁,生成API密鑰,并在不到五分鐘的時間內(nèi)開始使用。
Lambda推理API支持Meta Llama 3.3和3.1、Nous Hermes-3和阿里通義千問2.5等前沿模型。對于較小的模型(例如Llama-3.2-3B-Instruct),起價為每百萬個代幣0.02美元,而對于較大的、最先進的模型(例如Llama 3.1-405B-Instruct),則最高價格為每百萬個代幣0.90美元。
正如Lambda聯(lián)合創(chuàng)始人兼首席執(zhí)行官Stephen Balaban所說,“開始使用Lambda進行LLM推理吧?!盉alaban發(fā)布了一張圖表,顯示了其與該領(lǐng)域競爭對手相比,通過推理提供AI模型的每代幣成本。
此外,與許多其他服務(wù)不同,Lambda即用即付模式確保客戶只需為使用的代幣付費,從而無需訂閱或限速計劃。