英偉達(dá)宣布在NVIDIA RTX? AI PC上本地運(yùn)行基礎(chǔ)模型,可增強(qiáng)數(shù)字人類(lèi)、內(nèi)容創(chuàng)作、生產(chǎn)力和開(kāi)發(fā)能力。
這些模型以NVIDIA NIM?微服務(wù)的形式提供,由GeForce RTX? 50系列GPU加速,該GPU具有高達(dá)每秒3352萬(wàn)億次AI性能和32GB VRAM。RTX 50系列基于NVIDIA Blackwell架構(gòu)構(gòu)建,是首批增加對(duì)FP4計(jì)算支持的消費(fèi)級(jí)GPU,與上一代硬件相比,它將AI推理性能提高了2倍,并使生成式AI模型能夠在更小的內(nèi)存占用空間內(nèi)本地運(yùn)行。
GeForce?長(zhǎng)期以來(lái)一直是AI開(kāi)發(fā)人員的重要平臺(tái)。首個(gè)GPU加速深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet于 2012年在GeForce GTX? 580上進(jìn)行訓(xùn)練,去年,超30%的已發(fā)表AI研究論文引用了對(duì)GeForce RTX的使用。
現(xiàn)在,有了生成式AI和RTX AI PC,任何人都可以成為開(kāi)發(fā)者。AnythingLLM、ComfyUI、Langflow 和LM Studio等新一波低代碼和無(wú)代碼工具使愛(ài)好者能夠通過(guò)簡(jiǎn)單的圖形用戶界面在復(fù)雜的工作流程中使用AI模型。
連接到這些GUI的NIM微服務(wù)將使訪問(wèn)和部署最新的生成式AI模型變得輕而易舉。基于 NIM微服務(wù)構(gòu)建的NVIDIA AI Blueprints為數(shù)字人類(lèi)、內(nèi)容創(chuàng)建等提供了易于使用、預(yù)配置的參考工作流程。
而為了滿足AI開(kāi)發(fā)人員和愛(ài)好者日益增長(zhǎng)的需求,每家頂級(jí)PC制造商和系統(tǒng)制造商都在推出搭載GeForce RTX 50系列GPU的支持NIM RTX AI PC。
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“人工智能正以光速發(fā)展,從感知型人工智能到生成型人工智能,再到現(xiàn)在的代理型人工智能。NIM微服務(wù)和人工智能藍(lán)圖為PC開(kāi)發(fā)者和愛(ài)好者提供了探索人工智能魔力的構(gòu)建模塊。”
英偉達(dá)將發(fā)布由Black Forest Labs、Meta、Mistral和Stability AI等頂級(jí)模型開(kāi)發(fā)商為RTX AI PC 開(kāi)發(fā)的NIM微服務(wù)管道。用例涵蓋大型語(yǔ)言模型、視覺(jué)語(yǔ)言模型、圖像生成、語(yǔ)音、用于檢索增強(qiáng)生成的嵌入模型、PDF提取和計(jì)算機(jī)視覺(jué)。
Black Forest Labs首席執(zhí)行官Robin Rombach表示:“具有FP4算力的GeForce RTX 50系列GPU 將解鎖大量可在PC上運(yùn)行的模型,而這些模型以前僅限于大型數(shù)據(jù)中心。將FLUX打造為 NVIDIA NIM微服務(wù)可提高AI的部署速度,并讓更多用戶體驗(yàn)AI,同時(shí)提供令人難以置信的性能?!?/p>
生成式AI筆記本電腦和PC正推動(dòng)游戲、內(nèi)容創(chuàng)作、生產(chǎn)力和開(kāi)發(fā)的進(jìn)步。如今,全球已有超過(guò)600款Windows應(yīng)用和游戲在超過(guò)1億臺(tái)GeForce RTX AI PC上本地運(yùn)行AI,以提供快速可靠且低延遲的性能。
在Microsoft Ignite大會(huì)上,英偉達(dá)和微軟發(fā)布了助力Windows開(kāi)發(fā)者在RTX AI PC上快速構(gòu)建和優(yōu)化AI應(yīng)用的工具,讓本地AI更加易于訪問(wèn)。這些新工具使應(yīng)用和游戲開(kāi)發(fā)者能夠基于強(qiáng)大的RTX GPU來(lái)加速AI代理、應(yīng)用助手和數(shù)字角色等應(yīng)用的復(fù)雜AI工作流程。
NVIDIA ACE是一套數(shù)字人類(lèi)技術(shù),可讓代理、助手和虛擬化身栩栩如生。為了實(shí)現(xiàn)更高層次的理解,以便以更強(qiáng)的情境意識(shí)做出反應(yīng),數(shù)字角色必須能夠像人類(lèi)一樣以視覺(jué)方式感知世界。
要增強(qiáng)數(shù)字角色的互動(dòng),使其更加真實(shí),就需要一種更細(xì)致感知和理解周?chē)h(huán)境的技術(shù)。為了實(shí)現(xiàn)這一目標(biāo),英偉達(dá)開(kāi)發(fā)了多模式小型語(yǔ)言模型,該模型可處理文本和圖像,擅長(zhǎng)角色扮演,并針對(duì)快速響應(yīng)時(shí)間進(jìn)行了優(yōu)化。
即將推出的NVIDIA Nemovision-4B-Instruct模型使用最新NVIDIA VILA和NVIDIA NeMo框架進(jìn)行提煉、修剪和量化,使其變得足夠小,從而可在RTX GPU上以開(kāi)發(fā)者所需的精度運(yùn)行。
該模型使數(shù)字角色能理解現(xiàn)實(shí)世界和屏幕上的視覺(jué)圖像,從而做出相關(guān)反應(yīng)。多模態(tài)性是代理工作流程的基礎(chǔ),并讓我們看到了數(shù)字角色在用戶最少協(xié)助下推理和采取行動(dòng)的未來(lái)。
不僅如此,英偉達(dá)還將推出Mistral NeMo Minitron 128k Instruct系列,這是一套專為優(yōu)化、高效的數(shù)字人機(jī)交互而設(shè)計(jì)的大語(yǔ)境小語(yǔ)言模型。該系列模型有8B、4B和2B參數(shù)版本,可在RTX AI PC上提供靈活的選項(xiàng),以平衡速度、內(nèi)存使用量和準(zhǔn)確性;模型可一次性處理大型數(shù)據(jù)集,無(wú)需進(jìn)行數(shù)據(jù)分割和重組;模型采用GGUF格式構(gòu)建,可提高低功耗設(shè)備的效率,并支持與多種編程語(yǔ)言的兼容性。