前OpenAI研究員Alexis Conneau已為一家初創(chuàng)公司籌集了4000萬(wàn)美元,該公司將構(gòu)建通過(guò)語(yǔ)音與人類進(jìn)行情感交流的人工智能模型。
Alexis Conneau向路透社表示,這家初創(chuàng)公司W(wǎng)aveForms AI由Andreessen Horowitz支持,估值2億美元。
Conneau參與開(kāi)發(fā)了GPT-4o模型上的語(yǔ)音模式功能,該模型于今年早些時(shí)候發(fā)布時(shí)展示了無(wú)延遲實(shí)時(shí)響應(yīng)以及處理中斷的能力——這兩者都是迄今為止AI語(yǔ)音助手尚未實(shí)現(xiàn)的真實(shí)對(duì)話的標(biāo)志。
在那次語(yǔ)音模式發(fā)布會(huì)結(jié)束后,OpenAI首席執(zhí)行官Sam Altman在社交媒體平臺(tái)X上發(fā)布了“她”這個(gè)詞,這似乎是指Spike Jonze于2013年執(zhí)導(dǎo)的同名電影,講述了一個(gè)男人愛(ài)上了他的人工智能助手(斯嘉麗·約翰遜配音)的故事。
OpenAI推出GPT-4o時(shí)引發(fā)了爭(zhēng)議,彼時(shí)斯嘉麗指責(zé)OpenAI在電影中侵權(quán)了她的聲音。OpenAI表示,該聲音不是約翰遜的模仿音,公司使用了不同的配音演員。
Conneau與WaveForms AI聯(lián)合創(chuàng)始人Coralie Lemaitre表示,這家初創(chuàng)公司將采用這筆資金訓(xùn)練新的音頻AI模型,以解決AI機(jī)器人的語(yǔ)音對(duì)話與人類難以區(qū)分的問(wèn)題。他補(bǔ)充,音頻是讓AI互動(dòng)“非常人性化”的關(guān)鍵。
Conneau表示,公司還計(jì)劃打造一款消費(fèi)軟件產(chǎn)品,專注于用戶與人工智能之間的情感聯(lián)系,“我們的想法是基于人工智能創(chuàng)造新的、更具沉浸感的體驗(yàn),讓人們感覺(jué)更愉快。目前有很多公司專注于超級(jí)智能,但不太關(guān)注人機(jī)交互的質(zhì)量?!?/p>