Cohere產(chǎn)品的特點(diǎn)是高性能,高安全性,多云適應(yīng)性和數(shù)據(jù)可控性,這些特性正好解決目前商業(yè)客戶(hù)對(duì)于AI的普遍擔(dān)心,也是他們能夠與OpenAI等差異化競(jìng)爭(zhēng)的關(guān)鍵。
編者按:本文來(lái)自微信公眾號(hào) 阿爾法公社(ID:alphastartups),創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載
不久前,由Aidan Gomez、Ivan Zhang和Nick Frosst于2019年創(chuàng)立的Cohere獲得NVIDIA、Oracle、Salesforce Ventures等投資的2.7億美元新融資,成為20億美元獨(dú)角獸,也是基礎(chǔ)大模型領(lǐng)域排名第三的公司(前兩位是OpenAI和Anthropic)。
(相關(guān)資料圖)
Aidan Gomez分別在多倫多大學(xué)(本科)和牛津大學(xué)(博士)學(xué)習(xí),他還是谷歌的學(xué)生研究者時(shí)就是《Attention Is All You Need》這篇大模型奠基性論文的主要作者之一。
Cohere專(zhuān)注為企業(yè)客戶(hù)提供文本搜索、文本分類(lèi)和文本生成等于大模型的AI能力。他們產(chǎn)品的特點(diǎn)是高性能,高安全性,多云適應(yīng)性和數(shù)據(jù)可控性,這些特性正好解決目前商業(yè)客戶(hù)對(duì)于AI的普遍擔(dān)心,也是他們能夠與OpenAI等差異化競(jìng)爭(zhēng)的關(guān)鍵。
近日,Cohere的創(chuàng)始人Aidan Gomez和總裁Martin Kon(前Google/YouTube高管,管理過(guò)數(shù)十億美元的業(yè)務(wù),2022年加入Cohere)接受了媒體采訪,他們不僅聊了對(duì)融資背后的考量,堅(jiān)持多云適應(yīng)性的思考,還以創(chuàng)業(yè)視角分享了對(duì)大語(yǔ)言模型的幻覺(jué),閉源與開(kāi)源,以及大語(yǔ)言模型使用工具等話題的洞見(jiàn),對(duì)于在大語(yǔ)言模型領(lǐng)域的創(chuàng)業(yè)者是很好的參考。
用多云適應(yīng)保證獨(dú)立地位,明智的融資策略問(wèn):今年二月,Aidan和我聊到Cohere一直保持低調(diào)。由于新的融資,你覺(jué)得這種情況現(xiàn)在完全改變了嗎?
Aidan Gomez:我認(rèn)為我們正在取得進(jìn)步,但我仍然覺(jué)得我們非常低調(diào)。我們?cè)谀承┤ψ永锖艹雒?,但在廣泛意義上,我們還有很多工作要做。我們?nèi)栽谂χv述我們的故事,讓人們了解核心模型,以及我們適合的部署場(chǎng)景,即數(shù)據(jù)私密和多云適應(yīng)性。
Martin Kon:我同意Aidan的看法。我認(rèn)為我們上一輪融資是一個(gè)很好的證明點(diǎn),展示了世界上最受尊敬的企業(yè)如何看待我們,以及他們多么想支持像Cohere這樣的獨(dú)立、多云適應(yīng)性、擁有最先進(jìn)LLM的公司,無(wú)論是在財(cái)務(wù)上還是作為合作伙伴。這不是一個(gè)聲明,而是在市場(chǎng)上得到證實(shí);但在普及意識(shí)方面仍有很多工作要做。
問(wèn):你們經(jīng)常談?wù)揅ohere是獨(dú)立的、多云適應(yīng)的。這讓我想起NVIDIA,因?yàn)樗鼈兣c不同的云公司建立合作關(guān)系。你是這樣看的嗎?
Kon:我們確實(shí)是多云適應(yīng)的,當(dāng)然,NVIDIA的技術(shù)在所有云服務(wù)提供商上都可用。其中一些也有專(zhuān)有的芯片,但NVIDIA無(wú)疑是從計(jì)算角度來(lái)看比較靈活的選擇。所以,對(duì)我們來(lái)說(shuō),能夠在每個(gè)云環(huán)境中部署,并使用一種可以移動(dòng)的技術(shù)是很重要的。
Gomez:我們不受任何大型云服務(wù)提供商的控制,對(duì)于我們的客戶(hù)來(lái)說(shuō),這是一個(gè)關(guān)鍵的戰(zhàn)略?xún)?yōu)勢(shì)。很多大型企業(yè)都是多云的。即使他們是單一云服務(wù),他們也希望保留談判的能力。使用Cohere,你可以在云服務(wù)提供商之間切換,并同時(shí)在所有云服務(wù)上運(yùn)行Cohere模型。
問(wèn):你認(rèn)為對(duì)OpenAI來(lái)說(shuō),這是一個(gè)弱點(diǎn)嗎?如果客戶(hù)只能使用Azure,比如說(shuō)?
Kon:不同的企業(yè)會(huì)有不同的重要考慮因素。我們當(dāng)然從市場(chǎng)上聽(tīng)到了反饋——自從加入Cohere以來(lái),我已經(jīng)與超過(guò)100位高管和企業(yè)進(jìn)行了交談,以深入了解對(duì)他們來(lái)說(shuō)什么是重要的。他們中的很多人說(shuō)數(shù)據(jù)隱私、數(shù)據(jù)保護(hù)、在我們的安全環(huán)境中定制數(shù)據(jù)的能力,以及我們的數(shù)據(jù)駐留要求、數(shù)據(jù)保護(hù)要求、訪問(wèn)和權(quán)利要求,這些似乎非常非常重要。因此,我們選擇的方向似乎是肥沃的土地。
問(wèn):Cohere的投資者名單越來(lái)越長(zhǎng),從Oracle和NVIDIA到Salesforce和風(fēng)險(xiǎn)投資公司,以及像Geoffrey Hinton和Fei-Fei Li這樣的研究人員。這種多樣性有多重要?
Gomez:我認(rèn)為這對(duì)Cohere來(lái)說(shuō)是一個(gè)巨大的資產(chǎn)。在最新的融資中,我們的整個(gè)目標(biāo)是聚集一群國(guó)際性的戰(zhàn)略和機(jī)構(gòu)投資者來(lái)支持我們現(xiàn)在和未來(lái)的發(fā)展。我認(rèn)為這是非常特殊和獨(dú)特的。沒(méi)有很多公司能夠在戰(zhàn)略和機(jī)構(gòu)方面匯集一群國(guó)際投資者。在我們的領(lǐng)域,你會(huì)看到很多大型戰(zhàn)略單一玩家的投資,比如一個(gè)大型公司實(shí)體在一家大型語(yǔ)言模型公司背后投入一些資金。我們明確地想要避免這種情況,創(chuàng)造一種對(duì)我們的未來(lái)更加財(cái)務(wù)健康的東西。
問(wèn):彭博社前幾天報(bào)道說(shuō)Cohere正在談判籌集更多資金。你能透露一些關(guān)于增加投資者范圍的信息嗎?
Kon:我很驚訝已經(jīng)有傳言出現(xiàn)。我還沒(méi)有讀到那篇文章。但我們不對(duì)猜測(cè)發(fā)表評(píng)論。正如Aidan所說(shuō),我認(rèn)為我們的主要投資者不僅通過(guò)投資獲得回報(bào),而且他們投資以真正支持這種獨(dú)立的提供商。我認(rèn)為這些公司非常關(guān)注安全性。例如,Oracle一直非常關(guān)注安全性,我們?cè)跀?shù)據(jù)保護(hù)方面有很多共同的優(yōu)先事項(xiàng)。我們很高興找到這樣的合作伙伴,希望向市場(chǎng)發(fā)出信號(hào),展示他們對(duì)我們的方法的信任。
怎么幫助商業(yè)客戶(hù)理解和控制大模型的風(fēng)險(xiǎn)問(wèn):Aidan,鑒于你和Cohere聯(lián)合創(chuàng)始人Nick Frosst都來(lái)自Google Brain,而Geoffrey Hinton是你們的投資者名單之一,你對(duì)他最近關(guān)于AI風(fēng)險(xiǎn)和離開(kāi)Google Brain的評(píng)論有什么看法?
Gomez:我喜歡Geoff。我認(rèn)為他是全球AI和深度學(xué)習(xí)的專(zhuān)家。所以我非常尊重他的想法和意見(jiàn),并且非常認(rèn)真地對(duì)待他們。當(dāng)Geoff講話時(shí),我會(huì)傾聽(tīng)。話雖如此,我們?cè)谶@項(xiàng)技術(shù)的風(fēng)險(xiǎn)概況上確實(shí)有不同的看法。我認(rèn)為他更關(guān)注對(duì)人類(lèi)的風(fēng)險(xiǎn),或者有些人稱(chēng)之為x風(fēng)險(xiǎn),或者是生存風(fēng)險(xiǎn)。我認(rèn)為這些風(fēng)險(xiǎn)的優(yōu)先級(jí)低于另一類(lèi)風(fēng)險(xiǎn),即更近期或中期的風(fēng)險(xiǎn),比如合成媒體和虛假信息的傳播。像在風(fēng)險(xiǎn)過(guò)高的情況下部署這些模型的風(fēng)險(xiǎn)。我的關(guān)注點(diǎn)更傾向于那些實(shí)際的風(fēng)險(xiǎn),而不是假設(shè)性的未來(lái)風(fēng)險(xiǎn)。
與此同時(shí),我們需要人們關(guān)注風(fēng)險(xiǎn)的各個(gè)方面。我認(rèn)為Geoff引起人們對(duì)這一方面的關(guān)注是很好的。我希望人們能花更多的時(shí)間關(guān)注那些更實(shí)際、更現(xiàn)實(shí)的風(fēng)險(xiǎn),而且坦白說(shuō),這些風(fēng)險(xiǎn)對(duì)政策制定者和公眾更相關(guān)。
問(wèn):關(guān)于這個(gè)問(wèn)題,我對(duì)一項(xiàng)調(diào)查研究感到驚訝,該研究稱(chēng)大約42%的首席執(zhí)行官實(shí)際上相信AI可能在未來(lái)10年內(nèi)導(dǎo)致人類(lèi)滅絕。你在公司與人們交談時(shí)聽(tīng)到過(guò)這種說(shuō)法嗎?
Kon:我從未聽(tīng)說(shuō)過(guò)。我認(rèn)為我們一直在與他們交談的高管們是有擔(dān)憂的,但他們關(guān)心的是Aidan剛剛提到的一些問(wèn)題,以及像偏見(jiàn)這樣的問(wèn)題。如果你看一下Sara Hooker(她領(lǐng)導(dǎo)Cohere的AI研究小組)和她的團(tuán)隊(duì)所關(guān)注的所有內(nèi)容,以及她召集并匯集的全球數(shù)百名研究人員的網(wǎng)絡(luò),這些都是現(xiàn)在正在發(fā)生的風(fēng)險(xiǎn),這些系統(tǒng)現(xiàn)在正在部署。
問(wèn):我對(duì)像幻覺(jué)和偏見(jiàn)這樣的問(wèn)題感到好奇,這些問(wèn)題現(xiàn)在正處于新聞的焦點(diǎn)。你如何向客戶(hù)解釋?zhuān)梢钥刂苹蛱幚泶笮驼Z(yǔ)言模型中的這些問(wèn)題?
Gomez:我認(rèn)為這是一個(gè)教育項(xiàng)目,我們當(dāng)然正在努力推動(dòng)任何向我們?cè)儐?wèn)LLM應(yīng)用程序想法的客戶(hù)。你試著談?wù)摍C(jī)會(huì),這項(xiàng)技術(shù)有很多方面做得非常出色。但是有些地方不適合部署。因此,你只需要教育客戶(hù)了解這一點(diǎn)——讓他們了解失敗模式可能是什么樣的,以及他們可以在他們那邊實(shí)施的系統(tǒng)和流程來(lái)減輕這種情況,比如不斷對(duì)模型進(jìn)行基準(zhǔn)測(cè)試和評(píng)估。
我們每周都會(huì)發(fā)布一個(gè)新的模型版本。我們不希望客戶(hù)采用一些可能會(huì)讓他們的用戶(hù)體驗(yàn)變差,或者以他們不希望的方式提高風(fēng)險(xiǎn)的東西。因此,我們教育他們?cè)谧约哼@邊建立測(cè)試集,不斷評(píng)估模型的每個(gè)新版本,并做出決定:我是否要接受這個(gè)新模型并將其推向生產(chǎn)?還是我這周想要等一等?此外,我們還一直在傾聽(tīng)客戶(hù)的聲音。因此,如果他們觀察到某種漂移或某種行為變化,對(duì)他們的體驗(yàn)產(chǎn)生負(fù)面影響,我們會(huì)立即著手診斷為什么會(huì)發(fā)生這種情況,我們這邊發(fā)生了什么變化,導(dǎo)致他們那邊發(fā)生了變化。
大模型將對(duì)工作流帶來(lái)什么影響?問(wèn):你怎么看大語(yǔ)言模型(LLMs)直接使用軟件或工具這件事,它會(huì)對(duì)工作流帶來(lái)什么影響?
Gomez:雖然LLMs在2年內(nèi)能夠使用像Excel這樣的應(yīng)用程序的可能性越來(lái)越大,但“仍然需要進(jìn)行一系列的完善。我們將擁有第一代可以使用工具的模型,這些模型將是引人注目但脆弱的。最終,我們將得到夢(mèng)想中的系統(tǒng),我們可以給模型提供任何軟件,并附上一些描述,比如‘這個(gè)工具是用來(lái)做什么的,你應(yīng)該怎樣使用它’,然后它就能夠使用它。一旦我們能夠用特定和通用的工具增強(qiáng)LLMs,它解鎖的自動(dòng)化類(lèi)型將是我們領(lǐng)域的瑰寶。”
問(wèn):關(guān)于企業(yè)使用開(kāi)源模型在自己的數(shù)據(jù)上實(shí)施模型與使用像Cohere這樣的東西,你對(duì)整個(gè)辯論有什么看法?
Gomez:我的看法是開(kāi)源非常棒。我認(rèn)為他們?cè)诩夹g(shù)上取得了很大進(jìn)步。話雖如此,開(kāi)源和我們的模型之間仍然存在差距。而且,這些模型從來(lái)不是靜態(tài)的。就像我剛才說(shuō)的,我們每周都在發(fā)布,隨著時(shí)間的推移,會(huì)有持續(xù)的改進(jìn)。而對(duì)于開(kāi)源,一年內(nèi)可能會(huì)有幾次新模型的發(fā)布,這個(gè)模型可能有讓你使用它的許可,而另一個(gè)可能沒(méi)有。而且它們?cè)谟?xùn)練數(shù)據(jù)中可能有不同的偏差,使它們的性能在某種程度上偏向這個(gè)或那個(gè)。而使用Cohere,你得到的是在非??斓墓?jié)奏上影響我們模型方向的能力。因此,你將得到一種在你關(guān)心的任務(wù)上表現(xiàn)更好的東西,并且你實(shí)際上會(huì)對(duì)底層訓(xùn)練本身有一個(gè)可信的影響。所以,雖然我認(rèn)為開(kāi)源是非常棒的,但我仍然認(rèn)為企業(yè)提供了一個(gè)完全不同的價(jià)值主張。這就像是完全不同的產(chǎn)品。
問(wèn):你對(duì)那些說(shuō)像Cohere、OpenAI和Anthropic這樣的公司的LLM是一個(gè)黑盒子的人有什么看法,他們看不到你的訓(xùn)練數(shù)據(jù)或你在幕后做什么?
Gomez:我的意思是,我們盡量做到透明,但不泄露知識(shí)產(chǎn)權(quán)。對(duì)于我們的客戶(hù),每當(dāng)他們?cè)儐?wèn)我們的模型是如何工作的,我們會(huì)盡量提供信息。我們有一個(gè)非常強(qiáng)大的客戶(hù)支持團(tuán)隊(duì),可以回答任何問(wèn)題。我們也有一個(gè)非常強(qiáng)大的技術(shù)團(tuán)隊(duì),可以解釋我們的模型是如何工作的,以及我們是如何訓(xùn)練它們的。
但是,我認(rèn)為這是一個(gè)更廣泛的問(wèn)題,不僅僅是針對(duì)Cohere。這是一個(gè)整個(gè)行業(yè)的問(wèn)題,即如何在保護(hù)知識(shí)產(chǎn)權(quán)的同時(shí)提供透明度。我認(rèn)為,這是一個(gè)我們作為一個(gè)社區(qū)需要解決的問(wèn)題,而不僅僅是Cohere。
結(jié)尾Aidan Gomez是一位年少有為的非凡創(chuàng)業(yè)者。
在學(xué)術(shù)上,他是重要奠基性論文的作者,對(duì)大模型有非常透徹的理解,也具有技術(shù)的前瞻性。
在創(chuàng)業(yè)方面,他能夠很明智的根據(jù)公司的定位和需求選擇到NVIDIA、Oracle、Salesforce Ventures這樣的投資者(他的目標(biāo)是聚集一群國(guó)際性的戰(zhàn)略和機(jī)構(gòu)投資者來(lái)支持公司現(xiàn)在和未來(lái)的發(fā)展)。
他選擇了商用大模型的路線,避開(kāi)了與賽道前兩名OpenAI和Anthropic的競(jìng)爭(zhēng),并且很好的解決了商業(yè)客戶(hù)的需求(高性能,可定制化)和他們的擔(dān)心(數(shù)據(jù)可控性)。
他還能根據(jù)自己相對(duì)偏學(xué)術(shù)的背景,請(qǐng)到了Martin Kon(30年經(jīng)驗(yàn),待過(guò)咨詢(xún),管過(guò)數(shù)十億美元的大業(yè)務(wù))這樣經(jīng)驗(yàn)豐富的商業(yè)老手幫助他進(jìn)行商業(yè)的管理和開(kāi)拓。
回到中國(guó)的AI創(chuàng)業(yè),阿爾法公社認(rèn)為中國(guó)大模型拼算力不適合一般的創(chuàng)業(yè)者,懂人工智能的創(chuàng)業(yè)者機(jī)會(huì)很大(Aidan Gomez顯然屬于這一類(lèi))。因?yàn)椴挥脧淖罨A(chǔ)模型開(kāi)始蠻拼算力,比的是知識(shí)積累、團(tuán)隊(duì)工程能力和迭代速度。對(duì)淺表層產(chǎn)品創(chuàng)新,這類(lèi)創(chuàng)業(yè)者是降維打擊。
本文由阿爾法公社原創(chuàng)編譯自VentureBeat。


