作者: 兆光科技 發(fā)布時間: 2024/08/09 點擊: 8007次
它會是ChatGPT的競争對(duì)手嗎?
“元宇宙的開(kāi)拓者” 是我們針對(duì)元宇宙的發(fā)展而設立的專欄,主要面(miàn)向(xiàng)那些深挖元宇宙産業或者在元宇宙進(jìn)行“淘金”的從業者,分享這(zhè)些企業或者創業者們的故事(shì),以獨特的視角窺見那些引領全球元宇宙發(fā)展的企業或個人,我們深信元宇宙的大幕已經(jīng)拉開(kāi),引領未來20年的科技互聯網已經(jīng)走上了時代浪潮。以下是我們的第36期内容,作爲加拿大的一家初創企業,Cohere何以突出重圍,斬獲衆多投資者的青睐?以下Enjoy。
随著(zhe)OpenAI推出ChatGPT在人工智能(néng)領域掀起(qǐ)的千層浪,生成(chéng)式AI開(kāi)始被(bèi)普羅大衆所熟知。 《日本經(jīng)濟新聞》在此前報道(dào)中指出, 全球100多家大規模生成(chéng)式AI企業總市值達480億美元,約爲2020年的6倍 ,OpenAI的确引領了市場對(duì)生成(chéng)式AI企業的投資熱潮。
實際上,除了OpenAI,AI的發(fā)展浪潮中還(hái)有Jasper、DeepMind、Stability、Cohere等競争者。5月3日,《紐約時報》報道(dào)稱,兩(liǎng)名知情人士透露Cohere已獲2.5億美元融資,估值約20億美元,投資者包括互聯網軟件巨頭Salesforce、芯片制造商Nvidia、多倫多風投公司Inovia Capital和矽谷公司Index Ventures。這(zhè)是自2022年ChatGPT發(fā)布後(hòu)在生成(chéng)式AI領域的最新重大投資。而此前,Cohere籌集的總資金已達1.7億美元,包括2022年由Tiger Global領投的1.25億美元B輪融資。
“百舸争流,奮楫者先;千帆競發(fā),勇進(jìn)者勝”。作爲加拿大的一家初創企業,Cohere何以突出重圍,斬獲衆多投資者的青睐?了解該企業的發(fā)展曆程、其産品區别于ChatGPT的獨特優勢後(hòu),相信我們會對(duì)投融資市場風向(xiàng)的選擇理由與生成(chéng)式AI的發(fā)展動向(xiàng)有所理解。
創立于2019年的Cohere是一家自然語言處理 (NLP) 公司,基于大型NLP模型爲外界提供API服務,從而提高計算機理解和生成(chéng)文本、閱讀和寫作的能(néng)力。該公司由艾丹·戈麥斯 (Aidan Gomez) 與兩(liǎng)個朋友Nick Frosst和Ivan Zhang一起(qǐ)創辦,它的總部位于加拿大多倫多,在美國(guó)舊金山、英國(guó)倫敦均設有辦事(shì)處。自合作以來,他們組建了一支約135人的團隊,目前還(hái)在繼續擴建以更好(hǎo)的提供相關API服務。
兩(liǎng)位聯合創始人Aidan Gomez和Nick Frosst曾擔任過(guò)谷歌研究員,其中Aidan Gomez是大名鼎鼎的《Attention Is All You Need》論文的作者之一。 該論文提出了一種(zhǒng)新的、被(bèi)譽爲ChatGPT的“祖師爺”的網絡架構“Transformer” ,ChatGPT通過(guò)Transformer模型進(jìn)行了序列建模,并通過(guò)自回歸方式進(jìn)行訓練,使得大語言模型能(néng)夠根據前文内容和當前輸入,生成(chéng)符合語法規則和語義邏輯的拟人化内容,這(zhè)使得國(guó)内外都(dōu)掀起(qǐ)了一波未平一波又起(qǐ)的大規模語言模型訓練的熱潮。
Cohere提供了與ChatGPT類似的産品,目前主要包括:搜索文本(多語言嵌入、神經(jīng)搜索、搜索排名)、分類文本和生成(chéng)文本三大類産品,幫助企業快速部署對(duì)話式AI聊天機器人、生成(chéng)式搜索引擎、文本摘要總結、增強向(xiàng)量搜索等,是爲數不多在技術層面(miàn)具備與OpenAI進(jìn)行競争的AI企業之一,這(zhè)也是其受到資本市場青睐的重要原因之一。
Cohere曾在2021年9月獲得4000萬美元A輪融資;2022年2月獲得1.25億美元B輪融資,投資者包括老虎環球基金、“AI教父” Geoffrey Hinton、斯坦福大學(xué)教授李飛飛、深度學(xué)習專家Pieter Abbeel等。在2022年10月,Cohere便開(kāi)始與谷歌、Salesforce、Nvidia進(jìn)行融資談判,如今,Cohere獲得巨額融資將(jiāng)繼續與OpenAI展開(kāi)激烈競争,繼續加快類似ChatGPT産品的技術創新和更新叠代。
實際上,在OpenAI發(fā)布GPT-4之後(hòu)的一段時間内,大部分人都(dōu)將(jiāng)目光聚焦于AI大模型,包括Anthropic、 AI21、 Cohere和Character.AI在内的衆多資金充足的初創公司都(dōu)在投入大量資源來構建更大的算法和模型,以期待努力趕上OpenAI的技術。
但就在AI競賽如火如荼開(kāi)展之時,OpenAI的首席執行官Sam Altman卻表示巨型AI模型的時代已結束,“未來新一步的進(jìn)化,將(jiāng)不會來自于巨型模型”。那同屬該領域的Cohere又爲何會獲得資本的青睐呢?
Cohere AI將(jiāng)其模型分爲兩(liǎng)類:生成(chéng)模型和嵌入模型。生成(chéng)模型通過(guò)對(duì)互聯網上大量的數據進(jìn)行訓練,而嵌入模型是多語言支持的,可以支持超過(guò)109種(zhǒng)語言。Cohere的模型有不同的規格,公司的指令模型每周都(dōu)在進(jìn)步,而同類領域的其他提供商通常要幾個月或甚至一年才會發(fā)布重要的模型更新。
盡管Cohere AI與谷歌合作獲取其硬件能(néng)力,但其并不僅限于Google Cloud。例如,Cohere在AWS SageMaker上運營,并計劃在其他雲服務提供商上提供服務。Cohere AI的方法非常開(kāi)放,并以客戶爲中心,他們通過(guò)在任何雲供應商上運行以使客戶獲得最佳體驗和服務。
相較于GPT-4,Cohere AI尚未采用多模态方法。Cohere AI的高級副總裁Saurabh Baji表示,“我認爲圖像和視頻非常令人興奮。但從商業角度來看,這(zhè)也是一個不同的問題。我們并不關注AGI,而是專注于客戶實際面(miàn)臨的問題。很多客戶的需求都(dōu)非常以語言爲中心。”
從AI競争格局的角度來看,Cohere AI和OpenAI都(dōu)是目前AI領域的重要參與者。雖然兩(liǎng)家公司都(dōu)專注于大型語言模型,但它們的重點和方法略有不同。OpenAI在一系列領域都(dōu)有所涉獵,包括自然語言處理、計算機視覺和強化學(xué)習等。此外,OpenAI也吸引了大量的資本,其中包括像微軟、谷歌和亞馬遜這(zhè)樣(yàng)的科技巨頭。
相比之下,Cohere AI專注于提供易于使用和部署的大型語言模型,爲企業客戶提供更好(hǎo)的商業解決方案。盡管Cohere AI在規模和影響力上與OpenAI存在一定的差距,但其在語言模型方面(miàn)的專注度和靈活性使其成(chéng)爲一個非常有前途的公司。
另外,在資本方面(miàn),Cohere AI也獲得了很多青睐。除了幾個知名風險投資公司的支持, 該公司還(hái)獲得了加拿大政府和Google等科技巨頭的支持 。這(zhè)些資金的注入有助于Cohere AI繼續擴展其業務和規模,并在AI市場上取得更大的份額。
總的來說,雖然Cohere AI和OpenAI在AI競争格局中處于不同的位置,但它們都(dōu)是這(zhè)個領域中非常有前途的公司。Cohere AI在語言模型方面(miàn)的專注度和靈活性使其成(chéng)爲一個與OpenAI進(jìn)行競争的關鍵因素之一,而資本的支持也給了Cohere AI更多的機會來發(fā)揮其潛力,并在市場上取得更大的份額。
大語言模型(Large Language Models,簡稱LLMs)是一類基于深度學(xué)習技術的自然語言處理(NLP)模型,它們具有大量的參數,并能(néng)夠理解和生成(chéng)人類語言。這(zhè)類模型通常采用神經(jīng)網絡架構,尤其是Transformer架構。
近期,一篇綜述論文《在實踐中利用大模型的力量》在AI學(xué)術圈爆火,而其中一張名爲“大預言模型進(jìn)化樹”的圖片引起(qǐ)了不小的轟動,其梳理了2018年到2023年的大預言模型代表作。
相較于Open AI不斷深耕至今走向(xiàng)AI的前沿,曾經(jīng)頗具影響力的谷歌BERT似乎從一開(kāi)始就走向(xiàng)了“岔路”。當我們以年爲單位看LLM發(fā)展史的時候,忍不住唏噓“在大模型沒(méi)有成(chéng)功之前,一切都(dōu)是場賭局”。
2017年的時候,谷歌研究員在《Attention is all you need》一文中介紹了Transformer架構——這(zhè)也是目前最常用到的架構之一,是BERT、GPT等預訓練模型的基礎。時至今日,Transformer架構仍是GPT模型的基礎架構。
Transformer架構的提出和預訓練的方法將(jiāng)大語言模型推向(xiàng)了新的階段——以谷歌爲首的科技大公司在2017年後(hòu)聚焦于研發(fā)能(néng)夠處理多種(zhǒng)自然語言任務的大模型。
2018年6月,OpenAI采用Transformer架構發(fā)布了它們的模型——GPT-1。緊接著(zhe),谷歌正式向(xiàng)世界介紹了全新預訓練模型——BERT。
時間來到2019年,微軟宣布與OpenAI達成(chéng)10億美金的合作。次年9月,OpenAI授權微軟使用GPT-3模型,微軟成(chéng)爲全球首個享用GPT-3能(néng)力的公司。
科技巨頭Meta當然也不甘示弱,于2022年推出有著(zhe)“開(kāi)源版本的GPT-3”之稱的OPT,并于今年推出能(néng)在單個GPU上運行的大語言模型LLaMA。
如今GPT-4也已發(fā)布, 更強的文本生成(chéng)能(néng)力與詳細的邏輯判斷能(néng)力讓OpenAI在四年内快速崛起(qǐ),并成(chéng)功“破圈”。
Cohere的聯合創始人Nick Frosst對(duì)Altman認爲大模型不會永遠奏效的觀點也是表示認同 的,他表示“有很多方法可以讓Transformer變得更好(hǎo)、更有用,而且很多方法并不涉及向(xiàng)模型添加參數”。Fr osst還(hái)說,新的AI模型設計或架構,以及基于人類反饋的進(jìn)一步優化,將(jiāng)會是許多人工智能(néng)研究人員已經(jīng)在探索和有前途的方向(xiàng)。
利用LLM大模型可以做許多“很酷”的事(shì)情,但我們必須承認,基于人類實際需求的創新發(fā)展方向(xiàng)才是最根本的邏輯,所以 “實用主義”是我們考量LLM應用的重要指标 。
對(duì)于到底是選擇隻經(jīng)過(guò)預訓練的大模型LLM,還(hái)是在此基礎上經(jīng)過(guò)特定數據集微調後(hòu)的較小模型問題,《在實踐中利用大模型的力量》這(zhè)篇論文給出的答案是具體情況具體分析,我們可以參照這(zhè)張決策流程思維導圖來獲得一些啓示。
各種(zhǒng)基于LLM構建的應用程序在不斷刷新我們的認知,計算機科學(xué)家Chip Huyen在其文章《爲生産構建 LLM 應用程序》中爲我們提供了一些有前景的LLM用例:
人工智能(néng)助手 :針對(duì)不同用戶群體來構建不同的任務,比如安排日程、做筆記、預訂航班、購物等。但是,最終目标是打造一個可以幫助你做任何事(shì)情的智能(néng)助手。
聊天機器人: 聊天機器人在API方面(miàn)類似于人工智能(néng)助手。 如果說人工智能(néng)助手的目标是完成(chéng)用戶交給它的任務,那麼(me)聊天機器人的目标更多的是成(chéng)爲一個伴侶。 例如,你可以讓聊天機器人像名人、電影角色、作家等一樣(yàng)說話。
學(xué)習 : ChatGPT不僅可以生成(chéng)問題,還(hái)可以評估學(xué)生輸入的答案是否正确,以及對(duì)論文進(jìn)行評分和反饋。同時,它也很擅長(cháng)在同一個辯論話題上采取不同的立場,可以成(chéng)爲學(xué)生很好(hǎo)的辯論夥伴。
搜索引擎優化 :如今,許多公司都(dōu)依賴于創造大量内容,希望在谷歌上排名靠前。但在未來,搜索引擎優化可能(néng)會變得更像一場貓捉老鼠的遊戲:搜索引擎會想出新的算法來檢測人工智能(néng)生成(chéng)的内容,而公司則會更好(hǎo)地繞過(guò)這(zhè)些算法。人們可能(néng)也會減少對(duì)搜索的依賴,而更多地依賴品牌(例如,隻相信某些人或公司創造的内容)。
除此之外,大語言模型可以幫助生命科學(xué)研究人員更好(hǎo)地理解蛋白質、分子、DNA和RNA,幫助信用卡公司進(jìn)行異常檢測和欺詐分析以保護消費者,幫助法律團隊進(jìn)行法律釋義和抄寫等。
在未來的模型面(miàn)前,或許現在我們看到的大模型隻是蝼蟻。但我們可以期待,未來更加強大的語言模型將(jiāng)會更徹底改變人們的生活方式。
現在,我們可以看到越來越多的企業湧入AI的洪流,個體也不可避免地主動參與或者被(bèi)席卷進(jìn)去,我們永遠不知道(dào)明天會發(fā)生什麼(me)。未來的另一個五年又會有多少大語言模型出現,誰又將(jiāng)沖在行業最前端呢?讓我們拭目以待。
标簽: AI
版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com
特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有
輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!
Tel:15137991270
企業QQ:210603461
Emile:hezuo@lyzg168.com
地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室
網站:https://www.lyzg168.com
我們的微信
關注兆光,了解我們的服務與最新資訊。
Copyright © 2018-2019 洛陽霆雲網絡科技有限公司