首頁 / 新聞 / 巨型AI模型時代已結束？這(zhè)家AI初創公司再獲2.5億美元融資

巨型AI模型時代已結束？這(zhè)家AI初創公司再獲2.5億美元融資

作者: 兆光科技發(fā)布時間: 2024/08/09 點擊: 8007次

它會是ChatGPT的競争對(duì)手嗎？

“元宇宙的開(kāi)拓者” 是我們針對(duì)元宇宙的發(fā)展而設立的專欄，主要面(miàn)向(xiàng)那些深挖元宇宙産業或者在元宇宙進(jìn)行“淘金”的從業者，分享這(zhè)些企業或者創業者們的故事(shì)，以獨特的視角窺見那些引領全球元宇宙發(fā)展的企業或個人，我們深信元宇宙的大幕已經(jīng)拉開(kāi)，引領未來20年的科技互聯網已經(jīng)走上了時代浪潮。以下是我們的第36期内容，作爲加拿大的一家初創企業，Cohere何以突出重圍，斬獲衆多投資者的青睐？以下Enjoy。

随著(zhe)OpenAI推出ChatGPT在人工智能(néng)領域掀起(qǐ)的千層浪，生成(chéng)式AI開(kāi)始被(bèi)普羅大衆所熟知。《日本經(jīng)濟新聞》在此前報道(dào)中指出，全球100多家大規模生成(chéng)式AI企業總市值達480億美元，約爲2020年的6倍，OpenAI的确引領了市場對(duì)生成(chéng)式AI企業的投資熱潮。

實際上，除了OpenAI，AI的發(fā)展浪潮中還(hái)有Jasper、DeepMind、Stability、Cohere等競争者。5月3日，《紐約時報》報道(dào)稱，兩(liǎng)名知情人士透露Cohere已獲2.5億美元融資，估值約20億美元，投資者包括互聯網軟件巨頭Salesforce、芯片制造商Nvidia、多倫多風投公司Inovia Capital和矽谷公司Index Ventures。這(zhè)是自2022年ChatGPT發(fā)布後(hòu)在生成(chéng)式AI領域的最新重大投資。而此前，Cohere籌集的總資金已達1.7億美元，包括2022年由Tiger Global領投的1.25億美元B輪融資。

“百舸争流，奮楫者先；千帆競發(fā)，勇進(jìn)者勝”。作爲加拿大的一家初創企業，Cohere何以突出重圍，斬獲衆多投資者的青睐？了解該企業的發(fā)展曆程、其産品區别于ChatGPT的獨特優勢後(hòu)，相信我們會對(duì)投融資市場風向(xiàng)的選擇理由與生成(chéng)式AI的發(fā)展動向(xiàng)有所理解。

一篇著名的論文

創立于2019年的Cohere是一家自然語言處理 (NLP) 公司，基于大型NLP模型爲外界提供API服務，從而提高計算機理解和生成(chéng)文本、閱讀和寫作的能(néng)力。該公司由艾丹·戈麥斯 (Aidan Gomez) 與兩(liǎng)個朋友Nick Frosst和Ivan Zhang一起(qǐ)創辦，它的總部位于加拿大多倫多，在美國(guó)舊金山、英國(guó)倫敦均設有辦事(shì)處。自合作以來，他們組建了一支約135人的團隊，目前還(hái)在繼續擴建以更好(hǎo)的提供相關API服務。

兩(liǎng)位聯合創始人Aidan Gomez和Nick Frosst曾擔任過(guò)谷歌研究員，其中Aidan Gomez是大名鼎鼎的《Attention Is All You Need》論文的作者之一。該論文提出了一種(zhǒng)新的、被(bèi)譽爲ChatGPT的“祖師爺”的網絡架構“Transformer” ，ChatGPT通過(guò)Transformer模型進(jìn)行了序列建模，并通過(guò)自回歸方式進(jìn)行訓練，使得大語言模型能(néng)夠根據前文内容和當前輸入，生成(chéng)符合語法規則和語義邏輯的拟人化内容，這(zhè)使得國(guó)内外都(dōu)掀起(qǐ)了一波未平一波又起(qǐ)的大規模語言模型訓練的熱潮。

Cohere提供了與ChatGPT類似的産品，目前主要包括：搜索文本（多語言嵌入、神經(jīng)搜索、搜索排名）、分類文本和生成(chéng)文本三大類産品，幫助企業快速部署對(duì)話式AI聊天機器人、生成(chéng)式搜索引擎、文本摘要總結、增強向(xiàng)量搜索等，是爲數不多在技術層面(miàn)具備與OpenAI進(jìn)行競争的AI企業之一，這(zhè)也是其受到資本市場青睐的重要原因之一。

Cohere曾在2021年9月獲得4000萬美元A輪融資；2022年2月獲得1.25億美元B輪融資，投資者包括老虎環球基金、“AI教父” Geoffrey Hinton、斯坦福大學(xué)教授李飛飛、深度學(xué)習專家Pieter Abbeel等。在2022年10月，Cohere便開(kāi)始與谷歌、Salesforce、Nvidia進(jìn)行融資談判，如今，Cohere獲得巨額融資將(jiāng)繼續與OpenAI展開(kāi)激烈競争，繼續加快類似ChatGPT産品的技術創新和更新叠代。

資本爲何青睐？

實際上，在OpenAI發(fā)布GPT-4之後(hòu)的一段時間内，大部分人都(dōu)將(jiāng)目光聚焦于AI大模型，包括Anthropic、 AI21、 Cohere和Character.AI在内的衆多資金充足的初創公司都(dōu)在投入大量資源來構建更大的算法和模型，以期待努力趕上OpenAI的技術。

但就在AI競賽如火如荼開(kāi)展之時，OpenAI的首席執行官Sam Altman卻表示巨型AI模型的時代已結束，“未來新一步的進(jìn)化，將(jiāng)不會來自于巨型模型”。那同屬該領域的Cohere又爲何會獲得資本的青睐呢？

Cohere AI將(jiāng)其模型分爲兩(liǎng)類：生成(chéng)模型和嵌入模型。生成(chéng)模型通過(guò)對(duì)互聯網上大量的數據進(jìn)行訓練，而嵌入模型是多語言支持的，可以支持超過(guò)109種(zhǒng)語言。Cohere的模型有不同的規格，公司的指令模型每周都(dōu)在進(jìn)步，而同類領域的其他提供商通常要幾個月或甚至一年才會發(fā)布重要的模型更新。

盡管Cohere AI與谷歌合作獲取其硬件能(néng)力，但其并不僅限于Google Cloud。例如，Cohere在AWS SageMaker上運營，并計劃在其他雲服務提供商上提供服務。Cohere AI的方法非常開(kāi)放，并以客戶爲中心，他們通過(guò)在任何雲供應商上運行以使客戶獲得最佳體驗和服務。

相較于GPT-4，Cohere AI尚未采用多模态方法。Cohere AI的高級副總裁Saurabh Baji表示，“我認爲圖像和視頻非常令人興奮。但從商業角度來看，這(zhè)也是一個不同的問題。我們并不關注AGI，而是專注于客戶實際面(miàn)臨的問題。很多客戶的需求都(dōu)非常以語言爲中心。”

從AI競争格局的角度來看，Cohere AI和OpenAI都(dōu)是目前AI領域的重要參與者。雖然兩(liǎng)家公司都(dōu)專注于大型語言模型，但它們的重點和方法略有不同。OpenAI在一系列領域都(dōu)有所涉獵，包括自然語言處理、計算機視覺和強化學(xué)習等。此外，OpenAI也吸引了大量的資本，其中包括像微軟、谷歌和亞馬遜這(zhè)樣(yàng)的科技巨頭。

相比之下，Cohere AI專注于提供易于使用和部署的大型語言模型，爲企業客戶提供更好(hǎo)的商業解決方案。盡管Cohere AI在規模和影響力上與OpenAI存在一定的差距，但其在語言模型方面(miàn)的專注度和靈活性使其成(chéng)爲一個非常有前途的公司。

另外，在資本方面(miàn)，Cohere AI也獲得了很多青睐。除了幾個知名風險投資公司的支持，該公司還(hái)獲得了加拿大政府和Google等科技巨頭的支持。這(zhè)些資金的注入有助于Cohere AI繼續擴展其業務和規模，并在AI市場上取得更大的份額。

總的來說，雖然Cohere AI和OpenAI在AI競争格局中處于不同的位置，但它們都(dōu)是這(zhè)個領域中非常有前途的公司。Cohere AI在語言模型方面(miàn)的專注度和靈活性使其成(chéng)爲一個與OpenAI進(jìn)行競争的關鍵因素之一，而資本的支持也給了Cohere AI更多的機會來發(fā)揮其潛力，并在市場上取得更大的份額。

實用角度看大語言模型

大語言模型（Large Language Models，簡稱LLMs）是一類基于深度學(xué)習技術的自然語言處理（NLP）模型，它們具有大量的參數，并能(néng)夠理解和生成(chéng)人類語言。這(zhè)類模型通常采用神經(jīng)網絡架構，尤其是Transformer架構。

近期，一篇綜述論文《在實踐中利用大模型的力量》在AI學(xué)術圈爆火，而其中一張名爲“大預言模型進(jìn)化樹”的圖片引起(qǐ)了不小的轟動，其梳理了2018年到2023年的大預言模型代表作。

相較于Open AI不斷深耕至今走向(xiàng)AI的前沿，曾經(jīng)頗具影響力的谷歌BERT似乎從一開(kāi)始就走向(xiàng)了“岔路”。當我們以年爲單位看LLM發(fā)展史的時候，忍不住唏噓“在大模型沒(méi)有成(chéng)功之前，一切都(dōu)是場賭局”。

◉ 大語言模型發(fā)展進(jìn)化史

2017年的時候，谷歌研究員在《Attention is all you need》一文中介紹了Transformer架構——這(zhè)也是目前最常用到的架構之一，是BERT、GPT等預訓練模型的基礎。時至今日，Transformer架構仍是GPT模型的基礎架構。

Transformer架構的提出和預訓練的方法將(jiāng)大語言模型推向(xiàng)了新的階段——以谷歌爲首的科技大公司在2017年後(hòu)聚焦于研發(fā)能(néng)夠處理多種(zhǒng)自然語言任務的大模型。

2018年6月，OpenAI采用Transformer架構發(fā)布了它們的模型——GPT-1。緊接著(zhe)，谷歌正式向(xiàng)世界介紹了全新預訓練模型——BERT。

時間來到2019年，微軟宣布與OpenAI達成(chéng)10億美金的合作。次年9月，OpenAI授權微軟使用GPT-3模型，微軟成(chéng)爲全球首個享用GPT-3能(néng)力的公司。

科技巨頭Meta當然也不甘示弱，于2022年推出有著(zhe)“開(kāi)源版本的GPT-3”之稱的OPT，并于今年推出能(néng)在單個GPU上運行的大語言模型LLaMA。

如今GPT-4也已發(fā)布，更強的文本生成(chéng)能(néng)力與詳細的邏輯判斷能(néng)力讓OpenAI在四年内快速崛起(qǐ)，并成(chéng)功“破圈”。

Cohere的聯合創始人Nick Frosst對(duì)Altman認爲大模型不會永遠奏效的觀點也是表示認同的，他表示“有很多方法可以讓Transformer變得更好(hǎo)、更有用，而且很多方法并不涉及向(xiàng)模型添加參數”。Fr osst還(hái)說，新的AI模型設計或架構，以及基于人類反饋的進(jìn)一步優化，將(jiāng)會是許多人工智能(néng)研究人員已經(jīng)在探索和有前途的方向(xiàng)。

◉ 一些有前景的LLM用例

利用LLM大模型可以做許多“很酷”的事(shì)情，但我們必須承認，基于人類實際需求的創新發(fā)展方向(xiàng)才是最根本的邏輯，所以 “實用主義”是我們考量LLM應用的重要指标。

對(duì)于到底是選擇隻經(jīng)過(guò)預訓練的大模型LLM，還(hái)是在此基礎上經(jīng)過(guò)特定數據集微調後(hòu)的較小模型問題，《在實踐中利用大模型的力量》這(zhè)篇論文給出的答案是具體情況具體分析，我們可以參照這(zhè)張決策流程思維導圖來獲得一些啓示。

各種(zhǒng)基于LLM構建的應用程序在不斷刷新我們的認知，計算機科學(xué)家Chip Huyen在其文章《爲生産構建 LLM 應用程序》中爲我們提供了一些有前景的LLM用例：

人工智能(néng)助手：針對(duì)不同用戶群體來構建不同的任務，比如安排日程、做筆記、預訂航班、購物等。但是，最終目标是打造一個可以幫助你做任何事(shì)情的智能(néng)助手。

聊天機器人：聊天機器人在API方面(miàn)類似于人工智能(néng)助手。如果說人工智能(néng)助手的目标是完成(chéng)用戶交給它的任務，那麼(me)聊天機器人的目标更多的是成(chéng)爲一個伴侶。例如，你可以讓聊天機器人像名人、電影角色、作家等一樣(yàng)說話。

學(xué)習： ChatGPT不僅可以生成(chéng)問題，還(hái)可以評估學(xué)生輸入的答案是否正确，以及對(duì)論文進(jìn)行評分和反饋。同時，它也很擅長(cháng)在同一個辯論話題上采取不同的立場，可以成(chéng)爲學(xué)生很好(hǎo)的辯論夥伴。

搜索引擎優化：如今，許多公司都(dōu)依賴于創造大量内容，希望在谷歌上排名靠前。但在未來，搜索引擎優化可能(néng)會變得更像一場貓捉老鼠的遊戲：搜索引擎會想出新的算法來檢測人工智能(néng)生成(chéng)的内容，而公司則會更好(hǎo)地繞過(guò)這(zhè)些算法。人們可能(néng)也會減少對(duì)搜索的依賴，而更多地依賴品牌（例如，隻相信某些人或公司創造的内容）。

除此之外，大語言模型可以幫助生命科學(xué)研究人員更好(hǎo)地理解蛋白質、分子、DNA和RNA，幫助信用卡公司進(jìn)行異常檢測和欺詐分析以保護消費者，幫助法律團隊進(jìn)行法律釋義和抄寫等。

在未來的模型面(miàn)前，或許現在我們看到的大模型隻是蝼蟻。但我們可以期待，未來更加強大的語言模型將(jiāng)會更徹底改變人們的生活方式。

現在，我們可以看到越來越多的企業湧入AI的洪流，個體也不可避免地主動參與或者被(bèi)席卷進(jìn)去，我們永遠不知道(dào)明天會發(fā)生什麼(me)。未來的另一個五年又會有多少大語言模型出現，誰又將(jiāng)沖在行業最前端呢？讓我們拭目以待。

标簽： AI

版權申明：本站文章部分自網絡，如有侵權，請聯系：hezuo@lyzg168.com

特别注意：本站所有轉載文章言論不代表本站觀點，本站所提供的攝影照片，插畫，設計作品，如需使用，請與原作者聯系，版權歸原作者所有

猜你喜歡

流程再造的工作，可以放心交給AI嗎？ 2024/08/10
AI加持、全民網紅，Snapchat開(kāi)啓“大改造” 2024/08/10
我們在浪潮中與AI謹慎對(duì)抗 2024/08/10
新工具時代來臨，個個月賺千萬 2024/08/10
2023年中國(guó)智能(néng)視頻編碼行業白皮書 2024/08/10

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ：210603461

Emile：hezuo@lyzg168.com

地址：洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站：https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光，了解我們的服務與最新資訊。

巨型AI模型時代已結束？這(zhè)家AI初創公司再獲2.5億美元融資

巨型AI模型時代已結束？這(zhè)家AI初創公司再獲2.5億美元融資

一篇著名的論文

資本爲何青睐？

實用角度看大語言模型

◉ 大語言模型發(fā)展進(jìn)化史

◉ 一些有前景的LLM用例

猜你喜歡

推薦閱讀

聯系我們

洛陽霆雲網絡科技有限公司

網站導航

行業咨詢

最新動态

聯系方式