作者: 兆光科技 發(fā)布時間: 2024/08/09 點擊: 1075次
大模型熱潮,讓多家企業沖在AI産業底座的路上。
從交換機到高端AI服務器,再到雲計算和數據中心都(dōu)進(jìn)入新增長(cháng)周期。從1到10掀起(qǐ)“千模大戰”的AI革命,將(jiāng)首先在軟件和應用領域展開(kāi)。
其中,算法作爲實現AI功能(néng)的關鍵,基礎軟件爲其提供運行的平台和工具。随著(zhe)算力性能(néng)逐漸同質化和标準化,數據的差異性和企業需求的個性化逐漸加大,“AI基礎軟件”作爲模型訓練效率和算力使用效率的決定性因素,地位更加凸顯。
在企業迫切尋求生成(chéng)式AI應用的加速工具和服務的需求下,一邊NVIDIA AI Enterprise軟件套件和Azure機器學(xué)習相結合,供開(kāi)發(fā)者構建、部署和管理大型語言模型的AI應用;另一邊在産業起(qǐ)跑發(fā)令槍尚未響起(qǐ)之時,有前瞻性的國(guó)内AI基礎軟件玩家也開(kāi)始蠢蠢欲動。
沿著(zhe)“把數據變成(chéng)模型,讓模型變簡單,讓模型真正用起(qǐ)來”的軸線發(fā)展,萌芽于矽谷車庫,由兩(liǎng)位前微軟工程師創辦于2013年的九章雲極DataCanvas,經(jīng)曆過(guò)去十年随著(zhe)AI技術的不斷普及和深入應用後(hòu),在這(zhè)次大模型moment的爆燃之下,也欲發(fā)起(qǐ)新動作。
作爲AI賽道(dào)的早期入局者,九章雲極DataCanvas背後(hòu)站著(zhe)兩(liǎng)個男人:方磊和尚明棟。
兩(liǎng)人在美國(guó)待了10年,不僅是美國(guó)雪城大學(xué)攻讀計算機工程碩士時的同窗好(hǎo)友,後(hòu)又都(dōu)加入微軟工作。2008年,微軟從各個團隊中,抽取精明強將(jiāng),組成(chéng)了類startup的團隊,晚亞馬遜2年沖入雲計算,方磊跟尚明棟便是其中之二。
彼時,身處内部,兩(liǎng)人從工程師角度看到了很多趨勢,比如早期微軟隻提供PaaS服務,後(hòu)被(bèi)市場教育,又變成(chéng)了提供SaaS和PaaS服務。在大廠率先試錯的過(guò)程中,2011年,雲上收入增長(cháng)迅速,多家企業規模量級發(fā)生變化。
尚明棟觀察到,一些傳統的大公司,開(kāi)始成(chéng)批量把算力往雲上去遷移,驗證了當初傑夫貝索斯對(duì)雲建設的初衷。
“一開(kāi)始有人嘲笑說雲建設就是弄一堆RDC的機房,但貝索斯的願景是以後(hòu)接管所有企業的IT,從底層計算存儲一直到上層數據能(néng)力建設等各種(zhǒng)基礎能(néng)力的建設。企業不需要再有一個IT團隊去維護,以非常低的成(chéng)本就形成(chéng)一套很複雜、高可用、高并發(fā)的架構。”
2013 年前後(hòu),美國(guó)的數據科學(xué)平台創業迎來爆發(fā)期,加之,公有雲的技術環境形成(chéng),促使新一代數據和人工智能(néng)(Data AI)的公司不斷孵化出來....Databricks、Snowflake 等一批後(hòu)來崛起(qǐ)爲頭部的公司大都(dōu)是從這(zhè)個時候起(qǐ)步。
方磊和尚明棟順勢而爲,決定回國(guó)在數據科學(xué)平台領域創業,九章雲極DataCanvas由此成(chéng)爲國(guó)内最早入局自動化數據科學(xué)平台的供應商。
2014 年,方磊給投資人的郵件中表示:容器技術自 2012 年出現後(hòu),給分析行業帶來了很大的改變,容器化的方式統一了分析流程的運行基礎。而且,與容器結合後(hòu),機器學(xué)習、深度學(xué)習等不再隻是在上層增光添彩的小工具,而成(chéng)爲了标準化的基礎設施。
同年,這(zhè)一創業設想便拿到了亞傑天使基金的天使輪投資。
尚明棟也深知AI基礎軟件更清晰的定位以及上下遊的合作,往往更适用于一個相對(duì)來說比較成(chéng)熟的生态分工,絕非一蹴而就。
在花了兩(liǎng)年時間打磨DataCanvas 數據科學(xué)平台後(hòu),尚明棟意識到要把産品變成(chéng)商品,需要對(duì)市場需求精準洞察,而技術創業的背景早期讓其在市場化上也走過(guò)一些彎路。想要在國(guó)内把數據和算法變成(chéng)生意,從有數據處理需求的大型企業入手成(chéng)爲了解法。
尚明棟坦言,模型作爲數據資産的一部分,從大趨勢上看,數據産生、能(néng)力構建是一個持續建設的過(guò)程,信息化能(néng)力建設最早的行業一定相對(duì)來說數據更剛需和密集。
彼時,金融行業的信息化程度遠高于其他行業,銀行是當時國(guó)内IT 預算最高的企業之一,亦成(chéng)爲了九章雲極DataCanvas瞄準金融行業的最先切入點。時至今日,中國(guó)前一百家銀行裡(lǐ),九章雲極DataCanvas客戶占比超50 家,驗證了其AI創業以“business”的核心。
商業化驗證的同時,爲解決企業在進(jìn)行數據分析時面(miàn)臨的AI建模難度門檻過(guò)高、以及AI推理等問題,九章雲極DataCanvas也不斷完善産品版圖。
在“人工智能(néng)基礎軟件”的定位下,公司不僅通過(guò)AutoML自動機器學(xué)習、AutoDL自動深度學(xué)習和ModelOps提供模型運行的全生命周期,更通過(guò)其研發(fā)的HSAP數據庫DingoDB落地Data-Centric AI。
此外,九章雲極DataCanvas從DAT自動機器學(xué)習軟件、DingoDB實時交互式分析數據庫,到去年7月發(fā)布的YLearn因果學(xué)習軟件,不斷以開(kāi)源重器刷新了業界對(duì)開(kāi)源基礎軟件的期望。後(hòu)者作爲全球首款一站式處理因果學(xué)習完整流程的開(kāi)源算法工具包,填補了可信AI、可解釋AI高性能(néng)基礎軟件的市場空白,而這(zhè)也正是推動AI技術實現從“預測”到“決策”的規模化應用的重要工具。
尚明棟表示,AI基礎軟件不光是一個基礎軟件,還(hái)面(miàn)向(xiàng)國(guó)内toB的生态合作。随著(zhe)衆多廠商協作産生的分工細化,在toB生态下,面(miàn)對(duì)行業數據、結構的不同,企業更需要考慮在某一個能(néng)力層裡(lǐ)進(jìn)行長(cháng)期的可複用、标準化。
這(zhè)其中,越是偏底層的能(néng)力,他認爲越應該參與到開(kāi)源生态中,通過(guò)更多人适配變成(chéng)整個标準化生态分工裡(lǐ)的一環。
“從這(zhè)一點上來說,我們尊重且積極參與到開(kāi)放生态,會開(kāi)源一些比較底層的計算框架,而偏上面(miàn)的行業應用,甚至是交互式的應用工具鏈,會更支持企業化特性。”尚明棟表示,九章雲極DataCanvas會保持對(duì)開(kāi)源生态的兼容,處于中間層的位置,向(xiàng)上更靠近應用,向(xiàng)下更靠近底層。
據了解,九章雲極DataCanvas軟件産品收入占六成(chéng)以上,除在金融行業客戶滲透率不斷提高外,其在通信、工業制造、政府、交通等多行業均有标杆客戶落地。
10年間,九章雲極DataCanvas加速狂奔,資本的橄榄枝也接連不斷。
去年9月,九章雲極DataCanvas完成(chéng)龍門資本領投的C+輪融資,至此,已在9輪融資中獲得超20家機構押注,其中中關村發(fā)展前沿基金、領沨資本、紅點中國(guó)、賽富投資基金、襄禾資本等知名機構更是多輪加持。
在技術快速發(fā)展和行業生态變遷下,如果說過(guò)去的産品矩陣是九章雲極DataCanvas針對(duì)企業現有能(néng)力來進(jìn)行伴生式的成(chéng)長(cháng),那麼(me)大模型則是九章雲極DataCanvas的詩和遠方。
近兩(liǎng)年,在跟規模體量特别大的客戶溝通并構建大規模深度學(xué)習的分布式訓練框架時,尚明棟就感受到面(miàn)向(xiàng)未來的非結構化數據越來越多,隻不過(guò)業内尚無大規模需求湧現。
而這(zhè)些早期的個别需求讓他在訓練模型時,注意到随著(zhe)模型由小變大,大模型訓練成(chéng)本高甚至可能(néng)還(hái)會進(jìn)入到空轉狀态,形成(chéng)大量成(chéng)本浪費,故而需要一面(miàn)訓練,一面(miàn)監控,一面(miàn)動态調整訓練參數,讓其持續進(jìn)入到收斂态。
尚明棟坦言,自2019年起(qǐ),團隊就開(kāi)始挑可能(néng)通過(guò)長(cháng)期投入來形成(chéng)核心壁壘的點,作爲大模型的投入重心。
在他看來,過(guò)去中小模型解決的是場景,現在大模型替代的是分工和角色。想讓企業更認可大模型的價值,一要用大模型的能(néng)力,給企業帶來更多收益,二要爲企業節省更多人力成(chéng)本。簡而言之就是實現客戶一些原先不能(néng)的,或者是原先效果不夠好(hǎo)的能(néng)力,在能(néng)力建設和業務結合時做好(hǎo)開(kāi)源節流。
基于這(zhè)樣(yàng)的邏輯,九章雲極DataCanvas將(jiāng)與行業生态結合得較緊密的需大量成(chéng)本消耗的環節,作爲可能(néng)被(bèi)大模型所替代和驅動的目标。
當下,大模型雖表現優異,但對(duì)于各行業使用者來說,實際應用于業務場景仍然存在較高的技術和成(chéng)本門檻。模型的參數标準并不統一,相對(duì)于參數級,模型的效果且是否能(néng)夠支持快速叠代對(duì)于企業客戶實際應用來說更爲重要。客戶能(néng)夠在一個白盒大模型基礎上快速地、低成(chéng)本地微調和叠代出客制化的小模型,才能(néng)高效地實現豐富場景的大模型應用。而這(zhè)正是AI基礎軟件工具鏈的重要性。
尚明棟表示,大模型未來可能(néng)和中小模型更趨同化,而大模型和小模型的融合使用,大模型的小型化,或者說以大模型爲底座的小型化微調,也是一種(zhǒng)趨勢,能(néng)夠以低廉的成(chéng)本解決大量的問題。AI基礎軟件通過(guò)大模型+小模型的方式,正形成(chéng)模型訓練新範式。
他指出,不管是大模型還(hái)是小模型,本質上都(dōu)是模型,實際就是數據的濃縮,包含價值、邏輯密度。數據不開(kāi)放,必然要搬運能(néng)力,而且是大模型所需的整個能(néng)力棧。
而通過(guò)過(guò)去啃下的技術“硬骨頭”,使得九章雲極DataCanvas在大模型的落地和應用裡(lǐ),能(néng)快速找到能(néng)力組合的戰略要點,打造更标準化的大模型工具鏈:不僅會在支持現有框架下,把構建大模型的能(néng)力引入行業的邊界裡(lǐ)去,而且還(hái)會給行業提供能(néng)力閉環。
“作爲AI生态鏈中基礎軟件環節的能(néng)力提供者,過(guò)去10年我們一直在驗證從模型構建到模型推理生産化,甚至到後(hòu)期的模型管理,形成(chéng)一個基于以模型全生命周期作爲起(qǐ)點和終點來進(jìn)行的能(néng)力建設的閉環,來對(duì)行業産生價值,讓客戶爲能(néng)力買單。”
而這(zhè)樣(yàng)的閉環在大模型構建下,尚明棟預測會有新的能(néng)力建設随新的大閉環而産生。
在他看來,大模型很像新時代的制造業,大家在一個流水線上,下遊負責算力、更底層的一些計算框架,九章雲極DataCanvas負責好(hǎo)基礎軟件,模型的完整生命周期的構建和推理,并賦能(néng)于後(hòu)面(miàn)的應用,是一個更面(miàn)向(xiàng)産業的閉環。
而其中,相較于專業能(néng)力分工更細緻化,有前瞻性技術和能(néng)力構建的頭部客戶,真正進(jìn)行大規模變現和賦能(néng)的是更偏向(xiàng)于最終應用的腰部企業,需要九章雲極DataCanvas從基礎軟件往應用側提供一部分服務,去把最後(hòu)這(zhè)一公裡(lǐ)補齊。其透露,目前大模型方面(miàn)已經(jīng)開(kāi)始有付費客戶。
據IDC預測,到2026年,大規模基礎模型將(jiāng)成(chéng)爲大型供應商提供的标準行業實用程序。随著(zhe)各大廠商更加投入到底層基礎軟件的建設中,在時代推動和産業帶動下,以九章雲極DataCanvas爲代表的AI基礎軟件公司又將(jiāng)有哪些變與不變,讓我們拭目以待。
标簽: AI
版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com
特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有
輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!
Tel:15137991270
企業QQ:210603461
Emile:hezuo@lyzg168.com
地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室
網站:https://www.lyzg168.com
我們的微信
關注兆光,了解我們的服務與最新資訊。
Copyright © 2018-2019 洛陽霆雲網絡科技有限公司