作者: 兆光科技 發(fā)布時間: 2024/08/08 點擊: 828次
大模型是AI時代的基礎設施。
2021年8月份,李飛飛和100多位學(xué)者聯名發(fā)表一份200多頁的研究報告《On the Opportunities and Risk of Foundation Models》,在這(zhè)篇論文中,AI專家統一了Foundation Models的說法,可以翻譯爲基礎模型或者是基石模型,并肯定了Foundation Models對(duì)智能(néng)體基本認知能(néng)力的推動作用。 同樣(yàng)是在2021年,在3月份悟道(dào)1.0發(fā)布現場,智源研究院院長(cháng)黃鐵軍介紹,人工智能(néng)的發(fā)展已經(jīng)從“大煉模型”逐步邁向(xiàng)了“煉大模型”的階段。 也就是從這(zhè)個時候開(kāi)始,中文裡(lǐ)“大模型”的說法開(kāi)始進(jìn)入公衆視野。 僅僅兩(liǎng)個月之後(hòu),悟道(dào)2.0發(fā)布,參數爲1.75萬億,爲GPT-3參數量(1750億)的十倍。
時間來到了2023年,ChatGPT所展現出的“超能(néng)力”,印證了Foundation Models真的讓“智能(néng)”産生了突破,人們對(duì)人工智能(néng)的關注度驟然提升。英文中的“Large Language Model”(LLM)也開(kāi)始變成(chéng)英文世界的熱詞,與中文“大模型”的說法,不謀而合、相互交融。
“大模型”也被(bèi)稱爲人工智能(néng)中的“暴力美學(xué)”。用通俗的語言描述,我們可以把“大模型”理解爲參數數量巨大、計算量巨大的深度學(xué)習模型。通過(guò)海量數據的訓練,學(xué)習到更加複雜的特征和規律,從而對(duì)人類下達的指令,産生更加智能(néng)的反饋。
“大”是“智能(néng)湧現”的必要條件,但是究竟要多大才能(néng)出現“湧現”?這(zhè)目前還(hái)是技術黑箱。關于模型要做多大,能(néng)做多大的讨論,一直爲業内關注的焦點。作爲國(guó)産大模型最早的踐行者和推行者之一,黃鐵軍認爲,大模型的“大”沒(méi)有上限,高質量數據的數量以及算力水平的限制,都(dōu)不能(néng)成(chéng)爲大模型繼續擴大的限制條件,如果以人腦一千億個神經(jīng)元,總突觸超過(guò)一百萬億的數量級爲參照物,基于人工神經(jīng)網絡的大模型,還(hái)有很大空間。
但是,如此可能(néng)“大”無上限的模型,僅中國(guó)在短短三個月内,就已經(jīng)發(fā)布了幾十個。黃鐵軍對(duì)此的觀點更明确,全球僅僅需要三個大模型就夠了。至于人類通往AGI(通用人工智能(néng))之路,究竟是不是能(néng)通過(guò)深度學(xué)習這(zhè)條路徑實現,目前還(hái)沒(méi)有定論。但是可以肯定的是,人類已經(jīng)看到了AGI的曙光。也正是這(zhè)抹光的乍現,人工智能(néng)界最有影響力的人物,多次預警并聯名簽發(fā)公開(kāi)信,預警風險。他們的擔憂,究竟有哪些?
以下爲對(duì)話實錄:
騰訊科技:ChatGPT表現出來的能(néng)力讓所有人感歎,從人工智能(néng)的發(fā)展來看,模型做“大”,是否是一個必要條件?
黃鐵軍:其實做大模型這(zhè)個理念道(dào)理可以說很簡單,因爲我們的世界是複雜的,萬事(shì)萬物很複雜。一種(zhǒng)思維方式是咱們傳統的科學(xué)思維,比如說物理學(xué)我要找到終極的一組方程,無論是萬有引力定律,還(hái)是量子力學(xué)的薛定谔方程,用方程刻畫世界的本質,這(zhè)是曾經(jīng)的主流,大家用最簡單的數學(xué)方式來描述世界的規律。
但是事(shì)實上大家也知道(dào)數學(xué)裡(lǐ)面(miàn)有随機性,無處不在。所以這(zhè)個世界肯定不是僅僅由幾個确定的方程能(néng)描述的,一定有更多的複雜性。既然要創造“人工智能(néng)”,有智能(néng)就要面(miàn)對(duì)複雜事(shì)件去解決問題。大模型其實是需要一個龐大的參數來爲基本表征的龐大神經(jīng)網絡,因爲你要映射的世界太複雜了,所以需要一個大規模的模型參數。
我剛才對(duì)比,物理學(xué)的方程,和我們今天說千億、萬億,甚至更大的參數系統,爲什麼(me)這(zhè)兩(liǎng)個東西都(dōu)是必要的?
第一,有些事(shì)物确實最終是可以找到一些本質的規律,比如說剛才說的萬有引力定律。但是同時要知道(dào)即便我們找到了這(zhè)樣(yàng)的規律,也不等于世界就完全由這(zhè)些規律所決定了。舉個例子,萬有引力兩(liǎng)個天體之間相互作用,我們用萬有引力定律可以解釋,但是三體問題我們都(dōu)知道(dào)它的複雜性絕對(duì)就不是一組方程所能(néng)描述的,裡(lǐ)面(miàn)會出現無窮無盡複雜的可能(néng)性。而我們剛才講爲什麼(me)要用龐大的參數模型刻畫這(zhè)些可能(néng)的複雜現象,就是因爲無論你世界運行多複雜,最終我還(hái)是想認識它,三體複雜,我們也想知道(dào),它還(hái)是有一些可預測的規律性的東西。這(zhè)個時候僅僅靠方程不夠了,我們還(hái)得靠一個大參數量的模型才能(néng)表示。
所以,隻要這(zhè)個世界的複雜性是無窮無盡的,我們可能(néng)就要一直要用越來越大的模型刻畫它,這(zhè)兩(liǎng)件事(shì)情既相互矛盾也相輔相成(chéng)。有的時候我們終于把這(zhè)些複雜性歸結爲一組方程了,但是就像我剛才說的,我們永遠不可能(néng)期望說隻靠方程就能(néng)解決問題,一定要有更多的複雜性需要模型去刻畫。
所以做大模型應該說本來就是人工智能(néng)應有之意,隻是說以前在算力、數據的條件有限的情況下做不了那麼(me)大的模型。小模型也能(néng)解決一些特定的問題,但是它的作用範圍就有限,大模型就是解決更通用、更複雜的問題,所以這(zhè)是一個必然的方向(xiàng),不是一時半會說大模型出現了,將(jiāng)來可能(néng)又沒(méi)有大模型了,換成(chéng)别的了,我覺得不是這(zhè)樣(yàng)的。
騰訊科技:2021年智源發(fā)布了悟道(dào)2.0大模型,那個時候ChatGPT還(hái)沒(méi)出現,智源是從什麼(me)時候開(kāi)始進(jìn)行大模型的研究的?
黃鐵軍:智源是2018年11月份成(chéng)立的,成(chéng)立的時候應該說這(zhè)個世界已經(jīng)從小模型往大模型轉換的過(guò)程中,隻是那個時候還(hái)沒(méi)有這(zhè)麼(me)一個名詞而已。2017年有了Transformer這(zhè)個新的架構出現,有了自監督預訓練的深度學(xué)習訓練方法,可以說深度機器學(xué)習的研究進(jìn)入到新的階段。所以走這(zhè)條道(dào)路幾乎可以說是必然的。
OpenAI也是2018年開(kāi)始聚焦做更大參數的模型,所以差不多都(dōu)是那個時間點技術進(jìn)入到了這(zhè)麼(me)一個階段。智源做大模型有很多因素,但是歸根結底應該說從一個研發(fā)機構來說,肯定要選可能(néng)性更大的方向(xiàng)集中更多資源進(jìn)行突破。所以應該也是比較自然的選擇。一開(kāi)始是一些探索性的,在2020年開(kāi)始加大力度,集中團隊去做,做了五個多月在2021年3月發(fā)布了悟道(dào)1.0。
那個時候在發(fā)布會上,當時我講人工智能(néng)已經(jīng)從“大煉模型”轉入“煉大模型”的新階段了,大模型這(zhè)個名詞也是在那次會上第一次出現在大家的面(miàn)前。之前因爲更多是偏學(xué)術的方向(xiàng),所以像國(guó)外叫(jiào)預訓練模型、基礎模型等,還(hái)有其它的一些現在不怎麼(me)用的名詞。我們認爲它的基本特性就是要規模做大,不大的話,後(hòu)面(miàn)的這(zhè)些能(néng)力都(dōu)是出不來的。所以當時就直接用了這(zhè)麼(me)一個中文的名字。但是剛過(guò)去的一年多,英文Large-scale Language Model這(zhè)個詞也被(bèi)越來越多使用,中英文兩(liǎng)個語言世界似乎在交融的樣(yàng)子。
騰訊科技:爲什麼(me)要做到萬億參數這(zhè)麼(me)大?
黃鐵軍:我覺得道(dào)理很簡單。智源做這(zhè)個模型,當時要做這(zhè)麼(me)大其實也是跟當時的一些資源條件有關,包括算力條件允許所以才做得大。我們從來沒(méi)有覺得過(guò)大,沒(méi)有這(zhè)個問題,隻是希望大到一定程度,希望它的能(néng)力能(néng)夠出來。到現在爲止也是一樣(yàng)的,現在沒(méi)有天花闆,沒(méi)有說做到萬億就是上限了,遠遠不是那麼(me)回事(shì)。
2021年當時智源發(fā)布萬億模型,做出來之後(hòu)大家很興奮,但是那個時候我就跟大家說,這(zhè)件事(shì)情不用太過(guò)于興奮,人腦是100萬億個神經(jīng)連接,我們做個萬億規模,也就是1%、2%的規模,跟人腦比還(hái)遠著(zhe)呢,更别說我們今天講的神經(jīng)網絡參數,神經(jīng)連接就是一個參數,但是實際上人的神經(jīng)突觸連接不僅僅是一個參數,還(hái)有更多的時間、空間因素,還(hái)有信号處理上的複雜性。從這(zhè)個意義上來講,我們距離人腦這(zhè)個參照物還(hái)差很遠。
至于“湧現”,模型小肯定是出現不了的,大是一個必要條件。至于大到幾百億、幾千億,還(hái)是更多,這(zhè)還(hái)跟網絡結構設計等因素有關,不是說到了600億就一定湧現。但是大緻來判斷,幾百億規模是必要條件,要是講概率的話,肯定是模型越大出現湧現的概率越大,但是既然幾百億已經(jīng)出現了,後(hòu)面(miàn)就沒(méi)有什麼(me)新鮮的了,那就是比較正常的特性了。但是湧現既然是突然出現的現象,我們也很難用傳統的概率意義上去說有百分之幾十的概率,這(zhè)麼(me)講不太科學(xué)。
騰訊科技:您說大模型的“大”沒(méi)有上限,但是現在有說法說大模型很快就要觸及瓶頸,包括算力瓶頸、包括高質量數據的瓶頸?
黃鐵軍:我是不認同的 。從數據來看,比較容易拿到的高質量數據快用完了,可能(néng)未來兩(liǎng)到三年就會用完,确實是這(zhè)樣(yàng)的。黃頁數據、圖書文獻這(zhè)一類的源數據确實是有限的,拿圖書來舉例,自古以來人類寫的所有的書,所有的語言加起(qǐ)來也就是一億部書,這(zhè)種(zhǒng)數量确實是有一個上限的。
但是這(zhè)隻是一類數據,其實這(zhè)個世界數據是很豐富的,我們剛才講的這(zhè)種(zhǒng)數據隻是我們講的傳統意義上的數據。但是一些“新”的數據,比如物聯網數據、自動駕駛數據,機器人進(jìn)入家庭和工廠感知的數據現在才剛剛開(kāi)始。比如自動駕駛,如果咱們車輛真的是全自動駕駛,全打開(kāi)所有的傳感器,産生的數量要比今天産生的數據量龐大得多。所以從這(zhè)個意義上來講參數量還(hái)會發(fā)展下去,所以數據不是一個約束條件。
算力是不是約束條件?肯定是。因爲算力本身的成(chéng)本是很高的,做任何事(shì)我們都(dōu)講性價比,以及功耗這(zhè)樣(yàng)一些物理約束。但是我相信芯片技術,包括算法的優化其實還(hái)是有極大的空間,因爲需求在,我覺得技術,包括芯片的發(fā)展也會持續的發(fā)展下去。
因爲大模型的叠代速度太快了,而以芯片技術爲代表的軟硬件叠代速度不夠,芯片的叠代還(hái)是遵循摩爾定律,18個月到24個月翻一番,大模型是3、4個月翻一番,兩(liǎng)個節奏差别很大。但是我覺得這(zhè)個總得來說,需求就在那裡(lǐ),所以會倒逼芯片的叠代速度也會加快,我覺得這(zhè)都(dōu)不是決定性條件,說大模型到了天花闆,我覺得遠遠不能(néng)做這(zhè)樣(yàng)的判斷。
騰訊科技:目前可獲得的高質量數據就那麼(me)多、算法也是基于開(kāi)源的,過(guò)去三個月,國(guó)内一下子發(fā)布了幾十個大模型,差異化和核心競争力在哪裡(lǐ)?是不是同質化嚴重?
黃鐵軍:你剛才也講了低水平重複、或者是碎片化的現象比較嚴重,但是這(zhè)個現象不僅限于大模型,很多産業以前也都(dōu)出現過(guò)類似的現象,确實是分散資源、很難形成(chéng)有重大影響的系統性突破,這(zhè)是不好(hǎo)的一面(miàn)。
但是從另外一個角度來說,可能(néng)也說明大家關注這(zhè)個賽道(dào),願意往這(zhè)個方向(xiàng)投入。不過(guò)我從來不認爲會有幾十個,甚至是十幾個大模型會在這(zhè)個市場上存在下去。2021年,智源當時發(fā)布模型的時候,我就講過(guò)這(zhè)是不可能(néng)的事(shì)情。全球大模型生态,我們不說大模型,因爲大模型隻是整個生态中的一個環節,大模型的生态不會超過(guò)三個,這(zhè)是我說的,可能(néng)稍微有點極端。
但是道(dào)理很簡單,大模型最終比的是智能(néng)水平,如果有N個大模型在的地方肯定是智力水平最高的大模型生态會被(bèi)絕大多數人使用,赢者通吃的現象從來都(dōu)是起(qǐ)作用的。說得直白一點,有一個很聰明的模型,有一個稍微傻一點的模型,你會用傻的嗎?肯定不會。而且用戶量的擴大會使得最聰明的模型成(chéng)本降下來,平均到更多用戶身上去。這(zhè)是在互聯網時代,在以前很多産業平台上一代一代驗證過(guò)的規律。
當然更重要的是,我們應該從基礎設施的角度看待大模型,就像我們經(jīng)常打比方說像電力。電力對(duì)于能(néng)源革命來說最大的創新機會就是它是流通的,真正把能(néng)源通過(guò)一張電網送進(jìn)千家萬戶。這(zhè)樣(yàng)我們作爲消費者,可以買不同的電器産品。但是用電的成(chéng)本又很低,一度電計算多少成(chéng)本,整個産業生态是很清晰的。大模型其實也是一樣(yàng)的。盡管我們今天很興奮,覺得人類進(jìn)入了一個智能(néng)時代,智力將(jiāng)成(chéng)爲重要的生産要素。但是智力也不神秘,我們每個人都(dōu)有智力,我們爲什麼(me)要給不同的工作人員付不同的工資,那就是有的人智力發(fā)揮的作用大,薪酬就高一點,否則就低一點。
將(jiāng)來智力作爲一個通用的社會流通的要素,其實也是一樣(yàng)的。人人都(dōu)可以得到它,它的價格也是類似于水電低成(chéng)本的方式讓全社會用,這(zhè)是放大人工智能(néng)能(néng)力的最佳方式。所以極少數幾個生态在起(qǐ)基礎性的作用,大家基于智力的基礎設施在做各種(zhǒng)各樣(yàng)的應用和服務,這(zhè)是一個正常的生态。所以這(zhè)個時候你回過(guò)頭來看,現在進(jìn)入大模型時代,或者是進(jìn)入這(zhè)樣(yàng)一個智力時代,我們都(dōu)要造“電廠”,或者是“造發(fā)電機”就會覺得很傻。電廠是後(hòu)台的基礎設施,而且電廠本身隻是一個生産端的産品,還(hái)必須有電網輸送到千家萬戶去。所以這(zhè)應該是大家共同構造的一個新的産業生态,而不是說“我也能(néng)造發(fā)電機”,那是邊緣産品,不是將(jiāng)來産業中的核心能(néng)力。
騰訊科技:您是說國(guó)内有三個大模型生态差不多就夠了?
黃鐵軍:我說的全世界。
騰訊科技:爲什麼(me)?這(zhè)樣(yàng)是不是所有資源都(dōu)會集中在三個大模型平台上?
黃鐵軍:我認爲要看怎麼(me)看。有的時候,我們講平台的時候可能(néng)偏向(xiàng)的是對(duì)資源的壟斷控制,但是,如果你從一個社會最基本的生産要素的提供來看,倒不一定。比如剛才說的電網,電網就是供電的,電網在電力時代可能(néng)不是利潤最高的,但是,它是個必要的設施,至于說能(néng)用電玩出什麼(me)花樣(yàng)來?電器是千千萬萬的,有很多的産業機會可以做。所以,确實有壟斷的性質,爲什麼(me)隻有一個電網給我們供電?因爲你布那麼(me)多電網本來就是一個極大的社會浪費,整個成(chéng)本就降不下來。所以,它不是一個簡單的咱們原來說的産品壟斷的問題,而是一個社會資源的綜合性的考慮。
騰訊科技:能(néng)不能(néng)再詳細講一下你認爲的未來可能(néng)的大模型産業生态,剛才你打了個比方,它就是互聯網、電網,那再往上的結構可能(néng)是怎樣(yàng)的?應用層又可能(néng)有哪些機會?
黃鐵軍:現在整個大模型爲核心的産業生态體系确實正在形成(chéng)過(guò)程中,目前還(hái)不像互聯網那樣(yàng),馬上就能(néng)劃得那麼(me)清楚。我也給不出那麼(me)精确的到底分幾層的答案。但是,大家必須要關注的一點就是,你想一想之前我們所有的經(jīng)濟活動,智力要素在裡(lǐ)面(miàn)發(fā)揮著(zhe)什麼(me)樣(yàng)的作用?以前我們講人力資源,因爲智力來自于人,不僅僅是傳統産業,包括新興産業、互聯網産業,數據要素、信息要素都(dōu)是當成(chéng)一個被(bèi)動的課題在使用,真正調度這(zhè)些資源的是“人的智力”。
當這(zhè)個智力變成(chéng)一個機器系統在提供的時候,整個的流程可能(néng)就要重塑了,所以,不僅僅是我們替下來多少畫師,替下來多少程序員,随著(zhe)它的深入應用,用AI的智力來重塑整個産品和服務的流程,這(zhè)會帶來巨大的變革。當然最終所有的企業都(dōu)會以智力作爲他們生産中的必不可少的要素。
所以,随著(zhe)將(jiāng)來所有企業都(dōu)要用人工智能(néng)的智力作爲生産必須的技術要素的時候,相應的供應公共産品和服務的企業就一定會出現。我剛才講到一定會有一個低成(chéng)本的智力運營商基礎設施出現,所有的企業在上層一定都(dōu)會用到這(zhè)個智力,中間這(zhè)些怎麼(me)把智力更好(hǎo)地讓企業使用,以及中間做一些加工,讓上層的應用更方便地嵌入到他們的業務鏈條裡(lǐ),這(zhè)中間會産生很多中間商,就是中間層的企業。如果咱們中國(guó)有這(zhè)麼(me)多企業願意投入,可能(néng)大家早一點去找這(zhè)樣(yàng)的機會,比都(dōu)集中在我們都(dōu)要做大模型要好(hǎo)得多。
騰訊科技:基于人工智能(néng)的基礎設施,生長(cháng)出來新的智能(néng)生态,你認爲未來的智能(néng)時代,開(kāi)源會是生态的主流嗎?
黃鐵軍:我的觀點從來都(dōu)是清楚的,一定是開(kāi)源的。但是,你說有沒(méi)有閉源的可能(néng)性,有沒(méi)有被(bèi)某一個企業壟斷的可能(néng)性?我們也不能(néng)絕對(duì)排除。像移動互聯網兩(liǎng)個生态,都(dōu)不是完全開(kāi)源的。iOS是封閉性的,安卓應該說是個半開(kāi)半閉的生态。所以,到了人工智能(néng)生态是不是一個完全開(kāi)源的Linux的技術體系支撐的,确實還(hái)存在一定的争論。
但是,從我個人的觀點來說,我認爲一定是開(kāi)源開(kāi)放的技術體系是真正的常态,短期之内存在一定的封閉、半封閉的可能(néng)性。爲什麼(me)是這(zhè)樣(yàng)?講幾個關鍵的理由,一是智能(néng)這(zhè)個東西和之前的系統都(dōu)不太一樣(yàng),大家都(dōu)不太放心。因爲智能(néng)跟你的決策直接關聯,如果我們的産品和服務被(bèi)封閉在我們企業的黑盒子裡(lǐ)面(miàn),我覺得大家都(dōu)會擔心。所以,無論是個人、組織、政府,都(dōu)會對(duì)封閉的東西避而遠之。當然,一開(kāi)始作爲一個産品如果好(hǎo)用,可能(néng)也有人買,但是到了一定程度之後(hòu),大家還(hái)是會選擇那個透明的、開(kāi)放的系統作爲基本支撐。這(zhè)是人工智能(néng)不同于之前産品的特性所決定的。
更别說開(kāi)源開(kāi)放會加速創新的效率,叠代的效率。最後(hòu)比的就是性價比,就是成(chéng)本的問題。假如說有封閉的系統,半開(kāi)半閉的,也有完全開(kāi)放的系統構建的屈指可數的幾個生态,那最後(hòu)我認爲建立在開(kāi)源開(kāi)放生态基礎上的這(zhè)樣(yàng)一套體系的總成(chéng)本是低的,就是智力服務的價格是最低的,所以它在産業上就成(chéng)功了。就像剛才說的,不純粹是一個産品的問題,它是一個社會公共的服務,我們大概也不太會允許一個企業壟斷,随便定一個價格,大家接受高價位,這(zhè)個也是不大可能(néng)的。
騰訊科技:你也提到了人工智能(néng)的風險性,我看到全球人工智能(néng)界有影響力的人物都(dōu)不斷預警人工智能(néng)的風險性,并連續簽發(fā)了兩(liǎng)封公開(kāi)信,您覺得哪些風險是迫在眉睫的?
黃鐵軍:這(zhè)個風險我們剛才提到一點,不可預測性是個最高的風險。還(hái)有一個,人工智能(néng)如果比人類強了,那這(zhè)個風險是巨大的,我們在地球上從來沒(méi)遇到過(guò)這(zhè)樣(yàng)一種(zhǒng)可能(néng)性。這(zhè)個問題也不僅僅是近期的事(shì),2015年的時候,在美國(guó)波多黎各開(kāi)了一個會,當時就是讨論比人類強的人工智能(néng)如果出現的話怎麼(me)辦。
當時的讨論,大家的觀點當然都(dōu)不一緻,有的說近期會出現,有的說幾十年之後(hòu)會出現,有的說永久出現不了。但是,那個會上統計差不多一半的人認爲30年之内有可能(néng)實現超人的強人工智能(néng)。所以,這(zhè)就是一個很近的眼前的事(shì),幾十年人類就會面(miàn)對(duì)這(zhè)麼(me)一個巨大的挑戰,甚至可能(néng)是最大的挑戰。所以,從2015年開(kāi)始,媒體上就能(néng)看到霍金、馬斯克,包括OpenAI的成(chéng)立都(dōu)是當時馬斯克參加完那個會之後(hòu)成(chéng)立的這(zhè)麼(me)一個組織,要研究AGI(通用人工智能(néng))。
這(zhè)次智源大會開(kāi)幕演講嘉賓之一泰格·馬克就是2015年那個會的組織者,之後(hòu)2019年未來生命研究所的會我參加了,當時騰訊也有代表參加,也是在同樣(yàng)的地方開(kāi)的。在那個會上,大家其實很認真地在讨論怎麼(me)來應對(duì)這(zhè)樣(yàng)一個風險,很多可能(néng)性遠超出大家平常在媒體上看到的,甚至科幻裡(lǐ)面(miàn)講到的可能(néng)性都(dōu)在考慮。
最近爲什麼(me)又被(bèi)高度關注?因爲過(guò)去我們真的看到了人工智能(néng)的“湧現”能(néng)力,盡管它現在的能(néng)力還(hái)遠沒(méi)到剛才說的“超人”的風險,但是,出現就是一個苗頭,這(zhè)件事(shì)是值得高度關注的,所以,對(duì)它的重視陡然提升可以說是必然的,也确實是必要的。
我認爲确實現在有點太快了。不是說我們的技術發(fā)展有點太快了,對(duì)社會的影響也有點過(guò)了。過(guò)了的意思就是它還(hái)不該在這(zhè)樣(yàng)一個時間,以這(zhè)麼(me)快的擴散速度讓它這(zhè)麼(me)快地接觸到這(zhè)麼(me)多用戶。
所以,當時《暫停巨型人工智能(néng)研發(fā)六個月》的公開(kāi)信,我也是簽名者之一。新的可能(néng)性不斷出現,到底會帶來什麼(me)樣(yàng)深刻的影響,現在還(hái)無法做出一個全面(miàn)地評估,更沒(méi)有一個全面(miàn)的解決方案。Geofferry Hinton作爲AI界的标志性人物,大家都(dōu)很尊重這(zhè)位老先生,他多次公開(kāi)表示擔心也是我剛才說的這(zhè)一點,就是一種(zhǒng)新的可能(néng)性出現,但是我們又不能(néng)在技術上确保可以管控。
所以,這(zhè)個時候高度重視風險是必須的。
騰訊科技:從業内的反應來看,大家完全沒(méi)有預料到深度學(xué)習的技術路徑最先看到了“湧現”,是否會削弱其它技術路線——類腦人工智能(néng)、具身人工智能(néng)的研究,還(hái)是說未來三條技術路線有可能(néng)融合,共同走向(xiàng)AGI(通用人工智能(néng))?
黃鐵軍:這(zhè)三條路線原來就一直存在,將(jiāng)來也還(hái)會繼續存在,也會在未來,如果說AGI,不管咱們想不想讓它出現,在形成(chéng)AGI的過(guò)程中都(dōu)必不可少。隻是說這(zhè)三個的節奏和相互作用的方式會有一些變化。
在大語言模型湧現現象之前,這(zhè)三條路都(dōu)有可能(néng)出現湧現,但是,現在大模型率先出現了湧現,它從信息處理的方式上可以說是最接近人的智能(néng),但是又最遠離生物智能(néng)的一種(zhǒng)方式。今天我們講的湧現,是基于大數據的靜态湧現,就是把數據中一些潛在的關聯融會貫通之後(hòu)就出現了解決問題的思路,這(zhè)個也很有意義。
比如我是個成(chéng)年人,讀了很多很多的書,突然把一些内在的聯系掌握到了,然後(hòu)突然靈光一閃,對(duì)原來很難的問題提出了解決方案。這(zhè)是一種(zhǒng)湧現,就是來自于知識的,來自于源數據的。還(hái)有一種(zhǒng)湧現,比如類腦智能(néng),它講的更多的是從真正複雜的動力學(xué)的角度,人腦是個脈沖神經(jīng)網絡,複雜的相互作用,所以,人的真正的靈光一閃和剛才講的大模型的靈光一閃,從物理的實現機制上有根本的差别。那能(néng)不能(néng)出現?當然能(néng)出現。因爲幾乎所有的生物的智慧都(dōu)是建立在那樣(yàng)一個機制上的。所以,如果你說類腦造出一個生物的腦,生物的神經(jīng)系統,它出現了湧現,這(zhè)幾乎是肯定的,肯定會出現,但是什麼(me)時候出現、達到一個什麼(me)樣(yàng)的精度條件它會出現?那這(zhè)之前也是一個開(kāi)放問題。
具身智能(néng)也一樣(yàng),跟環境的交互,然後(hòu)産生新的能(néng)力,跟原來的DeepMind做的AlphaStar,它玩《星際争霸》達到了大師級别,可能(néng)人有人的打法,AI有AI的打法,突然發(fā)現AI找出來一種(zhǒng)新的打法,人類原來沒(méi)有想到過(guò)的,那就應該說是具身智能(néng)的一種(zhǒng)湧現。
所以,三條路都(dōu)是可以按照各自的方式出現湧現新智能(néng),隻不過(guò)大模型率先實現了,因爲它的規模,它相對(duì)來說實現起(qǐ)來更好(hǎo)實現一點,算力加上數據,然後(hòu)開(kāi)始擴大規模,就可以了。實現之後(hòu),肯定會對(duì)另外兩(liǎng)個方向(xiàng)起(qǐ)到促進(jìn)作用。比如說具身,你不用所有的可能(néng)性都(dōu)去嘗試了,語言已經(jīng)能(néng)夠描述的就靠語言這(zhè)種(zhǒng)模态形式就解決了,剩下的隻需要做少量的嘗試,可能(néng)就能(néng)具備這(zhè)個能(néng)力。這(zhè)就跟我們人是一樣(yàng)的,一個人假如說不接受學(xué)校的教育,不讀書,什麼(me)都(dōu)不看,隻做身體上的跟自然界的交互,也能(néng)練出很強的能(néng)力,包括絕世武功都(dōu)能(néng)練出來,但是,如果有了學(xué)校教育之後(hòu),你做很多事(shì)情的速度會快很多,因爲你不要再去試錯了。
類腦智能(néng)講的是我從器件上,從結構上構造一個電子的人腦複本,這(zhè)是必要的。因爲今天的人工神經(jīng)網絡還(hái)不具備人腦很多的特性,一定要在這(zhè)個方向(xiàng)去做,隻是說那樣(yàng)的裝置做出來之後(hòu),假定沒(méi)有大模型,也沒(méi)有具身,那你還(hái)得訓練它。就跟人出生下來是帶著(zhe)腦袋來到了世界,但是後(hòu)天的知識怎麼(me)學(xué),你要去環境中探索。如果加上今天已有的大模型,結合在一起(qǐ),速度會更快。
原來我在2015年的時候覺得30年左右會實現AGI,大概在2045年。現在看來,如果這(zhè)三個相互作用之後(hòu),可能(néng)會加速。
騰訊科技:“人造大腦”真的能(néng)實現嗎?人的意識的原理還(hái)是個謎,人腦有一千億個神經(jīng)元,總突觸超過(guò)一百萬億,按數量級算,也是人類目前的算力水平無法達到的。
黃鐵軍:你這(zhè)個問題很重要,你的好(hǎo)奇點也是很多人的好(hǎo)奇點。我2015年寫的那篇文章,第一個要打破的就是這(zhè)個好(hǎo)奇點,可以說這(zhè)是一種(zhǒng)錯誤的看法。
第一,現在的算力能(néng)不能(néng)支持是一回事(shì),但是新的器件發(fā)展速度是很快的。我在2015年就寫過(guò)一篇文章講這(zhè)個問題,其實現在人類已經(jīng)有了新的器件,一二十年就能(néng)構造出全新的機器。我們不用“計算機”這(zhè)個詞,因爲它甚至于信息處理的方式都(dōu)不是原來的邏輯計算,而是一個類似于人腦一樣(yàng)的信息處理機制,這(zhè)是從技術的可能(néng)性上講。今天的算力不夠,主要是因爲現在芯片的能(néng)力限制,這(zhè)塊沒(méi)有天花闆,後(hòu)面(miàn)的突破已經(jīng)在發(fā)生了。
第二個問題,剛才說的對(duì)意識的理解,這(zhè)個問題是一個大問題。我們要問一個問題,我們到底要“理解”還(hái)是要“構造”。人工智能(néng)的本質在于構造,我們要做一個系統,這(zhè)個系統能(néng)表現出智能(néng),這(zhè)是人工智能(néng)的主旋律或者技術。我們要做這(zhè)個東西,它能(néng)不能(néng)表現出來,能(néng)不能(néng)表現出來越來越強的智能(néng)。而不是搞明白,理解它爲什麼(me)或者像咱們說的意識的奧秘,意識的奧秘有可能(néng)對(duì)人類來說是一個永遠無法解決的奧秘,有這(zhè)種(zhǒng)可能(néng)性。這(zhè)根本就不影響我們做一個有意識以及意識很強的機器,這(zhè)是兩(liǎng)回事(shì)。
有的時候我們說人有好(hǎo)奇心,一定要刨根問底,一定要知道(dào)爲什麼(me),這(zhè)個是有一定偏見的。其實很多時候,我們人類社會的科技進(jìn)步是在解決“How”的問題,不是解決“Why”的問題,但是有的時候大家把Why的問題擺在過(guò)于重要的位置,“Why”就是爲什麼(me),意識的奧秘是什麼(me)。“How”是如何做,如何構造一個具有智能(néng)的機器,這(zhè)是我剛才說的人工智能(néng)。
人類曆史上一再證明真正的科技進(jìn)步往往是“How”所推動的,不是由“Why”來推動的。例子很多,剛才也舉了一些例子,比如說飛機的發(fā)明是在空氣動力學(xué)沒(méi)有出現的情況下出現的,所以你怎麼(me)做一個飛機知道(dào)了,就飛上天了。現在怎麼(me)去訓練一個大模型知道(dào)了,就訓出智能(néng)和新智能(néng)。你說它爲什麼(me)以及更别說人腦背後(hòu)的爲什麼(me),那可能(néng)是一個長(cháng)期的還(hái)要繼續問下去的問題。
指南針也是一樣(yàng)的,中國(guó)人做出指南針并不知道(dào)爲什麼(me)指南,那是一千年之前的事(shì),我們知道(dào)爲什麼(me)指南,是過(guò)去兩(liǎng)三百年的事(shì)情,宋朝的時候哪知道(dào)地球,哪有電磁學(xué),沒(méi)有,不等于不能(néng)做,會做那就是“How”,如何去做東西。
回到人工智能(néng)這(zhè)個問題,我覺得對(duì)于智能(néng)背後(hòu),包括意識背後(hòu)奧秘的理解,這(zhè)個問題可以,當然也必須探索下去。我覺得如果它能(néng)解決,那也是因爲我們造出了具有這(zhè)種(zhǒng)能(néng)力的機器;不能(néng)解決的可能(néng)性也是存在的。我說不能(néng)解決的意思是說,靠我們人的大腦去理解自己爲什麼(me)能(néng)運行,它很複雜,複雜到我們這(zhè)樣(yàng)的系統無法理解的程度。
你說我們能(néng)不能(néng)造出一個比我們更複雜的機器?我認爲幾乎是肯定的,這(zhè)是有可能(néng)的。如果我們造出來了,它最後(hòu)理解了解釋了人腦就這(zhè)麼(me)回事(shì),所有的過(guò)程告訴你,背後(hòu)的原理,這(zhè)是有可能(néng)的,因爲它比我們更強大,它理解了我們複雜的大腦。這(zhè)是我爲什麼(me)講30年一定會做到,或者是更快能(néng)做到,但是理解它(大腦和意識),僅靠人類,也可能(néng)永遠理解不了。如果我們造出來比我們更強的機器,那個機器可以肯定它能(néng)理解。
未來這(zhè)麼(me)一段時間,在人類被(bèi)AI超過(guò)之前,會有一段幸福的時光,就是人和AI共同合作的情況下,能(néng)實現原來很多夢想,解決很多沒(méi)解決的問題,科技也會加速,不僅僅是大模型3、4個月就會叠代,我們社會各方面(miàn)的節奏都(dōu)進(jìn)入了更快速的節奏。就像坐上了高速列車,但是是不是懸崖在前面(miàn)?就是剛才說到的風險,這(zhè)個時候可能(néng)已經(jīng)不是我們人類完全自己控制了,你是跟AI一起(qǐ)在共同駕馭著(zhe)這(zhè)個時代往前狂奔,風險的問題也應該早點充分考慮。
騰訊科技:今年人工智能(néng)的關注度尤其高,從您的角度來看,今年人工智能(néng)領域最值得關注的某些讨論議題可能(néng)是哪些?
黃鐵軍:今天人工智能(néng)不同于以往五六十年來的人工智能(néng),之前大家所說的人工智能(néng)都(dōu)還(hái)隻是人設計的系統,而這(zhè)個系統總的來說,還(hái)在我們的設計預期之内。但是今年,我們看到了人工智能(néng)的湧現能(néng)力出現,這(zhè)就意味著(zhe)在設計之外,大家沒(méi)有預期到的智能(néng)現象出現了,這(zhè)是從未發(fā)生過(guò)的。這(zhè)樣(yàng)對(duì)于任何一個技術方向(xiàng)來說都(dōu)是特别令人興奮的。我經(jīng)常打比方,比如說飛機的發(fā)明做了很多年,準備飛上天,想了很多方法。但是突然有一天萊特兄弟架了一個飛行器在空中盤旋了幾十秒,一分多鍾,現在就相當于那個時刻。
所以,今年我們關注的既有技術進(jìn)步的興奮,還(hái)有對(duì)人工智能(néng)安全風險問題的陡然提升,其實背後(hòu)都(dōu)是因爲人工智能(néng)的性質已經(jīng)不同以往。
大家都(dōu)說今年智源大會的陣容很強大,智源大會在整個智源開(kāi)源開(kāi)放生态裡(lǐ)面(miàn)是标志性的會議,作爲生态這(zhè)裡(lǐ)面(miàn)有人的鏈接,有産業的鏈接,還(hái)有投融資,大家關心産業問題的鏈接。但是歸根結底其實是重要的觀點彙聚和碰撞,智源大會想起(qǐ)的作用就是要把一年來最重要的這(zhè)些在AI領域的觀點呈現,我講觀點的意思是說,我們并不在意某個産品怎麼(me)樣(yàng),而是更多在意有什麼(me)樣(yàng)新的思想、新的想法,以及争論、讨論,把這(zhè)樣(yàng)一些觀點通過(guò)一場會議鏈接在一起(qǐ)激蕩,爲未來的發(fā)展希望起(qǐ)到一定的導航作用。
标簽: AI
版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com
特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有
輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!
Tel:15137991270
企業QQ:210603461
Emile:hezuo@lyzg168.com
地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室
網站:https://www.lyzg168.com
我們的微信
關注兆光,了解我們的服務與最新資訊。
Copyright © 2018-2019 洛陽霆雲網絡科技有限公司