首頁 / 新聞 / 谷歌一雪前恥,全新PaLM 2反超GPT-4,辦公全家桶炸裂升級,Bard史詩進(jìn)化

谷歌一雪前恥,全新PaLM 2反超GPT-4,辦公全家桶炸裂升級,Bard史詩進(jìn)化

作者: 兆光科技 發(fā)布時間: 2024/08/09 點擊: 765次

谷歌I/O 2023大會,仿佛又給谷歌的支持者們打了一針強心劑。

【新智元導讀】新版PaLM 2超強進(jìn)化,辦公全家桶Workspace全面(miàn)升級,Bard全面(miàn)增強、所有人可用……可以看出,這(zhè)屆I/O大會,谷歌是真的憋出不少大招。

谷歌I/O 2023大會,仿佛又給谷歌的支持者們打了一針強心劑。

此前,因爲微軟和OpenAI的優異表現,谷歌已經(jīng)被(bèi)唱衰了很久。

但是,畢竟是做出了衆多奠基性工作的AI老牌公司,谷歌這(zhè)一輪的發(fā)力,讓我們精神一振——它隻是慢了,并不是噶了。

對(duì)打GPT-4的PaLM 2登台、Duet AI整進(jìn)谷歌辦公全家桶Workspace、Bard超強進(jìn)化向(xiàng)所有人開(kāi)放、谷歌搜索加入AI快照、AI新功能(néng)整合進(jìn)Android 14、AI魔術編輯器加入谷歌相冊等等。

這(zhè)屆I/O大會,可謂眼花缭亂,精彩紛呈。

01 PALM 2秀肌肉,手機也能(néng)跑

OpenAI的GPT-4,已經(jīng)被(bèi)全世界公認爲最強大的語言模型。

怎麼(me)對(duì)打GPT-4?谷歌的答案,就是PaLM 2。

恰在今天,谷歌一同發(fā)布了PaLM 2技術報告。

論文地址:https://ai.google/static/documents/palm2techreport.pdf

顯然,PaLM2被(bèi)寄予了厚望,以縮小谷歌和微軟之間在AI方面(miàn)的差距。

劈柴介紹說,因爲廣泛的邏輯和推理訓練,PaLM 2模型在邏輯和推理方面(miàn)更加強大。據說,PaLM 2在超過(guò)100多種(zhǒng)語言的多語言文本上進(jìn)行了訓練。

根據基準測試,對(duì)于具有思維鏈prompt或自洽性的MATH、GSM8K和MGSM基準評估,PaLM 2的部分結果超越了GPT-4。

據谷歌高級研究主管Slav Petrov介紹,PaLM 2在推理、編碼和翻譯上都(dōu)表現更好(hǎo),與2022年4月發(fā)布的第一代PaLM相比,PaLM 2有了明顯的改進(jìn)。

可以看到,PaLM 2的推理能(néng)力,得到了顯著的改進(jìn)

修改代碼bug後(hòu),用韓語評論。

比如,PaLM 2能(néng)夠理解不同語言的成(chéng)語。

比起(qǐ)PaLM,在最新專業語言熟練度考試中的表現,PaLM 2的日語水平達到了A級,而PaLM達到了F級。PaLM 2的法語水平達到了C1級。

德語「Ich verstehe nur Bahnhof」如果直譯,就是「我隻理解火車站」,但如果你問它,你是不是理解錯誤了?

它馬上就會告訴你,沒(méi)錯,這(zhè)個德語的意思是「你說的啥?我什麼(me)都(dōu)聽不懂」。

再比如,和波斯諺語「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文諺語是什麼(me)?

在相關論文中,谷歌工程師聲稱PaLM 2的語言能(néng)力已經(jīng)「足以教授這(zhè)門語言」,原因是其訓練數據中的非英語文本更爲普遍。

PaLM 2包含了4個不同參數的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn),并在特定領域的數據上進(jìn)行了微調,爲企業客戶執行某些任務。

這(zhè)些微調就像給一個卡車底盤,加上一個新的發(fā)動機或前保險杠,以在某些特定任務上更好(hǎo)地工作。

這(zhè)樣(yàng)的優勢不言而喻,不用花費大量的時間和資源來創建,直接部署。

另外,PaLM2有一個基于健康數據訓練的版本Med-PaLM 2,可以輕松通過(guò)美國(guó)醫學(xué)執照考試,達到「專家」水平。

一個基于網絡安全數據訓練的版本Sec-PaLM 2,可以解釋潛在惡意腳本的行爲,檢測到代碼中的威脅。這(zhè)兩(liǎng)種(zhǒng)模型都(dōu)將(jiāng)通過(guò)谷歌雲提供給特定客戶。

目前,PaLM 2已經(jīng)應用在25種(zhǒng)功能(néng)和産品中,包括辦公全家桶、聊天機器人Bard、搜索等等。

值得稱贊的是,PaLM 2最輕量版本Gecko小到可以在手機上運行,每秒可以處理20個token,大約每秒16或17個單詞。

不過(guò),谷歌沒(méi)有提及具體用什麼(me)硬件來測試這(zhè)個模型,隻是說在「最新的手機上」運行。

顯然,這(zhè)次谷歌在大語言模型的小型化上,取得了非常重要的進(jìn)步。在雲端運行這(zhè)種(zhǒng)AI,往往是很昂貴的,如果能(néng)在本地運行,無疑有著(zhe)許多顯著優勢,比如隐私保護。

英偉達科學(xué)家Jim Fan對(duì)此大加贊許——

下一波LLM將(jiāng)是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成(chéng)本,而且還(hái)爲用戶體驗開(kāi)辟了全新的途徑。例如,一個元應用程序可以從你的移動工作流程中學(xué)習,并爲你實現自動化。在小屏幕上節省的生産力,將(jiāng)比在大屏幕上多得多。

此前,谷歌一直被(bèi)嘲在AI研究上已經(jīng)落後(hòu)于微軟,PaLM 2,無疑是谷歌的一次重大回擊。

但PaLM 2同樣(yàng)也面(miàn)臨著(zhe)一些争議,比如訓練語言模型的數據是否合法?

谷歌隻是提到訓練語料庫來自「網絡文檔、書籍、代碼、數學(xué)和對(duì)話數據」,但并沒(méi)有進(jìn)一步的細節。

而大語言模型的幻覺問題,同樣(yàng)無法避免。谷歌研究副總裁Zoubin Ghahramani表示,PaLM 2是對(duì)早期模型的改進(jìn),谷歌「投入了大量精力,不斷改進(jìn)基礎性和歸因指标」。

但他承認,在打擊AI産生的虛假信息方面(miàn),大家都(dōu)還(hái)有很長(cháng)的路要走。

除了PALM 2,谷歌還(hái)宣布了正在訓練的全新基礎模型Gemini。這(zhè)是第一個多模态模型,同樣(yàng)包含了參數大小不同的模型。

除了介紹模型,谷歌還(hái)特地介紹了開(kāi)發(fā) AI 技術的社會責任感,包括兩(liǎng)個判别AI生成(chéng)内容的工具:

- watermarking(嵌入水印)

- metadata(嵌入元數據)

02 Duet AI:辦公全家桶新升級

此前,微軟Copilot把GPT-4整進(jìn)了全系辦公産品,掀起(qǐ)了震驚全世界的辦公軟件革命。

怎麼(me)破?谷歌這(zhè)次祭出了Duet AI,給谷歌辦公全家桶Workspace來了一個全新升級。

其實呢,這(zhè)也就是新瓶裝舊酒,Duet AI就是Docs和Gmail等軟件中AI工具的新名字。

谷歌希望,生成(chéng)式AI能(néng)讓Gmail、Docs、Sheets和Slides更有用,不過(guò)目前,大部分功能(néng)還(hái)在開(kāi)發(fā)中。

Duet AI會涵蓋谷歌的各種(zhǒng)辦公軟件,包括在文檔和Gmail中的寫作輔助、幻燈片的圖片生成(chéng)、Meet的自動會議摘要等等。

在文檔中,隻要點「Help me write」,Duet AI就能(néng)自動幫你生成(chéng)招聘啓事(shì)。

好(hǎo)玩的是,你還(hái)可以規定任意文風,比如讓它古怪的調調寫出一個工作描述。

在Google Slids中,Duet AI能(néng)直接從幻燈片中的文本生成(chéng)圖像。

簡單描述一下,合意的圖片立馬生成(chéng)。

想做一個遛狗業務的收費表?描述一下,它就給你自動生成(chéng)。

而I/O大會上一個真正的新事(shì)兒是,寫作輔助也會應用在移動端的Gmail上,這(zhè)是對(duì)Smart Compose的升級。

現在,如果想試用這(zhè)些新工具,需要注冊Workspace Labs,加入候補名單。

好(hǎo)消息是,現在任何人都(dōu)可以申請加入候補名單了,不過(guò)目前尚不清楚用戶何時可以訪問。谷歌的說法是,將(jiāng)在未來幾周内將(jiāng)服務擴展到「更多的用戶和國(guó)家」。

目前唯一可靠的消息是,Gmail的移動程序上會出現「Help me write」AI助手,此前微軟也曾推出類似産品,將(jiāng)必應集成(chéng)到iOS和Android的SwiftKey鍵盤中。

03 Bard又雙叒叕便強了

發(fā)布會上,谷歌還(hái)宣布了一個重磅消息。

那就是,Bard未來也能(néng)像ChatGPT一樣(yàng),接入網絡,實時搜索網頁。

這(zhè)次,Bard上新了不少功能(néng),比如支持了兩(liǎng)種(zhǒng)新的語言——日語和韓語,用戶目前可以更簡便地把生成(chéng)的文本導出到谷歌文檔和Gmail,可視化搜索,以及深色模式等等。

不過(guò),最令用戶開(kāi)心的,想必是谷歌決定取消Bard的等候名單——將(jiāng)在180個國(guó)家或地區提供服務。

此外,和Adobe的AI圖像生成(chéng)功能(néng),以及Instacart和OpenTable等第三方服務的功能(néng)整合也正在路上。

總的來看,這(zhè)些上新是給老Bard注入的一針強心劑。

目前,谷歌正在使Bard變得更加可視化,讓Bard能(néng)夠分析圖像,并且能(néng)在查詢結果中提供圖像信息等等。

關于這(zhè)一方面(miàn),谷歌在發(fā)布會上展示了一個案例。

假如用戶問Bard,美國(guó)的新奧爾良有哪些必看的景點,那麼(me)Bard就能(néng)圖文并茂的解答這(zhè)個問題。

就像用戶在谷歌搜圖中問同樣(yàng)的問題一樣(yàng)。

你還(hái)可以,用Bard起(qǐ)草郵件,并一鍵導入Gmail,還(hái)有文檔中。

而另一個更好(hǎo)玩兒的功能(néng)是用圖像提示系統。該功能(néng)由Google Lens提供,它能(néng)夠識别圖片中的物體。

比方說,上傳一張狗狗的照片,然後(hòu)給一個prompt「爲這(zhè)兩(liǎng)隻狗寫編一個有趣的标題」。Google Lens就可以識别狗狗的品種(zhǒng),然後(hòu)Bard就能(néng)寫下與這(zhè)兩(liǎng)隻狗狗特征相關的内容。

該功能(néng)目前可能(néng)還(hái)不太完善,雖說潛力無限。未來如何取決于系統的整合程度。

雖說對(duì)Bard來講,這(zhè)是一個相當重大的更新,但和OpenAI的ChatGPT,以及微軟的Bing之間的差距仍然是肉眼可見的。

要知道(dào),微軟在3月就給Bing增加了由OpenAI的DALL-E系統支持的AI圖像生成(chéng)功能(néng)。而OpenAI和微軟一直在探索如何將(jiāng)聊天機器人與更多種(zhǒng)的網絡服務相結合。

不僅如此,OpenAI早些時候還(hái)宣布了ChatGPT將(jiāng)和OpenTable預訂餐廳,以及Instacart訂貨配送的功能(néng)相結合。

谷歌表示,這(zhè)些功能(néng)自己之後(hòu)也會有的。

04 代碼能(néng)力up

谷歌表示,升級後(hòu)的Bard將(jiāng)會非常擅長(cháng)處理有關代碼的問題,包括調試和解釋20多種(zhǒng)語言的代碼。

因此,今天發(fā)布會上的一些升級主要集中在這(zhè)個方面(miàn)上。

包括新的深色模式,改進(jìn)的代碼引用功能(néng)——不僅能(néng)提供來源,還(hái)能(néng)解釋代碼片段,以及一個新的導出功能(néng)。

用戶可以把代碼發(fā)送到谷歌的Colab平台,還(hái)能(néng)和另一個基于浏覽器的IDE——Replit一起(qǐ)使用(從Python查詢開(kāi)始)。

隻要選中代碼,就可以一鍵導出到Colab或者Replit。

還(hái)支持20+種(zhǒng)編程語言。基本涵蓋了碼農們所需的所有編程需要。

甚至還(hái)能(néng)直接詢問Bard怎麼(me)用某一種(zhǒng)語言實現某種(zhǒng)功能(néng)。隻要prompt到位,生成(chéng)一串代碼也就是幾秒鍾的事(shì)。

寫完以後(hòu),還(hái)能(néng)就著(zhe)某一行代碼進(jìn)行解釋,以及完善。

如此看來,結合了PaLM2的Bard應該會在生成(chéng)質量上有明顯的提升。當然,具體表現如何,還(hái)得再觀察。

05 對(duì)戰必應,谷歌AI搜索已來

此前,整合進(jìn)GPT的必應勢如破竹,真正威脅到了谷歌的搜索市場。

爲了與微軟必應競争,谷歌同在今天推出了由PaLM 2驅動的全新搜索引擎。

它能(néng)夠提供問題回答的摘要,比如問「爲什麼(me)酵母面(miàn)包仍然如此受歡迎?」,谷歌搜索就給出幾段詳細描述酵母的味道(dào)、其益生元能(néng)力的優勢等等。

另外,在生成(chéng)内容旁,給出了3個鏈接,以證明摘要中的内容。這(zhè)樣(yàng)以減少AI在生成(chéng)内容上出現「幻覺」問題。

當你搜索藍牙音箱,首先頂部有一個簡短的摘要,詳細說明了購買時應注意的事(shì)項:電池壽命、防水性、音質。

右邊是三個購買指南的鏈接,下面(miàn)是6個不錯選擇的購物鏈接,每個旁邊都(dōu)有一個 AI 生成(chéng)的摘要。

可以看到,這(zhè)是谷歌搜索結果頁面(miàn)的new look。把AI生成(chéng)内容放在最開(kāi)始。

比起(qǐ)重新設計的微軟必應,搜索結果頂部的AI框對(duì)谷歌來說更像是,一個小小的更新。

值得注意的是,要是想要訪問這(zhè)一功能(néng),你必須選擇Search Generative Experience(SGE)這(zhè)一新功能(néng)。

并非所有搜索都(dōu)會有AI生成(chéng)的答案。隻有當谷歌的算法認爲它比标準答案更有用時,AI内容才會出現,而像健康、财務等敏感主題完全不會有AI生成(chéng)。

谷歌表示,其改進(jìn)後(hòu)的搜索引擎能(néng)夠以對(duì)話方式跟蹤原始搜索查詢的選項,無需重複已經(jīng)提供的上下文或細節。

然而,谷歌搜索也不是無所不能(néng),也存在從未完全解決過(guò)的問題——結構編排(orchestration of structure)。

因爲大部分數據儲存在互聯網上,甚至谷歌内部,但將(jiāng)所有這(zhè)些數據放在一起(qǐ)形成(chéng)一個連貫的答案真的很難。

目前,已經(jīng)開(kāi)放候補名單僅限美國(guó),谷歌表示,未來幾個月將(jiāng)考慮更廣泛地推出這(zhè)一功能(néng)。

06 一鍵退款,智能(néng)P圖,沉浸導航

一鍵生成(chéng)退款郵件?

谷歌行。

劈柴在發(fā)布會一開(kāi)始就整了個小活。航班取消了得退款?不會寫申請退款的郵件?

gmail會。

隻要在prompt欄裡(lǐ)輸入要求,gmail分分鍾生成(chéng)了一篇有理有據有節的退款申請郵件。

另外,谷歌Map現在也有了沉浸式view,你想去哪,怼臉的實景導航來了。

你還(hái)能(néng)順便問問空氣質量、天氣、交通狀況,都(dōu)能(néng)即時演示。

Magic Editor是谷歌最新公布的照片處理功能(néng),使用生成(chéng)性AI,可以讓用戶在沒(méi)有專業工具的情況下對(duì)照片進(jìn)行各種(zhǒng)編輯。

不會p圖星人的福音來了?

發(fā)布會上,谷歌分享了幾個應用了這(zhè)項新功能(néng)的案例,不得不說,效果酷炸了。

比如下面(miàn)這(zhè)張,Magic Editor一鍵把瀑布前的人像挪到了側面(miàn),還(hái)把背景中别的遊客p掉了。不僅如此,本來多雲的天氣硬是給p藍了。

再比如下面(miàn)這(zhè)張,Magic Editor一鍵將(jiāng)長(cháng)凳上的小孩連著(zhe)凳子一起(qǐ)移到了中間,自動補齊了多出來的椅子,還(hái)把原畫中缺失的氣球補齊了。

而且天也p藍了。

當然,這(zhè)項功能(néng)還(hái)沒(méi)到最完美的地步。就比方說,仔細看看上面(miàn)這(zhè)張圖片,凳子挪動了,可是底下的影子沒(méi)動。

但總歸,這(zhè)項功能(néng)對(duì)照片本身的理解是革命性的。

當然,咱現在還(hái)不用太擔心是不是有的圖片被(bèi)Magic Editor處理過(guò)。因爲谷歌說了,下半年才會推出這(zhè)項功能(néng)。

07 AI筆記本Project Tailwind

學(xué)生黨福音來了。

不得不說,谷歌還(hái)真把學(xué)生們拿捏住了。

Project Tailwind從本質上講,就是個筆記本,但是加了AI的能(néng)力。

一下子就不一樣(yàng)了。

用戶可以像問導師或者學(xué)習搭子一樣(yàng)進(jìn)行在Tailwind裡(lǐ)進(jìn)行檢索。

雖說谷歌把這(zhè)個功能(néng)其定位爲學(xué)生服務的工具,但是對(duì)于日常需要處理大量文本的打工人來說,也是重大利好(hǎo)。

谷歌産品管理高級總監表示,Tailwind就像一個真正的筆記本一樣(yàng),你在裡(lǐ)面(miàn)記東西,而這(zhè)些内容就是AI學(xué)習的對(duì)象。

用戶可以簡便地從谷歌雲端硬盤中挑選文件,有效創建了一個兼具個性化和私人屬性的AI模型。

目前,該功能(néng)在大學(xué)校園内進(jìn)行了廣泛的測試。

在示例演示中,Tailwind收集了一大堆學(xué)習筆記,然後(hòu),生成(chéng)了包括主題詞在内的很多内容,比如,用戶可以爲特定主題創建術語表。

Tailwind不僅僅能(néng)爲學(xué)生服務,它對(duì)任何從不同來源獲取信息的人都(dōu)有幫助。

隐藏在Tailwind背後(hòu)的理念是,爲什麼(me)我們不能(néng)爲每個用戶定制不同的AI語言模型呢?

當然,這(zhè)裡(lǐ)存在兩(liǎng)個問題。

一方面(miàn)是成(chéng)本問題。訓練語言模型所需的計算需求和微調成(chéng)本都(dōu)很高,誰來負擔這(zhè)個成(chéng)本?另一方面(miàn)則是信息安全性。

畢竟,捏造信息這(zhè)種(zhǒng)事(shì)可一點都(dōu)不稀奇,誰能(néng)保證個性化的筆記本不會出現同樣(yàng)的問題呢。

不過(guò),是騾子是馬還(hái)得拉出來遛遛。用戶目前可以注冊Project Tailwind進(jìn)行測試。該功能(néng)也是AI Labs計劃的一部分。

08 安卓開(kāi)發(fā)小助手

此外,谷歌I/O大會上還(hái)推出了專爲Android開(kāi)發(fā)的AI編碼機器人Studio Bot。

不僅可以生成(chéng)代碼、修複BUG,甚至能(néng)夠回答關于安卓應用開(kāi)發(fā)的相關問題。

同時支持Kotlin和Java編程語言,并將(jiāng)直接嵌入到Android Studio開(kāi)發(fā)工具的工具欄中。


标簽: 科技

版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com

特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有

聯系我們

輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ:210603461

Emile:hezuo@lyzg168.com

地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站:https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光,了解我們的服務與最新資訊。

Copyright © ​2018-2019 洛陽霆雲網絡科技有限公司