作者: 兆光科技 發(fā)布時間: 2024/08/09 點擊: 765次
谷歌I/O 2023大會,仿佛又給谷歌的支持者們打了一針強心劑。
【新智元導讀】新版PaLM 2超強進(jìn)化,辦公全家桶Workspace全面(miàn)升級,Bard全面(miàn)增強、所有人可用……可以看出,這(zhè)屆I/O大會,谷歌是真的憋出不少大招。
谷歌I/O 2023大會,仿佛又給谷歌的支持者們打了一針強心劑。
此前,因爲微軟和OpenAI的優異表現,谷歌已經(jīng)被(bèi)唱衰了很久。
但是,畢竟是做出了衆多奠基性工作的AI老牌公司,谷歌這(zhè)一輪的發(fā)力,讓我們精神一振——它隻是慢了,并不是噶了。
對(duì)打GPT-4的PaLM 2登台、Duet AI整進(jìn)谷歌辦公全家桶Workspace、Bard超強進(jìn)化向(xiàng)所有人開(kāi)放、谷歌搜索加入AI快照、AI新功能(néng)整合進(jìn)Android 14、AI魔術編輯器加入谷歌相冊等等。
這(zhè)屆I/O大會,可謂眼花缭亂,精彩紛呈。
OpenAI的GPT-4,已經(jīng)被(bèi)全世界公認爲最強大的語言模型。
怎麼(me)對(duì)打GPT-4?谷歌的答案,就是PaLM 2。
恰在今天,谷歌一同發(fā)布了PaLM 2技術報告。
論文地址:https://ai.google/static/documents/palm2techreport.pdf
顯然,PaLM2被(bèi)寄予了厚望,以縮小谷歌和微軟之間在AI方面(miàn)的差距。
劈柴介紹說,因爲廣泛的邏輯和推理訓練,PaLM 2模型在邏輯和推理方面(miàn)更加強大。據說,PaLM 2在超過(guò)100多種(zhǒng)語言的多語言文本上進(jìn)行了訓練。
根據基準測試,對(duì)于具有思維鏈prompt或自洽性的MATH、GSM8K和MGSM基準評估,PaLM 2的部分結果超越了GPT-4。
據谷歌高級研究主管Slav Petrov介紹,PaLM 2在推理、編碼和翻譯上都(dōu)表現更好(hǎo),與2022年4月發(fā)布的第一代PaLM相比,PaLM 2有了明顯的改進(jìn)。
可以看到,PaLM 2的推理能(néng)力,得到了顯著的改進(jìn)
修改代碼bug後(hòu),用韓語評論。
比如,PaLM 2能(néng)夠理解不同語言的成(chéng)語。
比起(qǐ)PaLM,在最新專業語言熟練度考試中的表現,PaLM 2的日語水平達到了A級,而PaLM達到了F級。PaLM 2的法語水平達到了C1級。
德語「Ich verstehe nur Bahnhof」如果直譯,就是「我隻理解火車站」,但如果你問它,你是不是理解錯誤了?
它馬上就會告訴你,沒(méi)錯,這(zhè)個德語的意思是「你說的啥?我什麼(me)都(dōu)聽不懂」。
再比如,和波斯諺語「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文諺語是什麼(me)?
在相關論文中,谷歌工程師聲稱PaLM 2的語言能(néng)力已經(jīng)「足以教授這(zhè)門語言」,原因是其訓練數據中的非英語文本更爲普遍。
PaLM 2包含了4個不同參數的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn),并在特定領域的數據上進(jìn)行了微調,爲企業客戶執行某些任務。
這(zhè)些微調就像給一個卡車底盤,加上一個新的發(fā)動機或前保險杠,以在某些特定任務上更好(hǎo)地工作。
這(zhè)樣(yàng)的優勢不言而喻,不用花費大量的時間和資源來創建,直接部署。
另外,PaLM2有一個基于健康數據訓練的版本Med-PaLM 2,可以輕松通過(guò)美國(guó)醫學(xué)執照考試,達到「專家」水平。
一個基于網絡安全數據訓練的版本Sec-PaLM 2,可以解釋潛在惡意腳本的行爲,檢測到代碼中的威脅。這(zhè)兩(liǎng)種(zhǒng)模型都(dōu)將(jiāng)通過(guò)谷歌雲提供給特定客戶。
目前,PaLM 2已經(jīng)應用在25種(zhǒng)功能(néng)和産品中,包括辦公全家桶、聊天機器人Bard、搜索等等。
值得稱贊的是,PaLM 2最輕量版本Gecko小到可以在手機上運行,每秒可以處理20個token,大約每秒16或17個單詞。
不過(guò),谷歌沒(méi)有提及具體用什麼(me)硬件來測試這(zhè)個模型,隻是說在「最新的手機上」運行。
顯然,這(zhè)次谷歌在大語言模型的小型化上,取得了非常重要的進(jìn)步。在雲端運行這(zhè)種(zhǒng)AI,往往是很昂貴的,如果能(néng)在本地運行,無疑有著(zhe)許多顯著優勢,比如隐私保護。
英偉達科學(xué)家Jim Fan對(duì)此大加贊許——
下一波LLM將(jiāng)是移動原生的。一個離線的、永遠在線的LLM不僅可以降低服務成(chéng)本,而且還(hái)爲用戶體驗開(kāi)辟了全新的途徑。例如,一個元應用程序可以從你的移動工作流程中學(xué)習,并爲你實現自動化。在小屏幕上節省的生産力,將(jiāng)比在大屏幕上多得多。
此前,谷歌一直被(bèi)嘲在AI研究上已經(jīng)落後(hòu)于微軟,PaLM 2,無疑是谷歌的一次重大回擊。
但PaLM 2同樣(yàng)也面(miàn)臨著(zhe)一些争議,比如訓練語言模型的數據是否合法?
谷歌隻是提到訓練語料庫來自「網絡文檔、書籍、代碼、數學(xué)和對(duì)話數據」,但并沒(méi)有進(jìn)一步的細節。
而大語言模型的幻覺問題,同樣(yàng)無法避免。谷歌研究副總裁Zoubin Ghahramani表示,PaLM 2是對(duì)早期模型的改進(jìn),谷歌「投入了大量精力,不斷改進(jìn)基礎性和歸因指标」。
但他承認,在打擊AI産生的虛假信息方面(miàn),大家都(dōu)還(hái)有很長(cháng)的路要走。
除了PALM 2,谷歌還(hái)宣布了正在訓練的全新基礎模型Gemini。這(zhè)是第一個多模态模型,同樣(yàng)包含了參數大小不同的模型。
除了介紹模型,谷歌還(hái)特地介紹了開(kāi)發(fā) AI 技術的社會責任感,包括兩(liǎng)個判别AI生成(chéng)内容的工具:
- watermarking(嵌入水印)
- metadata(嵌入元數據)
此前,微軟Copilot把GPT-4整進(jìn)了全系辦公産品,掀起(qǐ)了震驚全世界的辦公軟件革命。
怎麼(me)破?谷歌這(zhè)次祭出了Duet AI,給谷歌辦公全家桶Workspace來了一個全新升級。
其實呢,這(zhè)也就是新瓶裝舊酒,Duet AI就是Docs和Gmail等軟件中AI工具的新名字。
谷歌希望,生成(chéng)式AI能(néng)讓Gmail、Docs、Sheets和Slides更有用,不過(guò)目前,大部分功能(néng)還(hái)在開(kāi)發(fā)中。
Duet AI會涵蓋谷歌的各種(zhǒng)辦公軟件,包括在文檔和Gmail中的寫作輔助、幻燈片的圖片生成(chéng)、Meet的自動會議摘要等等。
在文檔中,隻要點「Help me write」,Duet AI就能(néng)自動幫你生成(chéng)招聘啓事(shì)。
好(hǎo)玩的是,你還(hái)可以規定任意文風,比如讓它古怪的調調寫出一個工作描述。
在Google Slids中,Duet AI能(néng)直接從幻燈片中的文本生成(chéng)圖像。
簡單描述一下,合意的圖片立馬生成(chéng)。
想做一個遛狗業務的收費表?描述一下,它就給你自動生成(chéng)。
而I/O大會上一個真正的新事(shì)兒是,寫作輔助也會應用在移動端的Gmail上,這(zhè)是對(duì)Smart Compose的升級。
現在,如果想試用這(zhè)些新工具,需要注冊Workspace Labs,加入候補名單。
好(hǎo)消息是,現在任何人都(dōu)可以申請加入候補名單了,不過(guò)目前尚不清楚用戶何時可以訪問。谷歌的說法是,將(jiāng)在未來幾周内將(jiāng)服務擴展到「更多的用戶和國(guó)家」。
目前唯一可靠的消息是,Gmail的移動程序上會出現「Help me write」AI助手,此前微軟也曾推出類似産品,將(jiāng)必應集成(chéng)到iOS和Android的SwiftKey鍵盤中。
發(fā)布會上,谷歌還(hái)宣布了一個重磅消息。
那就是,Bard未來也能(néng)像ChatGPT一樣(yàng),接入網絡,實時搜索網頁。
這(zhè)次,Bard上新了不少功能(néng),比如支持了兩(liǎng)種(zhǒng)新的語言——日語和韓語,用戶目前可以更簡便地把生成(chéng)的文本導出到谷歌文檔和Gmail,可視化搜索,以及深色模式等等。
不過(guò),最令用戶開(kāi)心的,想必是谷歌決定取消Bard的等候名單——將(jiāng)在180個國(guó)家或地區提供服務。
此外,和Adobe的AI圖像生成(chéng)功能(néng),以及Instacart和OpenTable等第三方服務的功能(néng)整合也正在路上。
總的來看,這(zhè)些上新是給老Bard注入的一針強心劑。
目前,谷歌正在使Bard變得更加可視化,讓Bard能(néng)夠分析圖像,并且能(néng)在查詢結果中提供圖像信息等等。
關于這(zhè)一方面(miàn),谷歌在發(fā)布會上展示了一個案例。
假如用戶問Bard,美國(guó)的新奧爾良有哪些必看的景點,那麼(me)Bard就能(néng)圖文并茂的解答這(zhè)個問題。
就像用戶在谷歌搜圖中問同樣(yàng)的問題一樣(yàng)。
你還(hái)可以,用Bard起(qǐ)草郵件,并一鍵導入Gmail,還(hái)有文檔中。
而另一個更好(hǎo)玩兒的功能(néng)是用圖像提示系統。該功能(néng)由Google Lens提供,它能(néng)夠識别圖片中的物體。
比方說,上傳一張狗狗的照片,然後(hòu)給一個prompt「爲這(zhè)兩(liǎng)隻狗寫編一個有趣的标題」。Google Lens就可以識别狗狗的品種(zhǒng),然後(hòu)Bard就能(néng)寫下與這(zhè)兩(liǎng)隻狗狗特征相關的内容。
該功能(néng)目前可能(néng)還(hái)不太完善,雖說潛力無限。未來如何取決于系統的整合程度。
雖說對(duì)Bard來講,這(zhè)是一個相當重大的更新,但和OpenAI的ChatGPT,以及微軟的Bing之間的差距仍然是肉眼可見的。
要知道(dào),微軟在3月就給Bing增加了由OpenAI的DALL-E系統支持的AI圖像生成(chéng)功能(néng)。而OpenAI和微軟一直在探索如何將(jiāng)聊天機器人與更多種(zhǒng)的網絡服務相結合。
不僅如此,OpenAI早些時候還(hái)宣布了ChatGPT將(jiāng)和OpenTable預訂餐廳,以及Instacart訂貨配送的功能(néng)相結合。
谷歌表示,這(zhè)些功能(néng)自己之後(hòu)也會有的。
谷歌表示,升級後(hòu)的Bard將(jiāng)會非常擅長(cháng)處理有關代碼的問題,包括調試和解釋20多種(zhǒng)語言的代碼。
因此,今天發(fā)布會上的一些升級主要集中在這(zhè)個方面(miàn)上。
包括新的深色模式,改進(jìn)的代碼引用功能(néng)——不僅能(néng)提供來源,還(hái)能(néng)解釋代碼片段,以及一個新的導出功能(néng)。
用戶可以把代碼發(fā)送到谷歌的Colab平台,還(hái)能(néng)和另一個基于浏覽器的IDE——Replit一起(qǐ)使用(從Python查詢開(kāi)始)。
隻要選中代碼,就可以一鍵導出到Colab或者Replit。
還(hái)支持20+種(zhǒng)編程語言。基本涵蓋了碼農們所需的所有編程需要。
甚至還(hái)能(néng)直接詢問Bard怎麼(me)用某一種(zhǒng)語言實現某種(zhǒng)功能(néng)。隻要prompt到位,生成(chéng)一串代碼也就是幾秒鍾的事(shì)。
寫完以後(hòu),還(hái)能(néng)就著(zhe)某一行代碼進(jìn)行解釋,以及完善。
如此看來,結合了PaLM2的Bard應該會在生成(chéng)質量上有明顯的提升。當然,具體表現如何,還(hái)得再觀察。
此前,整合進(jìn)GPT的必應勢如破竹,真正威脅到了谷歌的搜索市場。
爲了與微軟必應競争,谷歌同在今天推出了由PaLM 2驅動的全新搜索引擎。
它能(néng)夠提供問題回答的摘要,比如問「爲什麼(me)酵母面(miàn)包仍然如此受歡迎?」,谷歌搜索就給出幾段詳細描述酵母的味道(dào)、其益生元能(néng)力的優勢等等。
另外,在生成(chéng)内容旁,給出了3個鏈接,以證明摘要中的内容。這(zhè)樣(yàng)以減少AI在生成(chéng)内容上出現「幻覺」問題。
當你搜索藍牙音箱,首先頂部有一個簡短的摘要,詳細說明了購買時應注意的事(shì)項:電池壽命、防水性、音質。
右邊是三個購買指南的鏈接,下面(miàn)是6個不錯選擇的購物鏈接,每個旁邊都(dōu)有一個 AI 生成(chéng)的摘要。
可以看到,這(zhè)是谷歌搜索結果頁面(miàn)的new look。把AI生成(chéng)内容放在最開(kāi)始。
比起(qǐ)重新設計的微軟必應,搜索結果頂部的AI框對(duì)谷歌來說更像是,一個小小的更新。
值得注意的是,要是想要訪問這(zhè)一功能(néng),你必須選擇Search Generative Experience(SGE)這(zhè)一新功能(néng)。
并非所有搜索都(dōu)會有AI生成(chéng)的答案。隻有當谷歌的算法認爲它比标準答案更有用時,AI内容才會出現,而像健康、财務等敏感主題完全不會有AI生成(chéng)。
谷歌表示,其改進(jìn)後(hòu)的搜索引擎能(néng)夠以對(duì)話方式跟蹤原始搜索查詢的選項,無需重複已經(jīng)提供的上下文或細節。
然而,谷歌搜索也不是無所不能(néng),也存在從未完全解決過(guò)的問題——結構編排(orchestration of structure)。
因爲大部分數據儲存在互聯網上,甚至谷歌内部,但將(jiāng)所有這(zhè)些數據放在一起(qǐ)形成(chéng)一個連貫的答案真的很難。
目前,已經(jīng)開(kāi)放候補名單僅限美國(guó),谷歌表示,未來幾個月將(jiāng)考慮更廣泛地推出這(zhè)一功能(néng)。
一鍵生成(chéng)退款郵件?
谷歌行。
劈柴在發(fā)布會一開(kāi)始就整了個小活。航班取消了得退款?不會寫申請退款的郵件?
gmail會。
隻要在prompt欄裡(lǐ)輸入要求,gmail分分鍾生成(chéng)了一篇有理有據有節的退款申請郵件。
另外,谷歌Map現在也有了沉浸式view,你想去哪,怼臉的實景導航來了。
你還(hái)能(néng)順便問問空氣質量、天氣、交通狀況,都(dōu)能(néng)即時演示。
Magic Editor是谷歌最新公布的照片處理功能(néng),使用生成(chéng)性AI,可以讓用戶在沒(méi)有專業工具的情況下對(duì)照片進(jìn)行各種(zhǒng)編輯。
不會p圖星人的福音來了?
發(fā)布會上,谷歌分享了幾個應用了這(zhè)項新功能(néng)的案例,不得不說,效果酷炸了。
比如下面(miàn)這(zhè)張,Magic Editor一鍵把瀑布前的人像挪到了側面(miàn),還(hái)把背景中别的遊客p掉了。不僅如此,本來多雲的天氣硬是給p藍了。
再比如下面(miàn)這(zhè)張,Magic Editor一鍵將(jiāng)長(cháng)凳上的小孩連著(zhe)凳子一起(qǐ)移到了中間,自動補齊了多出來的椅子,還(hái)把原畫中缺失的氣球補齊了。
而且天也p藍了。
當然,這(zhè)項功能(néng)還(hái)沒(méi)到最完美的地步。就比方說,仔細看看上面(miàn)這(zhè)張圖片,凳子挪動了,可是底下的影子沒(méi)動。
但總歸,這(zhè)項功能(néng)對(duì)照片本身的理解是革命性的。
當然,咱現在還(hái)不用太擔心是不是有的圖片被(bèi)Magic Editor處理過(guò)。因爲谷歌說了,下半年才會推出這(zhè)項功能(néng)。
學(xué)生黨福音來了。
不得不說,谷歌還(hái)真把學(xué)生們拿捏住了。
Project Tailwind從本質上講,就是個筆記本,但是加了AI的能(néng)力。
一下子就不一樣(yàng)了。
用戶可以像問導師或者學(xué)習搭子一樣(yàng)進(jìn)行在Tailwind裡(lǐ)進(jìn)行檢索。
雖說谷歌把這(zhè)個功能(néng)其定位爲學(xué)生服務的工具,但是對(duì)于日常需要處理大量文本的打工人來說,也是重大利好(hǎo)。
谷歌産品管理高級總監表示,Tailwind就像一個真正的筆記本一樣(yàng),你在裡(lǐ)面(miàn)記東西,而這(zhè)些内容就是AI學(xué)習的對(duì)象。
用戶可以簡便地從谷歌雲端硬盤中挑選文件,有效創建了一個兼具個性化和私人屬性的AI模型。
目前,該功能(néng)在大學(xué)校園内進(jìn)行了廣泛的測試。
在示例演示中,Tailwind收集了一大堆學(xué)習筆記,然後(hòu),生成(chéng)了包括主題詞在内的很多内容,比如,用戶可以爲特定主題創建術語表。
Tailwind不僅僅能(néng)爲學(xué)生服務,它對(duì)任何從不同來源獲取信息的人都(dōu)有幫助。
隐藏在Tailwind背後(hòu)的理念是,爲什麼(me)我們不能(néng)爲每個用戶定制不同的AI語言模型呢?
當然,這(zhè)裡(lǐ)存在兩(liǎng)個問題。
一方面(miàn)是成(chéng)本問題。訓練語言模型所需的計算需求和微調成(chéng)本都(dōu)很高,誰來負擔這(zhè)個成(chéng)本?另一方面(miàn)則是信息安全性。
畢竟,捏造信息這(zhè)種(zhǒng)事(shì)可一點都(dōu)不稀奇,誰能(néng)保證個性化的筆記本不會出現同樣(yàng)的問題呢。
不過(guò),是騾子是馬還(hái)得拉出來遛遛。用戶目前可以注冊Project Tailwind進(jìn)行測試。該功能(néng)也是AI Labs計劃的一部分。
此外,谷歌I/O大會上還(hái)推出了專爲Android開(kāi)發(fā)的AI編碼機器人Studio Bot。
不僅可以生成(chéng)代碼、修複BUG,甚至能(néng)夠回答關于安卓應用開(kāi)發(fā)的相關問題。
同時支持Kotlin和Java編程語言,并將(jiāng)直接嵌入到Android Studio開(kāi)發(fā)工具的工具欄中。
标簽: 科技
版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com
特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有
輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!
Tel:15137991270
企業QQ:210603461
Emile:hezuo@lyzg168.com
地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室
網站:https://www.lyzg168.com
我們的微信
關注兆光,了解我們的服務與最新資訊。
Copyright © 2018-2019 洛陽霆雲網絡科技有限公司