首頁 / 新聞 / 瘋狂污染互聯網,人類比 AI 擅長(cháng)多了

瘋狂污染互聯網,人類比 AI 擅長(cháng)多了

作者: 兆光科技 發(fā)布時間: 2024/08/08 點擊: 8975次

AI 污染不僅影響現在,也可能(néng)帶偏未來

制造垃圾 

還(hái)是 

提高下限 

 

人們最擔心的事(shì)情還(hái)是發(fā)生了。 

一位網友在提問 New Bing 時,答案出現了事(shì)實性錯誤,他點開(kāi)參考鏈接時發(fā)現,作爲引用源的知乎回答,居然也是 AI 生成(chéng)的。 

回看這(zhè)個知乎賬号,遣詞造句盡顯 AI 風味,答題速度迅雷不及掩耳,目前已經(jīng)被(bèi)禁言了。 

被(bèi)看到的冰山一角,指向(xiàng)了一個惡性循環:AI 生成(chéng)錯誤信息,這(zhè)些信息又被(bèi)喂給更多的 AI,導緻互聯網的信息質量越來越差。 

但硬要較真,AI 污染互聯網,不全是 AI 的鍋。 

AI 造假,神乎其技 

生成(chéng)式 AI 有概率輸出錯誤信息,這(zhè)是刻進(jìn) DNA 的頑疾,聯網能(néng)夠緩解部分症狀,因爲可以參考多個信息源,但沒(méi)想到這(zhè)麼(me)快,我們因此陷入了新的混沌,正如古早的計算機格言: 

garbage in, garbage out(垃圾進(jìn),垃圾出)。 

AI 正在悄悄創作越來越多的“假冒僞劣”,說不定你在沖浪的時候就遇到過(guò)。 

國(guó)内外已經(jīng)發(fā)生了好(hǎo)幾起(qǐ) AI 假新聞事(shì)件。 

今年 4 月,多達 21 個賬号同時發(fā)布了一條駭人聽聞的消息:甘肅一火車撞上修路工人,緻 9 人死亡。 

網警初步判斷信息不實,鎖定了深圳某自媒體公司,經(jīng)過(guò)取證後(hòu)發(fā)現,犯罪嫌疑人在全網搜索近幾年社會熱點新聞,并通過(guò) ChatGPT 修改編輯,再將(jiāng)内容多次上傳。 

國(guó)外知名科技媒體 CNET,也在年初被(bèi)曝光用 AI 偷偷生成(chéng)文章,其中 77 篇存在不少錯誤。 

新聞可信度評級機構 NewsGuard 甚至發(fā)現,涉及 7 種(zhǒng)語言的 49 個新聞網站,内容大部分或完全由 AI 生成(chéng)。 

它們“師出同門”但各有千秋,有的杜撰虛假信息,有的重寫其他媒體報道(dào),其中産量高的每天發(fā)出數百篇文章。 

最有趣的來了,NewsGuard 是通過(guò)搜索“As an AI language model”等 AI 常用短語發(fā)現這(zhè)些網站的。連 AI 的口頭禅都(dōu)不删去,髒活也做得太過(guò)粗糙。 

若在社交媒體和點評網站查找類似内容,你也會發(fā)現無腦複制 AI 的賬号已經(jīng)大行其道(dào)。 

亞馬遜一款吸塵器的虛假評價不遮不掩:“作爲一個 AI 語言模型,我沒(méi)有親自使用過(guò)這(zhè)個産品,但根據它的功能(néng)和用戶評論,我可以自信地給它打 5 星。”AI 騙人這(zhè)麼(me)誠實,背後(hòu)原因令人暖心。 

不隻文本,圖片和視頻的深度造假也越發(fā)爐火純青。 

穿著(zhe)羽絨服的教皇,被(bèi)視作第一個真正大規模的 AI 虛假信息案例,當時在Twitter的浏覽量達到 2600 多萬次。“AI 生成(chéng)圖片”的說明,後(hòu)來才補充在圖片下方。 

更多的模仿随之而來。特朗普下鄉再就業,在街頭拉黃包車;異形體驗生活,上了一天的班然後(hòu)深夜買醉……更有甚者,用 AI 生成(chéng)“新聞圖片”,對(duì)不存在的曆史言之鑿鑿。 

TikTok 上的“湯姆·克魯斯”,以假亂真的程度,本人看了也得犯迷糊。 

風險與你不一定隔著(zhe)屏幕,也可能(néng)已經(jīng)蟄伏身邊。 

今年 4 月,技術專欄作家 Joanna Stern 做了一項實驗,錄制 30 分鍾的視頻和 2 個小時的音頻,然後(hòu)用 AI 克隆了自己,它甚至騙過(guò)了銀行和她的家人。 

AI 讓我們對(duì)那些曾經(jīng)不容置疑的事(shì)物,也抱有基本的警惕心。 

當你連接到互聯網,你和 AI 都(dōu)會消費 AI 生成(chéng)的内容,這(zhè)個時刻已經(jīng)到來。 

AI 污染不僅影響現在,也可能(néng)帶偏未來 

以上這(zhè)些是 AI 污染互聯網的現狀,往後(hòu)的發(fā)展可能(néng)更讓人不安。 

讓人類中招的同時,回旋镖也將(jiāng)打在 AI 身上。 

一項英國(guó)和加拿大的研究發(fā)現,當人類越來越多地通過(guò) AI 生成(chéng)内容,它們會大量進(jìn)入在線數據庫,被(bèi)用來訓練未來的 AI,如果一代又一代地延續下去,最終將(jiāng)導緻“模型崩潰”。 

具體來說,随著(zhe)時間的推移,AI 生成(chéng)的錯誤會複合,造成(chéng)從中學(xué)習的下一代 AI 更加錯誤地感知現實,并迅速忘記大部分原始數據,無法區分事(shì)實和虛構。研究人員打了一個生動的比喻: 

就像用塑料垃圾散布海洋、用二氧化碳攻占大氣,我們即將(jiāng)用廢話填滿互聯網。 

作爲結果,通過(guò)抓取互聯網數據訓練新模型,將(jiāng)變得更加困難。 

雪上加霜的是,内容平台們打算築起(qǐ)城牆,讓免費的、高質量的公開(kāi)數據有了門檻。 

前段時間,“美國(guó)貼吧”Reddit 計劃對(duì) API 進(jìn)行收費,原因是他們的内容正在被(bèi)白嫖給 AI 訓練,ChatGPT 和 Google Bard 之前都(dōu)爬過(guò) Reddit 的數據。 

Reddit CEO 表示,Reddit 的語料庫非常有價值,他們不想把這(zhè)些内容免費提供給巨頭。 

Reddit 的 API 收費,對(duì) OpenAI、Google 等家底深厚的玩家影響不大,但 AI 初創公司獲取數據更難了。那些長(cháng)期依附 Reddit 的第三方應用,更是在這(zhè)次變革中被(bèi)牽連,帶頭宣布倒下。 

在商言商, Reddit 可能(néng)是在自救,之前盈利主要靠廣告投放,AI 反而挖掘了 Reddit 數據的商業價值,其他 UGC 内容平台說不定也在打算盤,這(zhè)對(duì)很多 AI 初創公司來說不是好(hǎo)事(shì)。 

公開(kāi)數據還(hái)不是唯一的挑戰,不少 AI 初創公司想在金融、醫療等領域構建垂直的 AI 模型,然而獲取專有的訓練數據集并不容易。 

擁有這(zhè)些數據的企業們,更願意和大型科技公司建立合作關系,因爲巨頭的可信度更高,處理數據的方式更好(hǎo),更能(néng)保障數據安全。 

高質量數據是 AI 模型的護城河,獲取數據卻或多或少地成(chéng)了一場利益的博弈,將(jiāng)互聯網劃分爲孤島,或者幹脆排資論輩上演軍備競賽。 

一方面(miàn),互聯網的内容本就參差不齊,另一方面(miàn),互聯網又趨向(xiàng)封閉。未來各家的 AI 要如何接收優質内容訓練和微調,成(chéng)了一個懸而不決的問題。 

至少在互聯網數據這(zhè)塊,AI 還(hái)真可能(néng)“自給自足”。劍橋大學(xué)教授 Ross Anderson 指出,目前,大多數在線文本都(dōu)由人類編寫,但它們已經(jīng)被(bèi)用來訓練 GPT-3.5 和 GPT-4,未來,越來越多的文本將(jiāng)由大語言模型編寫。 

那麼(me),如何避免 AI 生成(chéng)内容質量下降,一代不如一代?英國(guó)和加拿大團隊提出了兩(liǎng)種(zhǒng)方法。 

一是保留原始數據集的副本,并避免它被(bèi) AI 生成(chéng)的數據污染,然後(hòu)可以基于這(zhè)些數據,定期重新訓練或者從頭刷新模型。 

二是將(jiāng)新的、幹淨的、人類生成(chéng)的數據集,重新引入到模型訓練中。然而,前提是存在某種(zhǒng)可行的方式,區分 AI 和人類生成(chéng)的内容。 

ChatGPT 的數據源截至 2021 年 9 月,在那之前的互聯網可能(néng)是最後(hòu)一片淨土。 

從此以後(hòu)我們踏進(jìn)了暗流湧動的世界,困境擺在眼前,應對(duì)措施懸在空中。 

被(bèi)用來制造垃圾的 AI,本該提高互聯網的下限 

不過(guò),互聯網被(bèi)污染的鍋,不該全由 AI 來擔。 

事(shì)實上,AI 本該用來提高互聯網内容的下限,在 ChatGPT 前身 GPT-3 的時代,已經(jīng)有人將(jiāng)它作爲寫作工具了。 

AI 從新鮮的玩具變成(chéng)提升生産力的工具是必然的趨勢,因爲它學(xué)習了海量知識,擅長(cháng)寫出有闆有眼的文章和代碼,如果再由人力審核和編輯,其實已經(jīng)比不少“内容農場”的質量要高。 

“内容農場”指的是那些快速生産内容、從而賺取流量和廣告費的網站。 

這(zhè)類網站通常找不到作者,摻雜大量廣告,搶占搜索頁面(miàn)的前排,内容多半缺乏原創且無法保證真實性,很可能(néng)是盜取或拼湊他人文章,有來源不明、質量低劣、翻譯不準等問題。 

現在,AI 卻被(bèi)拿來制造新的内容農場,這(zhè)是人類出于利益的選擇。除了各種(zhǒng)假新聞和假圖片,電子書網站、科幻雜志投稿等,也被(bèi) AI 批量生産的垃圾充斥。 

軟件工程師 Chris Cowell 花了一年多的時間,編寫了一本技術指南。結果在這(zhè)本書發(fā)行前,亞馬遜已經(jīng)出現了相同主題的、由 AI 生成(chéng)的電子書。 

他擔心的不是銷量,而是這(zhè)種(zhǒng)低質量、低價格、省時省力的 AI 寫作,會讓同樣(yàng)打算編寫小衆書籍的人類産生”寒蟬效應”,降低寫作熱情,不願意再發(fā)出聲音。 

AI 初創公司 Hugging Face 的首席倫理科學(xué)家 Margaret Mitchell 警告,随著(zhe) AI 生成(chéng)的内容越來越多,我們可能(néng)讀到大量不符事(shì)實的内容,但又無法追溯真相。 

這(zhè)就像是一個 AI 主導的“後(hòu)真相世界”。 

”後(hòu)真相”指的是,客觀事(shì)實在塑造公衆輿論方面(miàn)的影響力,反而低于訴諸情感和個人信仰的内容。它被(bèi)《牛津詞典》評爲 2016 年年度詞彙,至今依然适用。 

前段時間,路透社一項針對(duì) 9.3 萬多名成(chéng)年人的調查發(fā)現,用 TikTok 看新聞的年輕人越來越多了。至于内容有多可信,那就得打個問号。 

最近,TikTok 流傳著(zhe)泰坦尼克号從未沉沒(méi)的說法,有理有據也就罷了,卻隻見張口就來的陰謀論。有人用魔法打敗魔法,制作辟謠視頻,關注度并不低,但沒(méi)有謠言出圈。 

一位研究泰坦尼克号 60 年的專家感歎:”看到這(zhè)麼(me)多垃圾出現,讓人有點洩氣。”

更讓他擔心的是,這(zhè)類内容的受衆裡(lǐ)有很多青少年,他們使用 TikTok 的時間越長(cháng),就越相信自己所看到的,然後(hòu)算法推薦更多相關内容,應接不暇地激發(fā)快感,將(jiāng)他們徹底包圍。 

更多類似的趨勢在上演。 

斷章取義、支離破碎的片段式消息流轉于社交媒體,但嚴肅内容又可能(néng)被(bèi)評論”太長(cháng)不看”。 

制作粗糙的短視頻,促使新的“黃色新聞”興起(qǐ)。或是家長(cháng)裡(lǐ)短的擺拍,或是沒(méi)有營養的奇聞逸事(shì),讓人想罵一句“沒(méi)有新聞可以不發(fā)”。 

5 分鍾的小帥小美式電影解說,則是适合下飯的“電子榨菜”,空鏡和轉場什麼(me)的不重要,將(jiāng)人物标簽化,選取最獵奇或懸疑的情節講解就好(hǎo)。 

所以,在 ChatGPT 之前,互聯網已經(jīng)内容降級,它不止關乎具體内容,更關乎用戶的媒介使用習慣,如果 AI 被(bèi)用來加速這(zhè)個過(guò)程,然後(hòu)再被(bèi)這(zhè)些數據訓練,那麼(me)人類將(jiāng)更加無法抵擋污染。 

嚴肅和通俗内容都(dōu)有受衆,也都(dōu)值得生産,問題的核心并不在這(zhè)裡(lǐ)。尼爾·波茲曼在電視時代就提出警告,媒介社會面(miàn)臨的最大問題,不是電視爲人們提供娛樂性的内容,而是所有的内容都(dōu)以娛樂的形式表現出來。 

相比印刷媒介的嚴肅與有序,電視等大衆媒介瞬間傳遞信息,如果沉溺于技術營造的視覺快感,受衆可能(néng)會漸漸失去獨立思考的能(néng)力。 

互聯網時代不外如是。 

對(duì)視覺化、簡短化、情緒化内容的生産和消費傾向(xiàng),爲 AI 污染互聯網塑造了肥沃土壤,甚至讓人們對(duì)虛假信息的抵抗能(néng)力降低。 

所以,AI 污染互聯網不全是 AI 的鍋,它可以用來完成(chéng)更好(hǎo)的事(shì),也可以讓現狀持續。先是人類選擇想要怎樣(yàng)的世界,然後(hòu) AI 負責放大它。 


标簽: AI

版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com

特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有

聯系我們

輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ:210603461

Emile:hezuo@lyzg168.com

地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站:https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光,了解我們的服務與最新資訊。

Copyright © ​2018-2019 洛陽霆雲網絡科技有限公司