首頁 / 新聞 / 瘋狂污染互聯網，人類比 AI 擅長(cháng)多了

瘋狂污染互聯網，人類比 AI 擅長(cháng)多了

作者: 兆光科技發(fā)布時間: 2024/08/08 點擊: 8975次

AI 污染不僅影響現在，也可能(néng)帶偏未來

制造垃圾

還(hái)是

提高下限

人們最擔心的事(shì)情還(hái)是發(fā)生了。

一位網友在提問 New Bing 時，答案出現了事(shì)實性錯誤，他點開(kāi)參考鏈接時發(fā)現，作爲引用源的知乎回答，居然也是 AI 生成(chéng)的。

回看這(zhè)個知乎賬号，遣詞造句盡顯 AI 風味，答題速度迅雷不及掩耳，目前已經(jīng)被(bèi)禁言了。

被(bèi)看到的冰山一角，指向(xiàng)了一個惡性循環：AI 生成(chéng)錯誤信息，這(zhè)些信息又被(bèi)喂給更多的 AI，導緻互聯網的信息質量越來越差。

但硬要較真，AI 污染互聯網，不全是 AI 的鍋。

AI 造假，神乎其技

生成(chéng)式 AI 有概率輸出錯誤信息，這(zhè)是刻進(jìn) DNA 的頑疾，聯網能(néng)夠緩解部分症狀，因爲可以參考多個信息源，但沒(méi)想到這(zhè)麼(me)快，我們因此陷入了新的混沌，正如古早的計算機格言：

garbage in, garbage out（垃圾進(jìn)，垃圾出）。

AI 正在悄悄創作越來越多的“假冒僞劣”，說不定你在沖浪的時候就遇到過(guò)。

國(guó)内外已經(jīng)發(fā)生了好(hǎo)幾起(qǐ) AI 假新聞事(shì)件。

今年 4 月，多達 21 個賬号同時發(fā)布了一條駭人聽聞的消息：甘肅一火車撞上修路工人，緻 9 人死亡。

網警初步判斷信息不實，鎖定了深圳某自媒體公司，經(jīng)過(guò)取證後(hòu)發(fā)現，犯罪嫌疑人在全網搜索近幾年社會熱點新聞，并通過(guò) ChatGPT 修改編輯，再將(jiāng)内容多次上傳。

國(guó)外知名科技媒體 CNET，也在年初被(bèi)曝光用 AI 偷偷生成(chéng)文章，其中 77 篇存在不少錯誤。

新聞可信度評級機構 NewsGuard 甚至發(fā)現，涉及 7 種(zhǒng)語言的 49 個新聞網站，内容大部分或完全由 AI 生成(chéng)。

它們“師出同門”但各有千秋，有的杜撰虛假信息，有的重寫其他媒體報道(dào)，其中産量高的每天發(fā)出數百篇文章。

最有趣的來了，NewsGuard 是通過(guò)搜索“As an AI language model”等 AI 常用短語發(fā)現這(zhè)些網站的。連 AI 的口頭禅都(dōu)不删去，髒活也做得太過(guò)粗糙。

若在社交媒體和點評網站查找類似内容，你也會發(fā)現無腦複制 AI 的賬号已經(jīng)大行其道(dào)。

亞馬遜一款吸塵器的虛假評價不遮不掩：“作爲一個 AI 語言模型，我沒(méi)有親自使用過(guò)這(zhè)個産品，但根據它的功能(néng)和用戶評論，我可以自信地給它打 5 星。”AI 騙人這(zhè)麼(me)誠實，背後(hòu)原因令人暖心。

不隻文本，圖片和視頻的深度造假也越發(fā)爐火純青。

穿著(zhe)羽絨服的教皇，被(bèi)視作第一個真正大規模的 AI 虛假信息案例，當時在Twitter的浏覽量達到 2600 多萬次。“AI 生成(chéng)圖片”的說明，後(hòu)來才補充在圖片下方。

更多的模仿随之而來。特朗普下鄉再就業，在街頭拉黃包車；異形體驗生活，上了一天的班然後(hòu)深夜買醉……更有甚者，用 AI 生成(chéng)“新聞圖片”，對(duì)不存在的曆史言之鑿鑿。

TikTok 上的“湯姆·克魯斯”，以假亂真的程度，本人看了也得犯迷糊。

風險與你不一定隔著(zhe)屏幕，也可能(néng)已經(jīng)蟄伏身邊。

今年 4 月，技術專欄作家 Joanna Stern 做了一項實驗，錄制 30 分鍾的視頻和 2 個小時的音頻，然後(hòu)用 AI 克隆了自己，它甚至騙過(guò)了銀行和她的家人。

AI 讓我們對(duì)那些曾經(jīng)不容置疑的事(shì)物，也抱有基本的警惕心。

當你連接到互聯網，你和 AI 都(dōu)會消費 AI 生成(chéng)的内容，這(zhè)個時刻已經(jīng)到來。

AI 污染不僅影響現在，也可能(néng)帶偏未來

以上這(zhè)些是 AI 污染互聯網的現狀，往後(hòu)的發(fā)展可能(néng)更讓人不安。

讓人類中招的同時，回旋镖也將(jiāng)打在 AI 身上。

一項英國(guó)和加拿大的研究發(fā)現，當人類越來越多地通過(guò) AI 生成(chéng)内容，它們會大量進(jìn)入在線數據庫，被(bèi)用來訓練未來的 AI，如果一代又一代地延續下去，最終將(jiāng)導緻“模型崩潰”。

具體來說，随著(zhe)時間的推移，AI 生成(chéng)的錯誤會複合，造成(chéng)從中學(xué)習的下一代 AI 更加錯誤地感知現實，并迅速忘記大部分原始數據，無法區分事(shì)實和虛構。研究人員打了一個生動的比喻：

就像用塑料垃圾散布海洋、用二氧化碳攻占大氣，我們即將(jiāng)用廢話填滿互聯網。

作爲結果，通過(guò)抓取互聯網數據訓練新模型，將(jiāng)變得更加困難。

雪上加霜的是，内容平台們打算築起(qǐ)城牆，讓免費的、高質量的公開(kāi)數據有了門檻。

前段時間，“美國(guó)貼吧”Reddit 計劃對(duì) API 進(jìn)行收費，原因是他們的内容正在被(bèi)白嫖給 AI 訓練，ChatGPT 和 Google Bard 之前都(dōu)爬過(guò) Reddit 的數據。

Reddit CEO 表示，Reddit 的語料庫非常有價值，他們不想把這(zhè)些内容免費提供給巨頭。

Reddit 的 API 收費，對(duì) OpenAI、Google 等家底深厚的玩家影響不大，但 AI 初創公司獲取數據更難了。那些長(cháng)期依附 Reddit 的第三方應用，更是在這(zhè)次變革中被(bèi)牽連，帶頭宣布倒下。

在商言商， Reddit 可能(néng)是在自救，之前盈利主要靠廣告投放，AI 反而挖掘了 Reddit 數據的商業價值，其他 UGC 内容平台說不定也在打算盤，這(zhè)對(duì)很多 AI 初創公司來說不是好(hǎo)事(shì)。

公開(kāi)數據還(hái)不是唯一的挑戰，不少 AI 初創公司想在金融、醫療等領域構建垂直的 AI 模型，然而獲取專有的訓練數據集并不容易。

擁有這(zhè)些數據的企業們，更願意和大型科技公司建立合作關系，因爲巨頭的可信度更高，處理數據的方式更好(hǎo)，更能(néng)保障數據安全。

高質量數據是 AI 模型的護城河，獲取數據卻或多或少地成(chéng)了一場利益的博弈，將(jiāng)互聯網劃分爲孤島，或者幹脆排資論輩上演軍備競賽。

一方面(miàn)，互聯網的内容本就參差不齊，另一方面(miàn)，互聯網又趨向(xiàng)封閉。未來各家的 AI 要如何接收優質内容訓練和微調，成(chéng)了一個懸而不決的問題。

至少在互聯網數據這(zhè)塊，AI 還(hái)真可能(néng)“自給自足”。劍橋大學(xué)教授 Ross Anderson 指出，目前，大多數在線文本都(dōu)由人類編寫，但它們已經(jīng)被(bèi)用來訓練 GPT-3.5 和 GPT-4，未來，越來越多的文本將(jiāng)由大語言模型編寫。

那麼(me)，如何避免 AI 生成(chéng)内容質量下降，一代不如一代？英國(guó)和加拿大團隊提出了兩(liǎng)種(zhǒng)方法。

一是保留原始數據集的副本，并避免它被(bèi) AI 生成(chéng)的數據污染，然後(hòu)可以基于這(zhè)些數據，定期重新訓練或者從頭刷新模型。

二是將(jiāng)新的、幹淨的、人類生成(chéng)的數據集，重新引入到模型訓練中。然而，前提是存在某種(zhǒng)可行的方式，區分 AI 和人類生成(chéng)的内容。

ChatGPT 的數據源截至 2021 年 9 月，在那之前的互聯網可能(néng)是最後(hòu)一片淨土。

從此以後(hòu)我們踏進(jìn)了暗流湧動的世界，困境擺在眼前，應對(duì)措施懸在空中。

被(bèi)用來制造垃圾的 AI，本該提高互聯網的下限

不過(guò)，互聯網被(bèi)污染的鍋，不該全由 AI 來擔。

事(shì)實上，AI 本該用來提高互聯網内容的下限，在 ChatGPT 前身 GPT-3 的時代，已經(jīng)有人將(jiāng)它作爲寫作工具了。

AI 從新鮮的玩具變成(chéng)提升生産力的工具是必然的趨勢，因爲它學(xué)習了海量知識，擅長(cháng)寫出有闆有眼的文章和代碼，如果再由人力審核和編輯，其實已經(jīng)比不少“内容農場”的質量要高。

“内容農場”指的是那些快速生産内容、從而賺取流量和廣告費的網站。

這(zhè)類網站通常找不到作者，摻雜大量廣告，搶占搜索頁面(miàn)的前排，内容多半缺乏原創且無法保證真實性，很可能(néng)是盜取或拼湊他人文章，有來源不明、質量低劣、翻譯不準等問題。

現在，AI 卻被(bèi)拿來制造新的内容農場，這(zhè)是人類出于利益的選擇。除了各種(zhǒng)假新聞和假圖片，電子書網站、科幻雜志投稿等，也被(bèi) AI 批量生産的垃圾充斥。

軟件工程師 Chris Cowell 花了一年多的時間，編寫了一本技術指南。結果在這(zhè)本書發(fā)行前，亞馬遜已經(jīng)出現了相同主題的、由 AI 生成(chéng)的電子書。

他擔心的不是銷量，而是這(zhè)種(zhǒng)低質量、低價格、省時省力的 AI 寫作，會讓同樣(yàng)打算編寫小衆書籍的人類産生”寒蟬效應”，降低寫作熱情，不願意再發(fā)出聲音。

AI 初創公司 Hugging Face 的首席倫理科學(xué)家 Margaret Mitchell 警告，随著(zhe) AI 生成(chéng)的内容越來越多，我們可能(néng)讀到大量不符事(shì)實的内容，但又無法追溯真相。

這(zhè)就像是一個 AI 主導的“後(hòu)真相世界”。

”後(hòu)真相”指的是，客觀事(shì)實在塑造公衆輿論方面(miàn)的影響力，反而低于訴諸情感和個人信仰的内容。它被(bèi)《牛津詞典》評爲 2016 年年度詞彙，至今依然适用。

前段時間，路透社一項針對(duì) 9.3 萬多名成(chéng)年人的調查發(fā)現，用 TikTok 看新聞的年輕人越來越多了。至于内容有多可信，那就得打個問号。

最近，TikTok 流傳著(zhe)泰坦尼克号從未沉沒(méi)的說法，有理有據也就罷了，卻隻見張口就來的陰謀論。有人用魔法打敗魔法，制作辟謠視頻，關注度并不低，但沒(méi)有謠言出圈。

一位研究泰坦尼克号 60 年的專家感歎：”看到這(zhè)麼(me)多垃圾出現，讓人有點洩氣。”

更讓他擔心的是，這(zhè)類内容的受衆裡(lǐ)有很多青少年，他們使用 TikTok 的時間越長(cháng)，就越相信自己所看到的，然後(hòu)算法推薦更多相關内容，應接不暇地激發(fā)快感，將(jiāng)他們徹底包圍。

更多類似的趨勢在上演。

斷章取義、支離破碎的片段式消息流轉于社交媒體，但嚴肅内容又可能(néng)被(bèi)評論”太長(cháng)不看”。

制作粗糙的短視頻，促使新的“黃色新聞”興起(qǐ)。或是家長(cháng)裡(lǐ)短的擺拍，或是沒(méi)有營養的奇聞逸事(shì)，讓人想罵一句“沒(méi)有新聞可以不發(fā)”。

5 分鍾的小帥小美式電影解說，則是适合下飯的“電子榨菜”，空鏡和轉場什麼(me)的不重要，將(jiāng)人物标簽化，選取最獵奇或懸疑的情節講解就好(hǎo)。

所以，在 ChatGPT 之前，互聯網已經(jīng)内容降級，它不止關乎具體内容，更關乎用戶的媒介使用習慣，如果 AI 被(bèi)用來加速這(zhè)個過(guò)程，然後(hòu)再被(bèi)這(zhè)些數據訓練，那麼(me)人類將(jiāng)更加無法抵擋污染。

嚴肅和通俗内容都(dōu)有受衆，也都(dōu)值得生産，問題的核心并不在這(zhè)裡(lǐ)。尼爾·波茲曼在電視時代就提出警告，媒介社會面(miàn)臨的最大問題，不是電視爲人們提供娛樂性的内容，而是所有的内容都(dōu)以娛樂的形式表現出來。

相比印刷媒介的嚴肅與有序，電視等大衆媒介瞬間傳遞信息，如果沉溺于技術營造的視覺快感，受衆可能(néng)會漸漸失去獨立思考的能(néng)力。

互聯網時代不外如是。

對(duì)視覺化、簡短化、情緒化内容的生産和消費傾向(xiàng)，爲 AI 污染互聯網塑造了肥沃土壤，甚至讓人們對(duì)虛假信息的抵抗能(néng)力降低。

所以，AI 污染互聯網不全是 AI 的鍋，它可以用來完成(chéng)更好(hǎo)的事(shì)，也可以讓現狀持續。先是人類選擇想要怎樣(yàng)的世界，然後(hòu) AI 負責放大它。

标簽： AI

版權申明：本站文章部分自網絡，如有侵權，請聯系：hezuo@lyzg168.com

特别注意：本站所有轉載文章言論不代表本站觀點，本站所提供的攝影照片，插畫，設計作品，如需使用，請與原作者聯系，版權歸原作者所有

上一篇： 2022中國(guó)半導體制造及封裝材料行業研究報告
下一篇：阿裡(lǐ)變陣這(zhè)件事(shì)，春秋戰國(guó)就有了

猜你喜歡

流程再造的工作，可以放心交給AI嗎？ 2024/08/10
AI加持、全民網紅，Snapchat開(kāi)啓“大改造” 2024/08/10
我們在浪潮中與AI謹慎對(duì)抗 2024/08/10
新工具時代來臨，個個月賺千萬 2024/08/10
2023年中國(guó)智能(néng)視頻編碼行業白皮書 2024/08/10

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ：210603461

Emile：hezuo@lyzg168.com

地址：洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站：https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光，了解我們的服務與最新資訊。

瘋狂污染互聯網，人類比 AI 擅長(cháng)多了

瘋狂污染互聯網，人類比 AI 擅長(cháng)多了

猜你喜歡

推薦閱讀

聯系我們

洛陽霆雲網絡科技有限公司

網站導航

行業咨詢

最新動态

聯系方式