首頁 / 新聞 / 維基百科:ChatGPT or Not? 這(zhè)是一個問題

維基百科:ChatGPT or Not? 這(zhè)是一個問題

作者: 兆光科技 發(fā)布時間: 2024/08/09 點擊: 739次

維基百科勝在知識結構清晰,ChatGPT 長(cháng)于具體問題,雙方未必不可調和。

22 年前,2001 年初,維基百科 Wikipedia 橫空出世,在其後(hòu)的互聯網時代,成(chéng)爲人們獲取知識的重要平台。

但在剛開(kāi)始,人們對(duì)維基「人人可編輯」的組織形式産生過(guò)質疑。甚至有電視主持人諷刺其爲「wikiality」,即如果在維基百科上編造條目,隻要有足夠多的人同意,它就會成(chéng)爲現實。

後(hòu)來,随著(zhe)《自然》(Nature)雜志的調查研究,發(fā)現維基百科準确度接近大英百科全書,Google 開(kāi)始把維基百科放到搜索結果的首項,維基社區和内容貢獻者也持續壯大,維基百科用了很多年時間終于取得了公衆的信任。

誕生之初遭到質疑,越來越多人參與去完善,而後(hòu)平反收到大衆認可,繼而成(chéng)爲日常的工具,這(zhè)一過(guò)程,僅誕生半年的 ChatGPT 正在經(jīng)曆,不僅于此,它還(hái)成(chéng)爲了維基百科的挑戰者。

不久前,維基媒體基金會召開(kāi) 2023-2024 年度計劃的電話會議,會議中提及了 35 次 AI,讨論的主題也是圍繞 ChatGPT 帶來的挑戰。

但維基百科所擔心的挑戰,并不是被(bèi) ChatGPT 取代。而是更深刻地考驗:未來的維基百科,會由 ChatGPT 來撰寫嗎?

01 維基百科的内容哪裡(lǐ)來的?

要想知道(dào) ChatGPT 能(néng)否撰寫維基百科,得先知道(dào)維基百科目前内容來源于哪裡(lǐ)。

維基百科主要是由來自互聯網上的志願者共同合作編寫而成(chéng),任何使用網絡進(jìn)入維基百科的用戶都(dōu)可以編寫和修改裡(lǐ)面(miàn)的文章。它是互聯網上一個極大的自由内容、公開(kāi)編輯、多語言的網絡百科全書協作計劃。

截至 2021 年初,所有語種(zhǒng)的維基百科條目數量達 5500 萬條,如何确保内容上的準确,全靠維基社群志願者們的篩查。

在 ChatGPT 出現前,維基百科已經(jīng)長(cháng)期在用 AI 去減少一些人力成(chéng)本。應用最多的就是把現有條目直接機器翻譯,再由人工編輯校對(duì)。

2016 年時,資深科學(xué)家 Aaron Halfaker 開(kāi)發(fā)了一套開(kāi)源機器學(xué)習算法,可以自動識别維基百科裡(lǐ)那些惡意破壞條目和編輯假消息的行爲;2020 年,MIT 的研究人員也爲維基百科推出過(guò)基于 AI 的修改功能(néng),可以精确定位維基百科句子中的特定信息,并自動替換爲類似于人類編輯的語言。

Wikipedia 關于 ChatGPT 的頁面(miàn)|Wikipedia

以及如維基社群所述,人工智能(néng)非常擅長(cháng)總結把一篇很長(cháng)的技術類條目,總結成(chéng)兒童都(dōu)能(néng)理解的版本,讓 AI 去生成(chéng)兒童版的維基百科效果很好(hǎo)。

翻譯、檢查、概括簡化已有内容,維基百科一直以來對(duì) AI 的應用僅限于此,直到大型語言模型 ChatGPT 的出現。

目前仍以文字方式交互爲主的 ChatGPT,除了回答用戶直接的提問以外,還(hái)可以用于甚爲複雜的語言工作,包括自動生成(chéng)文本、自動問答、自動摘要等等。

ChatGPT 可以寫出相似真人的文章,并在許多知識領域給出詳細和清晰的回答。哪怕 ChatGPT 生成(chéng)内容的事(shì)實準确度還(hái)需要人工去二次查閱,但這(zhè)時維基百科面(miàn)臨的問題已經(jīng)很明顯了:志願者能(néng)否用 ChatGPT 來撰寫維基百科條目?

02 能(néng)不能(néng)和想不想

紐約市維基媒體分會的老維基人 Richard Knipel 就用 ChatGPT 在維基百科上起(qǐ)草了一個名爲「藝術作品标題」的新條目,Knipel 表示,ChatGPT 給出的版本一般但語法正确,定義了藝術作品标題的概念,給出了從古至今的例子。他在草稿基礎上隻做了輕微修改。

但另一位編輯在條目上标注,將(jiāng)會進(jìn)行大量修改并完善。如今,我們再點進(jìn)這(zhè)一條目,會發(fā)現它增加了大量内容和理論索引,還(hái)梳理出了目錄,給出了圖片案例。像 Knipel 這(zhè)樣(yàng)的維基人認爲,ChatGPT 可以作爲生成(chéng)維基百科條目草稿、骨架的工具,在此基礎上,人工再驗證内容,編輯和充實條目。

但另一派維基人則認爲,在維基百科條目的創作裡(lǐ) ChatGPT 應該完全被(bèi)禁用。一位維基百科編輯就表示「我們應該強烈呼籲不使用 AI 工具來生成(chéng)條目草稿,即使這(zhè)些條目随後(hòu)會被(bèi)人工審閱。ChatGPT 太擅長(cháng)引入那些看起(qǐ)來很有道(dào)理的謊言。」

ChatGPT 起(qǐ)草,人工簡單編輯的版本|Wikipedia

人工大量幹預後(hòu)産生的版本|Wikipedia

但另一派也反駁這(zhè)種(zhǒng)說法,就像 Knipel 認爲,修改并豐富不完善的信息,這(zhè)就是維基百科在實踐中一直運作的方式。ChatGPT 將(jiāng)繼續存在并飛速發(fā)展,利用它同時強調人工幹預的必要性怎麼(me)就不行呢?把 ChatGPT 上來就視作洪水猛獸實在有些偏頗。

但在想不想之前,我們先看看能(néng)不能(néng)。ChatGPT 還(hái)夠不夠格直接編寫維基百科呢?

3 月 30 日時,維基百科創始人 Jimmy Wales 在接受 Evening Standard 采訪時讨論了這(zhè)個議題。Wales 認爲,讓 ChatGPT 能(néng)獨立寫一個完整的維基條目,目前還(hái)有一段距離,但距離多遠就難說了。「ChatGPT 的一大問題是會胡編亂造,業内把這(zhè)種(zhǒng)情況稱爲 hallucinating(幻覺)——我稱之爲編瞎話。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.)

「ChatGPT 有一種(zhǒng)憑空捏造的傾向(xiàng),這(zhè)對(duì)維基百科來說真的不太行。」Wales 在采訪裡(lǐ)說道(dào)。實踐中也是如此,你在維基百科上搜一個詞,維基百科可能(néng)會反饋「該條目不存在」,但你問 ChatGPT,它可能(néng)會給你生成(chéng)一段沒(méi)由頭的假消息。

ChatGPT 會「說瞎話」,這(zhè)種(zhǒng)事(shì)已經(jīng)不新鮮了。但 ChatGPT 誕生僅半年,它的自我叠代能(néng)力已經(jīng)令人咋舌,讓 ChatGPT「句句吐真言」,似乎隻是時間問題,那維基百科現在擔憂的是什麼(me)呢?

03 人力有限,算力「無限」

維基百科團隊并沒(méi)有那麼(me)擔心内容到底來源于人類還(hái)是 AI,它擔心的是内容質量是否過(guò)關。

在維基媒體基金會在電話會議總結報告裡(lǐ),「挑戰」被(bèi)放到了開(kāi)篇,其中最大比重的部分,也是維基百科團隊最大的擔憂在于:維基百科湧入大量 AI 生成(chéng)的内容,把真正高質量的、正确的信息給淹沒(méi)了。

「Wiki 項目有大量高質量的、可靠的,結構化的、分類好(hǎo)的内容。這(zhè)就是我們帶給世界的價值。最讓我害怕的不是人們使用 GPT 之類的大語言模型來獲取知識,而是需要巡查的 AI 生成(chéng)的内容會爆炸式增長(cháng)。

對(duì)高質量内容來說,創作比消費的時間成(chéng)本高很多,就像一篇較爲完整的維基條目,需要許多人參與撰寫,花許多時間,走過(guò)很多流程後(hòu)完成(chéng),對(duì)讀者來說幾分鍾就閱讀完了。

像維基百科這(zhè)種(zhǒng)平台,爲了保證内容質量,還(hái)需要專業人士核查一條條目中每個信息、數據、引用是否來源準确,篩查和編輯的成(chéng)本同樣(yàng)很高。因此 AI 生成(chéng)内容越多,人工核查的時間也更長(cháng)。而且哪怕 ChatGPT 給出了正确的結論,但它并不會直接給出結論的論據來源何處,人工還(hái)需要再找到論據。到最後(hòu),修正可能(néng)比撰寫耗時更長(cháng)。

Wikipedia 的條目下會有很多延展閱讀鏈接|Wikipedia

目前維基百科志願者們已經(jīng)發(fā)現了許多 ChatGPT 自動生成(chéng)内容上的問題。比如 ChatGPT 很容易太籠統地概括定義,導緻表意不明。還(hái)有 ChatGPT 遣詞造句過(guò)于肯定,不夠匹配維基百科想呈現的客觀中性的文字風格。

最重要的是信源難以查詢,維基百科的可信度和擴展閱讀性,很大程度上是基于條目底下豐富的信息參考來源,但 ChatGPT 不會主動提供參考,甚至會憑空捏造。

擔任了 20 年維基百科志願編輯的 Andrew Lih 在用 ChatGPT 起(qǐ)草新條目時就發(fā)現,ChatGPT 概述定義做得很不錯,但它所提供的消息來源于《福布斯》、《衛報》、《今日心理學(xué)》,但 Lih 仔細查閱後(hòu)發(fā)現,這(zhè)些信源文章并不存在,甚至 ChatGPT 給出的 URL 都(dōu)是自動生成(chéng)找不到頁面(miàn)的假鏈接。

綜上,維基百科團隊直接表示,AI 生成(chéng)内容的速度和效率,可能(néng)會超出項目的運行能(néng)力。

除此之外,還(hái)有許多維基百科團隊會擔心的點,比如如今的維基百科貢獻者裡(lǐ),使用英語的白人男性依舊是主體,維基内容已帶有語言和内容偏見,ChatGPT 靠吸納互聯網信息爲養料的 AI 機器,生成(chéng)出的内容會進(jìn)一步放大偏見。

Wikipedia 聯合創始人 Jimmy Wales 在接受 Standard 采訪時談及 AI 參與撰寫維基的問題|Standard.co

維基百科團隊也無法把握志願者對(duì) AI 工具使用的傾向(xiàng)。Lih 就認爲,維基人不缺動力,缺的是時間,ChatGPT 生成(chéng)的糟糕草稿,可以激發(fā)維基志願者的修改欲。這(zhè)也符合維基之父 Ward Cunningham 所提出的「坎甯安定律」:在互聯網上得到優秀答案的最佳方法不是去提問,而是發(fā)布一個錯誤的答案。

維基百科團隊還(hái)擔心,當維基百科充斥著(zhe) AI 生成(chéng)的内容時,用戶們會降低對(duì)它信息的信任度,轉而去信任更有「人類作者」标識的媒體内容,比如會出鏡的視頻,标記了作者的媒體報刊。

04 就不能(néng)共存嗎

維基百科和 ChatGPT 有很多相似性,比如都(dōu)以文本爲主,試圖「回答一切」。但二者最顯著的區别,在于回答方式的不同。

維基百科是有框架、系統、詳細索引的百科式信息,你點進(jìn)一個條目,可以從最簡單的概括式介紹了解到其曆史的變化,通過(guò)條目裡(lǐ)豐富的擴展鏈接,可以在縱向(xiàng)裡(lǐ)深入了解,也能(néng)在橫向(xiàng)裡(lǐ)在不同條目之間跳轉,擴展對(duì)一整個領域的了解。

ChatGPT 目前呈現出的還(hái)是提問式的交互,需要用戶明确了解自己想知道(dào)的問題,向(xiàng)外擴展也是需要建立在 ChatGPT 給出的回答之上,進(jìn)一步詢問。

不同用戶獲取信息的傾向(xiàng)不同,選擇工具也不同,維基百科無法做到 ChatGPT 一樣(yàng)能(néng)回答非常具體的問題,ChatGPT 也不會像維基百科一樣(yàng)有那麼(me)精準且梳理好(hǎo)的知識類信息。這(zhè)二者的使用方式,就像我們選擇閱讀教科書,還(hái)是直接向(xiàng)教授提問。

就像維基百科并沒(méi)有因爲搜索引擎 Google 的崛起(qǐ)而磨滅,反而它會出現在 Google 搜索結果的第一條和邊欄上。

維基百科團隊也并沒(méi)有如 Google 一般有那麼(me)大的危機感,在年度會議裡(lǐ),雖然開(kāi)篇點了 ChatGPT 帶來的挑戰,但整個會議更多的時間留給了「機會」。

「當互聯網上有大量 AI 生成(chéng)的内容時會發(fā)生什麼(me)?在一個由數萬億個低質量、低可信度的頁面(miàn)組成(chéng)的互聯網,創建大模型的人和用戶都(dōu)需要去找到可靠的信息,他們可能(néng)會更多地使用維基百科。」這(zhè)就是維基人眼中的「機會」。

利用大語言模型去查 bug、翻譯、内容總結、豐富媒體形式,比如 GPT-4 中體現的視頻生成(chéng),AI 生成(chéng)的圖片也可以放到很多抽象概念的條目裡(lǐ),增加可讀性,還(hái)可以在文本和語音之間互相轉換。

但以上的前提,都(dōu)是不能(néng)讓大語言模型打打輔助,不能(néng)喧賓奪主。「維基百科是關于人類聚集在一起(qǐ)試圖定義真相。這(zhè)些工具不可靠,會分散我們對(duì)實際任務的注意力。我們應該小心要以多快的速度追趕這(zhè)一趨勢,而不是放棄它。我們應該關注創造知識的人。」

維基百科團隊的态度,也折射了我們當下對(duì) AI 的審慎态度。沒(méi)有被(bèi)取代,想充分利用 AI 的同時不夠信任它,想發(fā)揮 AI 的最大價值,但真正有價值的内容又不敢輕易交付,難以放下人類本位的核心概念,謹慎地靠近,小心地追趕。

維基百科如何和大語言模型共存,或許就回答了我們人類如何與 AI 共存。


标簽: ChatGPT

版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com

特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有

聯系我們

輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ:210603461

Emile:hezuo@lyzg168.com

地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站:https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光,了解我們的服務與最新資訊。

Copyright © ​2018-2019 洛陽霆雲網絡科技有限公司