首頁 / 新聞 / 維基百科：ChatGPT or Not？這(zhè)是一個問題

維基百科：ChatGPT or Not？這(zhè)是一個問題

作者: 兆光科技發(fā)布時間: 2024/08/09 點擊: 739次

維基百科勝在知識結構清晰，ChatGPT 長(cháng)于具體問題，雙方未必不可調和。

22 年前，2001 年初，維基百科 Wikipedia 橫空出世，在其後(hòu)的互聯網時代，成(chéng)爲人們獲取知識的重要平台。

但在剛開(kāi)始，人們對(duì)維基「人人可編輯」的組織形式産生過(guò)質疑。甚至有電視主持人諷刺其爲「wikiality」，即如果在維基百科上編造條目，隻要有足夠多的人同意，它就會成(chéng)爲現實。

後(hòu)來，随著(zhe)《自然》（Nature）雜志的調查研究，發(fā)現維基百科準确度接近大英百科全書，Google 開(kāi)始把維基百科放到搜索結果的首項，維基社區和内容貢獻者也持續壯大，維基百科用了很多年時間終于取得了公衆的信任。

誕生之初遭到質疑，越來越多人參與去完善，而後(hòu)平反收到大衆認可，繼而成(chéng)爲日常的工具，這(zhè)一過(guò)程，僅誕生半年的 ChatGPT 正在經(jīng)曆，不僅于此，它還(hái)成(chéng)爲了維基百科的挑戰者。

不久前，維基媒體基金會召開(kāi) 2023-2024 年度計劃的電話會議，會議中提及了 35 次 AI，讨論的主題也是圍繞 ChatGPT 帶來的挑戰。

但維基百科所擔心的挑戰，并不是被(bèi) ChatGPT 取代。而是更深刻地考驗：未來的維基百科，會由 ChatGPT 來撰寫嗎？

01 維基百科的内容哪裡(lǐ)來的？

要想知道(dào) ChatGPT 能(néng)否撰寫維基百科，得先知道(dào)維基百科目前内容來源于哪裡(lǐ)。

維基百科主要是由來自互聯網上的志願者共同合作編寫而成(chéng)，任何使用網絡進(jìn)入維基百科的用戶都(dōu)可以編寫和修改裡(lǐ)面(miàn)的文章。它是互聯網上一個極大的自由内容、公開(kāi)編輯、多語言的網絡百科全書協作計劃。

截至 2021 年初，所有語種(zhǒng)的維基百科條目數量達 5500 萬條，如何确保内容上的準确，全靠維基社群志願者們的篩查。

在 ChatGPT 出現前，維基百科已經(jīng)長(cháng)期在用 AI 去減少一些人力成(chéng)本。應用最多的就是把現有條目直接機器翻譯，再由人工編輯校對(duì)。

2016 年時，資深科學(xué)家 Aaron Halfaker 開(kāi)發(fā)了一套開(kāi)源機器學(xué)習算法，可以自動識别維基百科裡(lǐ)那些惡意破壞條目和編輯假消息的行爲；2020 年，MIT 的研究人員也爲維基百科推出過(guò)基于 AI 的修改功能(néng)，可以精确定位維基百科句子中的特定信息，并自動替換爲類似于人類編輯的語言。

Wikipedia 關于 ChatGPT 的頁面(miàn)｜Wikipedia

以及如維基社群所述，人工智能(néng)非常擅長(cháng)總結把一篇很長(cháng)的技術類條目，總結成(chéng)兒童都(dōu)能(néng)理解的版本，讓 AI 去生成(chéng)兒童版的維基百科效果很好(hǎo)。

翻譯、檢查、概括簡化已有内容，維基百科一直以來對(duì) AI 的應用僅限于此，直到大型語言模型 ChatGPT 的出現。

目前仍以文字方式交互爲主的 ChatGPT，除了回答用戶直接的提問以外，還(hái)可以用于甚爲複雜的語言工作，包括自動生成(chéng)文本、自動問答、自動摘要等等。

ChatGPT 可以寫出相似真人的文章，并在許多知識領域給出詳細和清晰的回答。哪怕 ChatGPT 生成(chéng)内容的事(shì)實準确度還(hái)需要人工去二次查閱，但這(zhè)時維基百科面(miàn)臨的問題已經(jīng)很明顯了：志願者能(néng)否用 ChatGPT 來撰寫維基百科條目？

02 能(néng)不能(néng)和想不想

紐約市維基媒體分會的老維基人 Richard Knipel 就用 ChatGPT 在維基百科上起(qǐ)草了一個名爲「藝術作品标題」的新條目，Knipel 表示，ChatGPT 給出的版本一般但語法正确，定義了藝術作品标題的概念，給出了從古至今的例子。他在草稿基礎上隻做了輕微修改。

但另一位編輯在條目上标注，將(jiāng)會進(jìn)行大量修改并完善。如今，我們再點進(jìn)這(zhè)一條目，會發(fā)現它增加了大量内容和理論索引，還(hái)梳理出了目錄，給出了圖片案例。像 Knipel 這(zhè)樣(yàng)的維基人認爲，ChatGPT 可以作爲生成(chéng)維基百科條目草稿、骨架的工具，在此基礎上，人工再驗證内容，編輯和充實條目。

但另一派維基人則認爲，在維基百科條目的創作裡(lǐ) ChatGPT 應該完全被(bèi)禁用。一位維基百科編輯就表示「我們應該強烈呼籲不使用 AI 工具來生成(chéng)條目草稿，即使這(zhè)些條目随後(hòu)會被(bèi)人工審閱。ChatGPT 太擅長(cháng)引入那些看起(qǐ)來很有道(dào)理的謊言。」

ChatGPT 起(qǐ)草，人工簡單編輯的版本｜Wikipedia

人工大量幹預後(hòu)産生的版本｜Wikipedia

但另一派也反駁這(zhè)種(zhǒng)說法，就像 Knipel 認爲，修改并豐富不完善的信息，這(zhè)就是維基百科在實踐中一直運作的方式。ChatGPT 將(jiāng)繼續存在并飛速發(fā)展，利用它同時強調人工幹預的必要性怎麼(me)就不行呢？把 ChatGPT 上來就視作洪水猛獸實在有些偏頗。

但在想不想之前，我們先看看能(néng)不能(néng)。ChatGPT 還(hái)夠不夠格直接編寫維基百科呢？

3 月 30 日時，維基百科創始人 Jimmy Wales 在接受 Evening Standard 采訪時讨論了這(zhè)個議題。Wales 認爲，讓 ChatGPT 能(néng)獨立寫一個完整的維基條目，目前還(hái)有一段距離，但距離多遠就難說了。「ChatGPT 的一大問題是會胡編亂造，業内把這(zhè)種(zhǒng)情況稱爲 hallucinating（幻覺）——我稱之爲編瞎話。」（One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.）

「ChatGPT 有一種(zhǒng)憑空捏造的傾向(xiàng)，這(zhè)對(duì)維基百科來說真的不太行。」Wales 在采訪裡(lǐ)說道(dào)。實踐中也是如此，你在維基百科上搜一個詞，維基百科可能(néng)會反饋「該條目不存在」，但你問 ChatGPT，它可能(néng)會給你生成(chéng)一段沒(méi)由頭的假消息。

ChatGPT 會「說瞎話」，這(zhè)種(zhǒng)事(shì)已經(jīng)不新鮮了。但 ChatGPT 誕生僅半年，它的自我叠代能(néng)力已經(jīng)令人咋舌，讓 ChatGPT「句句吐真言」，似乎隻是時間問題，那維基百科現在擔憂的是什麼(me)呢？

03 人力有限，算力「無限」

維基百科團隊并沒(méi)有那麼(me)擔心内容到底來源于人類還(hái)是 AI，它擔心的是内容質量是否過(guò)關。

在維基媒體基金會在電話會議總結報告裡(lǐ)，「挑戰」被(bèi)放到了開(kāi)篇，其中最大比重的部分，也是維基百科團隊最大的擔憂在于：維基百科湧入大量 AI 生成(chéng)的内容，把真正高質量的、正确的信息給淹沒(méi)了。

「Wiki 項目有大量高質量的、可靠的，結構化的、分類好(hǎo)的内容。這(zhè)就是我們帶給世界的價值。最讓我害怕的不是人們使用 GPT 之類的大語言模型來獲取知識，而是需要巡查的 AI 生成(chéng)的内容會爆炸式增長(cháng)。」

對(duì)高質量内容來說，創作比消費的時間成(chéng)本高很多，就像一篇較爲完整的維基條目，需要許多人參與撰寫，花許多時間，走過(guò)很多流程後(hòu)完成(chéng)，對(duì)讀者來說幾分鍾就閱讀完了。

像維基百科這(zhè)種(zhǒng)平台，爲了保證内容質量，還(hái)需要專業人士核查一條條目中每個信息、數據、引用是否來源準确，篩查和編輯的成(chéng)本同樣(yàng)很高。因此 AI 生成(chéng)内容越多，人工核查的時間也更長(cháng)。而且哪怕 ChatGPT 給出了正确的結論，但它并不會直接給出結論的論據來源何處，人工還(hái)需要再找到論據。到最後(hòu)，修正可能(néng)比撰寫耗時更長(cháng)。

Wikipedia 的條目下會有很多延展閱讀鏈接｜Wikipedia

目前維基百科志願者們已經(jīng)發(fā)現了許多 ChatGPT 自動生成(chéng)内容上的問題。比如 ChatGPT 很容易太籠統地概括定義，導緻表意不明。還(hái)有 ChatGPT 遣詞造句過(guò)于肯定，不夠匹配維基百科想呈現的客觀中性的文字風格。

最重要的是信源難以查詢，維基百科的可信度和擴展閱讀性，很大程度上是基于條目底下豐富的信息參考來源，但 ChatGPT 不會主動提供參考，甚至會憑空捏造。

擔任了 20 年維基百科志願編輯的 Andrew Lih 在用 ChatGPT 起(qǐ)草新條目時就發(fā)現，ChatGPT 概述定義做得很不錯，但它所提供的消息來源于《福布斯》、《衛報》、《今日心理學(xué)》，但 Lih 仔細查閱後(hòu)發(fā)現，這(zhè)些信源文章并不存在，甚至 ChatGPT 給出的 URL 都(dōu)是自動生成(chéng)找不到頁面(miàn)的假鏈接。

綜上，維基百科團隊直接表示，AI 生成(chéng)内容的速度和效率，可能(néng)會超出項目的運行能(néng)力。

除此之外，還(hái)有許多維基百科團隊會擔心的點，比如如今的維基百科貢獻者裡(lǐ)，使用英語的白人男性依舊是主體，維基内容已帶有語言和内容偏見，ChatGPT 靠吸納互聯網信息爲養料的 AI 機器，生成(chéng)出的内容會進(jìn)一步放大偏見。

Wikipedia 聯合創始人 Jimmy Wales 在接受 Standard 采訪時談及 AI 參與撰寫維基的問題｜Standard.co

維基百科團隊也無法把握志願者對(duì) AI 工具使用的傾向(xiàng)。Lih 就認爲，維基人不缺動力，缺的是時間，ChatGPT 生成(chéng)的糟糕草稿，可以激發(fā)維基志願者的修改欲。這(zhè)也符合維基之父 Ward Cunningham 所提出的「坎甯安定律」：在互聯網上得到優秀答案的最佳方法不是去提問，而是發(fā)布一個錯誤的答案。

維基百科團隊還(hái)擔心，當維基百科充斥著(zhe) AI 生成(chéng)的内容時，用戶們會降低對(duì)它信息的信任度，轉而去信任更有「人類作者」标識的媒體内容，比如會出鏡的視頻，标記了作者的媒體報刊。

04 就不能(néng)共存嗎

維基百科和 ChatGPT 有很多相似性，比如都(dōu)以文本爲主，試圖「回答一切」。但二者最顯著的區别，在于回答方式的不同。

維基百科是有框架、系統、詳細索引的百科式信息，你點進(jìn)一個條目，可以從最簡單的概括式介紹了解到其曆史的變化，通過(guò)條目裡(lǐ)豐富的擴展鏈接，可以在縱向(xiàng)裡(lǐ)深入了解，也能(néng)在橫向(xiàng)裡(lǐ)在不同條目之間跳轉，擴展對(duì)一整個領域的了解。

ChatGPT 目前呈現出的還(hái)是提問式的交互，需要用戶明确了解自己想知道(dào)的問題，向(xiàng)外擴展也是需要建立在 ChatGPT 給出的回答之上，進(jìn)一步詢問。

不同用戶獲取信息的傾向(xiàng)不同，選擇工具也不同，維基百科無法做到 ChatGPT 一樣(yàng)能(néng)回答非常具體的問題，ChatGPT 也不會像維基百科一樣(yàng)有那麼(me)精準且梳理好(hǎo)的知識類信息。這(zhè)二者的使用方式，就像我們選擇閱讀教科書，還(hái)是直接向(xiàng)教授提問。

就像維基百科并沒(méi)有因爲搜索引擎 Google 的崛起(qǐ)而磨滅，反而它會出現在 Google 搜索結果的第一條和邊欄上。

維基百科團隊也并沒(méi)有如 Google 一般有那麼(me)大的危機感，在年度會議裡(lǐ)，雖然開(kāi)篇點了 ChatGPT 帶來的挑戰，但整個會議更多的時間留給了「機會」。

「當互聯網上有大量 AI 生成(chéng)的内容時會發(fā)生什麼(me)？在一個由數萬億個低質量、低可信度的頁面(miàn)組成(chéng)的互聯網，創建大模型的人和用戶都(dōu)需要去找到可靠的信息，他們可能(néng)會更多地使用維基百科。」這(zhè)就是維基人眼中的「機會」。

利用大語言模型去查 bug、翻譯、内容總結、豐富媒體形式，比如 GPT-4 中體現的視頻生成(chéng)，AI 生成(chéng)的圖片也可以放到很多抽象概念的條目裡(lǐ)，增加可讀性，還(hái)可以在文本和語音之間互相轉換。

但以上的前提，都(dōu)是不能(néng)讓大語言模型打打輔助，不能(néng)喧賓奪主。「維基百科是關于人類聚集在一起(qǐ)試圖定義真相。這(zhè)些工具不可靠，會分散我們對(duì)實際任務的注意力。我們應該小心要以多快的速度追趕這(zhè)一趨勢，而不是放棄它。我們應該關注創造知識的人。」

維基百科團隊的态度，也折射了我們當下對(duì) AI 的審慎态度。沒(méi)有被(bèi)取代，想充分利用 AI 的同時不夠信任它，想發(fā)揮 AI 的最大價值，但真正有價值的内容又不敢輕易交付，難以放下人類本位的核心概念，謹慎地靠近，小心地追趕。

維基百科如何和大語言模型共存，或許就回答了我們人類如何與 AI 共存。

标簽： ChatGPT

版權申明：本站文章部分自網絡，如有侵權，請聯系：hezuo@lyzg168.com

特别注意：本站所有轉載文章言論不代表本站觀點，本站所提供的攝影照片，插畫，設計作品，如需使用，請與原作者聯系，版權歸原作者所有

上一篇：子公司解散，裁撤2000多人，OPPO放棄造芯？
下一篇：馬斯克出任推特CEO 200天：大刀闊斧搞改革，賺錢交給“女掌門”

猜你喜歡

AI也内卷？新ChatGPT登場 2024/08/10
ChatGPT潮水湧來，360搜索遊向(xiàng)何方？ 2024/08/10
國(guó)産ChatGPT命名圖鑒 2024/08/10
你的ChatGPT數據可以不被(bèi)官方拿去訓練模型了，代價是「隻聊天不記錄」 2024/08/10
搭ChatGPT東風，第四範式四次沖擊港交所 2024/08/10

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ：210603461

Emile：hezuo@lyzg168.com

地址：洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站：https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光，了解我們的服務與最新資訊。

維基百科：ChatGPT or Not？這(zhè)是一個問題

維基百科：ChatGPT or Not？這(zhè)是一個問題

01 維基百科的内容哪裡(lǐ)來的？

02 能(néng)不能(néng)和想不想

03 人力有限，算力「無限」

04 就不能(néng)共存嗎

猜你喜歡

推薦閱讀

聯系我們

洛陽霆雲網絡科技有限公司

網站導航

行業咨詢

最新動态

聯系方式

維基百科：ChatGPT or Not？ 這(zhè)是一個問題

維基百科：ChatGPT or Not？ 這(zhè)是一個問題

01 維基百科的内容哪裡(lǐ)來的？

02 能(néng)不能(néng)和想不想

03 人力有限，算力「無限」

04 就不能(néng)共存嗎

猜你喜歡

推薦閱讀

聯系我們

洛陽霆雲網絡科技有限公司

網站導航

行業咨詢

最新動态

聯系方式

維基百科：ChatGPT or Not？這(zhè)是一個問題

維基百科：ChatGPT or Not？這(zhè)是一個問題