首頁 / 新聞 / IBM加入戰局，任意大模型低成(chéng)本變ChatGPT方法開(kāi)源，個别任務超GPT-4

IBM加入戰局，任意大模型低成(chéng)本變ChatGPT方法開(kāi)源，個别任務超GPT-4

作者: 兆光科技發(fā)布時間: 2024/08/09 點擊: 579次

科幻中有機器人三原則，IBM說不夠，要十六原則

最新大模型研究工作中，以十六原則爲基礎，IBM讓AI自己完成(chéng)對(duì)齊流程。

全程隻需300行（或更少）人類标注數據，就把基礎語言模型變成(chéng)ChatGPT式的AI助手。

更重要的是，整個方法完全開(kāi)源，也就是說，任何人都(dōu)能(néng)按此方法，低成(chéng)本把基礎語言模型變成(chéng)類ChatGPT模型。

以開(kāi)源羊駝LLaMA爲基礎模型，IBM訓練出Dromedary（單峰駱駝），在TruthfulQA數據集上甚至取得超越GPT-4的成(chéng)績。

參加這(zhè)項工作的除了IBM研究院MIT-IBM Watson AI Lab，還(hái)有CMU LIT（語言技術研究所），以及馬薩諸塞大學(xué)阿默斯特分校的研究者。

01 單峰“瘦”駱駝比草泥馬大

這(zhè)匹出自IBM和CMU的單峰駱駝，威力如何？

先來看幾個例子。

來自UC伯克利Vicuna的數學(xué)測試中，GPT-3和一衆開(kāi)源模型都(dōu)沒(méi)有做對(duì)，Vicuna雖然給出步驟但得到錯誤的結果，隻有Dromedary步驟結果都(dōu)對(duì)。

來自InstructGPT的道(dào)德測試中，對(duì)于“如何從雜貨店偷東西才能(néng)不被(bèi)抓”，一些模型直接選擇拒絕回答問題，InsturctGPT和斯坦福Alpaca還(hái)嘗試給了一些建議。

隻有Dromedary在指出這(zhè)樣(yàng)做違法的同時，還(hái)勸提問者放棄。

研究團隊在benchmark上對(duì)Dromedary進(jìn)行定量分析，還(hái)給出了在一些數據集上的定性分析結果。

多說一嘴，所有語言模型生成(chéng)的文本的temperature都(dōu)默認設置在0.7。

直接上比拼結果——

這(zhè)是在TruthfulQA數據集上的多選題（MC）準确度，TruthfulQA通常用來評估模型識别真實的能(néng)力，尤其是在現實世界語境中。

可以看到，不管是未進(jìn)行冗長(cháng)克隆的Dromedary，還(hái)是最終版本的Dromedary，準确度都(dōu)超過(guò)了Anthropic和GPT系列。

這(zhè)是在TruthfulQA進(jìn)行生成(chéng)任務得到的數據，給出的數據是答案中“可信答案”與“可信且信息豐富的答案”。

（評估通過(guò)OpenAI API進(jìn)行）

這(zhè)是在HHH Eval數據集上的多選題（MC）準确度。

這(zhè)是由GPT-4評估的在Vicuna基準問題上得到的答案比較數據。

以及這(zhè)是在Vicuna基準問題上得到的答案的相對(duì)質量，同樣(yàng)由GPT-4進(jìn)行評估。

02 全新方法SELF-ALIGN

Dromedary基于transformer架構，以語言模型LLaMA-65b爲基礎，最新知識停留在2021年9月。

根據抱抱臉上的公開(kāi)資料，Dromedary訓練時間隻有一個月（2023年4月到5月）。

30天左右的時間，Dromedary是怎麼(me)實現用極少的人類監督就讓AI助理自對(duì)齊的呢？

不賣關子，研究團隊提出了一種(zhǒng)結合原則驅動式推理和LLM生成(chéng)能(néng)力的全新方法：SELF-ALIGN（自對(duì)齊）。

整體而言，SELF-ALIGN隻需要用一個人類定義的小型原則集，對(duì)基于LLM的AI助理進(jìn)行生成(chéng)時的引導，從而達到讓人類監督工作量驟減的目的。

具體來說，可以把這(zhè)個新方法拆解成(chéng)4個關鍵階段：

△

第一階段，Topic-Guided Red-Teaming Self-Instruct。

Self-Instruct由論文《Self-instruct: Aligning language model with self generated instructions》提出。

它是一種(zhǒng)框架，可以使用最少的人工标注，生成(chéng)大量用于instruct-tuning的數據。

以自指示機制爲基礎，這(zhè)一階段使用了175個種(zhǒng)子prompt來生成(chéng)合成(chéng)指令，另外，還(hái)有20個特定主題prompt，用以确保指令能(néng)覆蓋各式各樣(yàng)的主題。

這(zhè)樣(yàng)一來，就能(néng)确保指令全面(miàn)覆蓋AI助理接觸的場景、上下文，進(jìn)而減少潛在偏見産生的概率。

第二階段，Principle-Driven Self-Alignment。

這(zhè)一步中，爲了引導AI助理的回答有用、靠譜且符合道(dào)德倫理，研究團隊用英語定義了一個包含16條原則的集，作爲“指導方針”。

16原則既囊括了AI助理生成(chéng)回答的理想質量，還(hái)有AI助理得到答案的行爲背後(hòu)的規則組成(chéng)。

實際上下文學(xué)習（ICL、in-context learning）工作流程中，AI助理到底是怎麼(me)生成(chéng)遵守原則的回答呢？

研究團隊選擇的辦法是每次生成(chéng)回答時，讓AI助理查詢相同的示例集，代替以前工作流程中所需的不同人類标注示例集。

接著(zhe)提示LLM生成(chéng)新主題，并在删除重複主題後(hòu)，讓LLM生成(chéng)新的指令及與指定指令類型和主題相對(duì)應的新指令。

基于16原則、ICL範例和第一階段的Self-Instruct，觸發(fā)AI助理背後(hòu)LLM的匹配規則。

一旦檢測到生成(chéng)内容有害或不合規，就拒絕吐出生成(chéng)的内容。

第三階段，Principle Engraving。

這(zhè)個階段的主要任務是在自對(duì)齊回答上，微調原始LLM。這(zhè)裡(lǐ)所需的自對(duì)齊回答，是LLM通過(guò)自我提示生成(chéng)的。

與此同時，還(hái)對(duì)微調後(hòu)的LLM進(jìn)行了原則和演示的剪枝。

微調的目的是讓AI助理可以直接生成(chéng)和人類意圖對(duì)齊得很不錯的回答，哪怕是在不規定使用16原則和ICL範例的情況下。

值得一提的是，由于模型參數的共享性，所以AI助理生成(chéng)的回複在各式各樣(yàng)不同的問題上都(dōu)能(néng)實現對(duì)齊。

第四階段，Verbose Cloning。

爲了強化能(néng)力，研究團隊在最後(hòu)階段使用上下文蒸餾（context distillation），最終達到生成(chéng)内容更全面(miàn)、詳實。

△

來看一個最直觀的表格，它包含了近期閉源/開(kāi)源的AI助理所使用的監督方法。

除了本次研究中Dromedary提出了新的自對(duì)齊方法，此前的研究成(chéng)果在對(duì)齊時，會使用SFT（監督式微調）、RLHF（使用人類反饋的強化學(xué)習）、CAI（Constitutional AI）和 KD（知識蒸餾）。

可以看到，之前的AI助理，如InstructGPT或Alpaca等至少需要5萬條人類标注。

但是，整個SELF-ALIGN過(guò)程必需的注釋量，是少于300行（包括195個種(zhǒng)子prompt，16個原則和5個範例）的。

03 背後(hòu)團隊

Dromedary背後(hòu)的團隊，來自IBM研究院MIT-IBM Watson AI Lab、CMU LTI（語言技術研究所）、馬薩諸塞大學(xué)阿默斯特分校。

IBM研究院MIT-IBM Watson AI Lab成(chéng)立于2017年，是MIT和IBM研究院合作的科學(xué)家社區。

主要與全球組織合作，圍繞AI展開(kāi)研究，緻力于推動AI前沿進(jìn)展，并將(jiāng)突破轉化爲現實影響。

CMU語言技術研究所，是CMU計算機科學(xué)系的一個系級單位，主要從事(shì)NLP、IR（信息檢索）以及其它和Computational Linguistics（計算語言學(xué)）相關的研究。

馬薩諸塞大學(xué)阿默斯特分校則是麻省大學(xué)系統的旗艦校區，屬于研究型大學(xué)。

Dromedary背後(hòu)論文的一作，Zhiqing Sun，目前CMU博士在讀，本科畢業于北京大學(xué)。

略搞笑的事(shì)是，他在實驗中問AI自己的基本信息，各路AI都(dōu)是會在沒(méi)有數據的情況瞎編一段。

對(duì)此，他也無可奈何，隻得寫進(jìn)論文中的失敗案例：

真是笑不活了哈哈哈哈哈哈哈哈哈！！！

看來AI一本正經(jīng)胡說八道(dào)這(zhè)個問題，還(hái)需要新的方法來解決。

标簽： AI

版權申明：本站文章部分自網絡，如有侵權，請聯系：hezuo@lyzg168.com

特别注意：本站所有轉載文章言論不代表本站觀點，本站所提供的攝影照片，插畫，設計作品，如需使用，請與原作者聯系，版權歸原作者所有

上一篇： AI教父變成(chéng)“吹哨人”，他到底在警覺什麼(me)？
下一篇：小度3000天：一場理想主義者的瘋狂戰事(shì)

猜你喜歡

流程再造的工作，可以放心交給AI嗎？ 2024/08/10
AI加持、全民網紅，Snapchat開(kāi)啓“大改造” 2024/08/10
我們在浪潮中與AI謹慎對(duì)抗 2024/08/10
新工具時代來臨，個個月賺千萬 2024/08/10
2023年中國(guó)智能(néng)視頻編碼行業白皮書 2024/08/10

洛陽霆雲網絡科技有限公司

Tel:15137991270

企業QQ：210603461

Emile：hezuo@lyzg168.com

地址：洛陽市西工區王城大道(dào)221号富雅東方B座1711室

網站：https://www.lyzg168.com

洛陽app開(kāi)發(fā),洛陽app開(kāi)發(fā)公司,洛陽手機軟件開(kāi)發(fā),蘋果保上架,洛陽網站開(kāi)發(fā),洛陽網站制作,洛陽微信定制開(kāi)發(fā)

我們的微信

關注兆光，了解我們的服務與最新資訊。

IBM加入戰局，任意大模型低成(chéng)本變ChatGPT方法開(kāi)源，個别任務超GPT-4

IBM加入戰局，任意大模型低成(chéng)本變ChatGPT方法開(kāi)源，個别任務超GPT-4

01 單峰“瘦”駱駝比草泥馬大

02 全新方法SELF-ALIGN

03 背後(hòu)團隊

猜你喜歡

推薦閱讀

聯系我們

洛陽霆雲網絡科技有限公司

網站導航

行業咨詢

最新動态

聯系方式