在人們印象中,使用大語(yǔ)言模型是極其簡(jiǎn)單的操作——只需輸入一個(gè)問(wèn)題,立刻就能得到回答。但實(shí)際上,要想“用好”大語(yǔ)言模型,也是需要技巧的。
如何有效地與這些人工智能模型互動(dòng),發(fā)揮出它們的最大潛力?中國(guó)科學(xué)技術(shù)大學(xué)心理學(xué)系特任研究員林志成在最近發(fā)表于《自然-人類(lèi)行為》的評(píng)論文章中,提供了一系列策略和指導(dǎo),以此幫助人們更好地理解和“用好”這些先進(jìn)工具,生成更精準(zhǔn)的回答。
“從本質(zhì)上看,大語(yǔ)言模型是一個(gè)數(shù)學(xué)模型,缺乏對(duì)語(yǔ)義的理解。它只能‘預(yù)測(cè)下一個(gè)文字’出現(xiàn)的概率,而不能生成‘真理’。”在接受《中國(guó)科學(xué)報(bào)》采訪(fǎng)時(shí),林志成建議在輸入指令時(shí)可以使用8個(gè)小技巧。
拆分復(fù)雜任務(wù)
由于缺乏對(duì)語(yǔ)義的理解,想要大語(yǔ)言模型“舉一反三”是很難的。但是,它有海量的數(shù)據(jù)、珍貴的“記憶”,可以從中提取信息。
因此,用好大語(yǔ)言模型,林志成給出的第一個(gè)小技巧是拆分復(fù)雜任務(wù)。
比如,不要直接給出“將文本翻譯成中文”這樣寬泛的指令,而是將指令拆解成兩步——首先按字面意思翻譯,保持含義不變;然后意譯,讓文本符合中文的語(yǔ)言習(xí)慣。
再比如,讓大語(yǔ)言模型寫(xiě)出一篇1000字的論文,可以嘗試把任務(wù)分解成子任務(wù),用具體的指令分別生成概述、結(jié)論和中心論點(diǎn)。
林志成說(shuō):“清晰、逐步的指令會(huì)降低模糊性和不確定性,從而生成更準(zhǔn)確的答案。”
添加相關(guān)語(yǔ)境
大語(yǔ)言模型比人類(lèi)的“短期記憶”多太多。因此,想要讓它提供精準(zhǔn)且符合問(wèn)題語(yǔ)境的回復(fù),在輸入指令時(shí)添加相關(guān)語(yǔ)境就很重要。這是第二個(gè)小技巧。
林志成說(shuō),一個(gè)限定語(yǔ)境的問(wèn)題應(yīng)當(dāng)包含具體內(nèi)容和細(xì)節(jié),從而引導(dǎo)大語(yǔ)言模型產(chǎn)生更準(zhǔn)確的理解力,生成有洞察力、更精細(xì)的回復(fù)。
例如,讓大語(yǔ)言模型起草一份求職簡(jiǎn)歷,事先要把企業(yè)發(fā)布的具體職位需求、個(gè)人基本情況等內(nèi)容一并提供給它,如此一來(lái),輸出的簡(jiǎn)歷就更具有針對(duì)性。
明確的指令
當(dāng)你走進(jìn)一間咖啡廳,想要點(diǎn)一杯喜歡的咖啡,應(yīng)該不會(huì)說(shuō)“請(qǐng)來(lái)杯咖啡”,而是會(huì)說(shuō)“來(lái)杯摩卡或拿鐵”。同樣,你也不要期待大語(yǔ)言模型能讀懂你的心。
林志成指出,要想降低大語(yǔ)言模型預(yù)測(cè)時(shí)的不確定性,就要給出明確的指令。這是第三個(gè)小技巧。
例如,想讓大語(yǔ)言模型修改文章,不要說(shuō)“潤(rùn)色這篇文章”,而是具體到修改成什么風(fēng)格、文章的目標(biāo)受眾是誰(shuí)……
林志成說(shuō),一段更具體的指令甚至可以是“像頂級(jí)期刊的頂級(jí)編輯那樣,潤(rùn)色這篇文章,讓它更為清晰流暢”。
提供多種選項(xiàng)
大語(yǔ)言模型還擁有超強(qiáng)的“長(zhǎng)期記憶”和生產(chǎn)能力。因此,它可以提供多個(gè)版本,而不是一個(gè)。
“很多時(shí)候,人們潛意識(shí)里認(rèn)為,大語(yǔ)言模型給出的答案是最優(yōu)的。但就文本寫(xiě)作而言,帶有很多主觀色彩,并不是一個(gè)簡(jiǎn)單量化的東西。因此很難判斷大語(yǔ)言模型第一次給出的就是最優(yōu)答案。”林志成說(shuō),此時(shí),可以讓大語(yǔ)言模型提供多種選項(xiàng),再?gòu)闹羞x出符合個(gè)人需求的答案。這是第四個(gè)小技巧。
此外,林志成建議,還可以考慮重復(fù)用同樣的指令多次生成回復(fù)。
設(shè)定角色
大語(yǔ)言模型特有的“長(zhǎng)期記憶”意味著它能夠模擬各種角色,提供專(zhuān)業(yè)的反饋或獨(dú)特的視角解讀。因此,設(shè)定角色是第五個(gè)小技巧。
例如,輸入指令時(shí),可以讓它模仿典型讀者提供寫(xiě)作上的反饋,也可以讓它扮演一名寫(xiě)作教師幫助修訂文稿,甚至可以讓它扮演一頭擅長(zhǎng)人類(lèi)生理學(xué)的西藏牦牛,以其獨(dú)特的視角解釋高海拔對(duì)心肺功能的影響。
“讓大語(yǔ)言模型扮演不同角色,不僅能獲得更多有針對(duì)性和符合語(yǔ)境的回復(fù),還能在整個(gè)過(guò)程中獲得更多樂(lè)趣。”林志成說(shuō)。
提供具體例子
大語(yǔ)言模型擅長(zhǎng)小樣本學(xué)習(xí)。“一個(gè)特別有效的手段就是使用具體例子豐富大模型的想法。就像你去理發(fā)店,對(duì)理發(fā)師描述想要的發(fā)型,最好的方法是給他看照片。”林志成說(shuō),提供具體例子是第六個(gè)小技巧。
比如,輸入指令時(shí),不要模糊地說(shuō)“以這些數(shù)據(jù)制圖”,而是提供一個(gè)例子,如“為這些數(shù)據(jù)畫(huà)個(gè)條形圖,類(lèi)似附件論文中的圖”。再比如,當(dāng)你讓大語(yǔ)言模型根據(jù)文稿生成摘要時(shí),可以提供幾份期刊中的摘要樣例,大語(yǔ)言模型就可以參考這些例子生成符合期刊風(fēng)格的摘要。
“這些具體的例子就像路線(xiàn)圖一樣,指導(dǎo)大語(yǔ)言模型朝著你期望的方向生成內(nèi)容。”林志成說(shuō)。
聲明回復(fù)格式
林志成說(shuō),大語(yǔ)言模型經(jīng)常“廢話(huà)太多”。例如,讓它修改一篇文章,它可能會(huì)把修改的細(xì)節(jié)一并反饋,但其實(shí)你只需要最后的成稿。
此時(shí),可以要求大語(yǔ)言模型僅輸出修改后的內(nèi)容。比如,可以指定回復(fù)格式,包括列表格式、閱讀水平和語(yǔ)言等。用列表格式和通俗的語(yǔ)言能夠提升回復(fù)的可讀性;限制回復(fù)的長(zhǎng)度可以使內(nèi)容更加簡(jiǎn)潔;設(shè)定閱讀水平則有助于更好地理解。這是第七個(gè)小技巧。
例如,與其讓大語(yǔ)言模型“總結(jié)關(guān)鍵發(fā)現(xiàn)”,不如聲明回復(fù)格式,“用列表形式總結(jié)關(guān)鍵發(fā)現(xiàn),并使用高中生能夠理解的語(yǔ)言”。
實(shí)驗(yàn)、實(shí)驗(yàn)再實(shí)驗(yàn)
“需要指出的是,如何使指令更有效,尚無(wú)確切答案。有時(shí)稍微調(diào)整一下,可能就會(huì)收獲意外驚喜。”林志成說(shuō),實(shí)驗(yàn)、實(shí)驗(yàn)再實(shí)驗(yàn),是最好的辦法。這也是第八個(gè)小技巧。
例如,在一系列推理問(wèn)題中,在指令中簡(jiǎn)單加入“一步一步思考”就可以讓大語(yǔ)言模型表現(xiàn)得更好。
有意思的是,大語(yǔ)言模型還能回應(yīng)“情緒性的信息”。假如你讓它修改一篇未經(jīng)同行審議的論文,可以在指令中加入一些短語(yǔ),比如“深呼吸一下,這事對(duì)我的職業(yè)生涯很重要”。
林志成說(shuō),這些例子證明大語(yǔ)言模型對(duì)指令非常敏感。不過(guò),并非所有嘗試都會(huì)成功,但每次嘗試都會(huì)有新的收獲,并在一定程度上提升工作效率、增加樂(lè)趣。
來(lái)源:《中國(guó)科學(xué)報(bào)》