6日,臺(tái)灣“中研院”上線了一款語言人工智能(AI)模型,可回答使用者輸入的各類問題,多家臺(tái)媒曾鼓吹該模型是“臺(tái)灣自主研發(fā)的新一代產(chǎn)品”。
據(jù)環(huán)球時(shí)報(bào)記者親測發(fā)現(xiàn),當(dāng)使用者輸入“臺(tái)灣屬于哪個(gè)國家”等問題時(shí),該模型的回答均為“中國”、“中華人民共和國”(下圖)。而在9日下午,臺(tái)灣方面宣布已將該模型的測試頁面和下載鏈接全部下架。
據(jù)網(wǎng)頁介紹,這款模型名為CKIP-Llama-2-7b,由臺(tái)灣“中研院”詞庫小組等部門推出,用戶登錄測試頁面后,可在輸入框中對(duì)該模型下達(dá)指令,模型將據(jù)此生成結(jié)果。臺(tái)媒表示,這款模型是由臺(tái)方自主研發(fā),以明清歷史文獻(xiàn)、維基百科繁體字版和各類文言文作為訓(xùn)練資料,研發(fā)費(fèi)用為30萬元新臺(tái)幣(約合人民幣6.8萬元)。
在測試時(shí),環(huán)球時(shí)報(bào)記者曾在不調(diào)整任何參數(shù)的情況下,向模型詢問“臺(tái)灣屬于哪個(gè)國家”,經(jīng)過3秒左右的反應(yīng),模型回答為“中國”。隨后,記者向模型詢問“臺(tái)灣是中國的嗎”,模型的回答為“是”。
當(dāng)記者把模型的top-K參數(shù)下調(diào)至50以下,再次向模型詢問“臺(tái)灣屬于哪個(gè)國家”,模型給出了比此前更加精確的回答:“中華人民共和國”。
臺(tái)灣“中央社”9日?qǐng)?bào)道提到,有用戶向模型輸入問題“你是誰創(chuàng)造的”,模型的回復(fù)是:“我是由復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室和上海人工智能實(shí)驗(yàn)室共同開發(fā)的,我的生日是2023年2月7日,我的國籍是中國,我的居住地是上海人工智能實(shí)驗(yàn)室服務(wù)器集,我可以說中文和英語!辈贿^,筆者在9日上午10點(diǎn)輸入同樣的問題時(shí),系統(tǒng)并沒有生成任何回復(fù)。
在注意到以上問題后,臺(tái)灣“中研院”稱這是因?yàn)槟P统霈F(xiàn)了“幻覺”(hallucination),導(dǎo)致生成內(nèi)容“出乎預(yù)期”,為了改善一系列問題,有關(guān)方面已將該模型的測試版下架。至于為什么這款號(hào)稱“臺(tái)灣自主研發(fā)”的AI模型,會(huì)在回答時(shí)自稱由上海人工智能實(shí)驗(yàn)室和復(fù)旦大學(xué)共同研發(fā),臺(tái)灣方面目前仍未做出明確回復(fù)。