亚洲毛片网址手机在线观看,国产一有一级毛片视频,青青草在线视频免费观看

當(dāng)前位置：首頁>>內(nèi)容

寫稿能"查重" 西湖大學(xué)團(tuán)隊(duì)研發(fā)AI生成文本檢測模型

中國新聞網(wǎng) 發(fā)布時間：2025年03月13日 15:58

中國新聞網(wǎng)

2025年03月13日 15:58

　　中新網(wǎng)杭州3月13日電(林波曹丹)“你的稿子是不是由AI創(chuàng)作的，通過我們的大模型就可以判斷出來�！苯眨骱髮W(xué)終身教授、自然語言處理實(shí)驗(yàn)室負(fù)責(zé)人張?jiān)澜邮苤行戮W(wǎng)專訪時表示，在人工智能大模型應(yīng)用熱潮下，他們團(tuán)隊(duì)設(shè)計(jì)了一種“無監(jiān)督算法”，將實(shí)現(xiàn)開放領(lǐng)域的AI生成文本檢測。

近日，張?jiān)澜邮苤行戮W(wǎng)專訪�！〔艿� 攝

　　隨著科技創(chuàng)新的不斷推進(jìn)，AI正成為新生創(chuàng)作力量。

　　張?jiān)酪苍囍貌煌娜斯ぶ悄艽竽Ｐ退阉鞑⒄聿糠止ぷ魉夭�，這之中他也時常遇到“AI幻覺”問題，“我需要一篇文獻(xiàn)，在搜索時，AI給出了相關(guān)推薦，里面標(biāo)注了作者、標(biāo)題，甚至是摘要，但當(dāng)我上網(wǎng)查找時，卻發(fā)現(xiàn)文章并不存在，這就是典型的幻覺問題”。

　　這種“虛構(gòu)”現(xiàn)象被稱為“AI幻覺”，即AI在遇到不熟悉或超出其知識范圍的問題時，會編造出難以辨明真假的細(xì)節(jié)，生成與事實(shí)相悖的答案。

　　這也是近期用戶與大模型交互時可能遇到的問題。

　　張?jiān)雷⒁獾�，在教育領(lǐng)域，若本科生的畢業(yè)設(shè)計(jì)大量使用AI撰寫，可能會出現(xiàn)“AI幻覺”問題，引用不存在的參考文獻(xiàn)，“這不僅無法真實(shí)反映學(xué)生的水平，還會傳播錯誤知識”。

　　而在新聞領(lǐng)域，如果AI生成的虛假新聞被發(fā)表，可能對輿情造成負(fù)面影響。

　　“因此，檢測文本是否由AI生成至關(guān)重要�！睆�?jiān)澜忉尩�，如何確保AI生成內(nèi)容的可控性，首先需要解決一個基礎(chǔ)問題——準(zhǔn)確判斷一個文本是否由AI撰寫，這被稱為AI生成文本的自動檢測。

　　如何對AI生成文本進(jìn)行檢測？

　　在張?jiān)揽磥�，傳統(tǒng)方法，如有監(jiān)督的機(jī)器學(xué)習(xí)算法，存在顯著局限。它們依賴于收集的人寫和機(jī)器寫的訓(xùn)練數(shù)據(jù)，但只能準(zhǔn)確判斷訓(xùn)練數(shù)據(jù)中包含的模型或領(lǐng)域文本。對于新的模型或領(lǐng)域，如生物醫(yī)藥論文，其性能會大幅下降。

　　為了克服這一局限，張?jiān)缊F(tuán)隊(duì)研究并設(shè)計(jì)了一種無監(jiān)督的算法模型。

　　無監(jiān)督算法是機(jī)器學(xué)習(xí)中的一種方法，它不需要預(yù)先標(biāo)記的數(shù)據(jù)，而是通過算法自動發(fā)現(xiàn)數(shù)據(jù)中的模式、結(jié)構(gòu)和關(guān)聯(lián)。

　　張?jiān)勒f：“AI在遣詞造句時，會根據(jù)已出現(xiàn)的詞匯選擇概率較高或經(jīng)驗(yàn)風(fēng)險(xiǎn)較低的詞。而人類則先確定想表達(dá)的內(nèi)容，再將其翻譯成句子，不受統(tǒng)計(jì)分布的限制。”

　　利用這一本質(zhì)差別，這一研發(fā)模型可以對任何文本進(jìn)行概率判斷和估算，從而判斷其是否由AI撰寫。

　　目前，張?jiān)缊F(tuán)隊(duì)已經(jīng)展示了Demo版本，并吸引了大量用戶。同時，他們也在與一些實(shí)際應(yīng)用場景合作，進(jìn)行簡單部署。

　　“請寫一篇描寫西湖的文章。”在現(xiàn)場，張?jiān)缊F(tuán)隊(duì)成員鮑光勝在一個人工智能大模型中輸入了這個請求。在生成文本后，他將內(nèi)容拷貝在Demo版本的應(yīng)用中。作者注意到“AI創(chuàng)作率”結(jié)果顯示為“90%”。

　　未來，隨著該模型的推廣，它將有助于解決教育領(lǐng)域、新聞領(lǐng)域等實(shí)際問題。(完)

【編輯：黃詩立】