精準識別AI生成內(nèi)容:讓AI“識破”AI
近日,南開大學(xué)計算機學(xué)院媒體計算實驗室取得最新研究成果,不僅從評估的角度揭示了現(xiàn)有AI檢測方法的性能不足,還創(chuàng)新性地提出了“直接差異學(xué)習(xí)”優(yōu)化策略,教會AI用“火眼金睛”辨別人機不同,實現(xiàn)AI檢測性能的突破。相關(guān)成果論文已被計算機多媒體領(lǐng)域國際頂級會議ACM MM2025接收。
目前AI生成內(nèi)容檢測主要有兩種路線:一種是“基于訓(xùn)練的檢測方法”,使用特定數(shù)據(jù)訓(xùn)練一個專用的分類模型;另一種是“零樣本檢測方法”,直接使用一個預(yù)訓(xùn)練的語言模型并設(shè)計某種標準進行分類。
多項研究表明,現(xiàn)有檢測方法在應(yīng)對復(fù)雜的現(xiàn)實場景時常顯不足。此前曾有媒體報道,《荷塘月色》《流浪地球》等作品被某常用論文AI率檢測系統(tǒng)檢出高AI率。
為何現(xiàn)有的AI檢測工具會“誤判”?論文第一作者、南開大學(xué)計算機學(xué)院計算機科學(xué)卓越班2023級本科生付嘉晨解釋:“如果把AI文本檢測比作一場考試,檢測器的訓(xùn)練數(shù)據(jù)等同于日常練習(xí)題,現(xiàn)有檢測方法是機械刷題、死記硬背答題的固定套路,難以學(xué)會答題邏輯,一旦遇到全新難題,準確率就會顯著下降。”
“要想實現(xiàn)通用檢測,理論上需收集所有大模型的數(shù)據(jù)進行訓(xùn)練,但在大模型迭代飛速的今天幾乎不可能。”付嘉晨說,讓檢測器真正學(xué)會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關(guān)鍵。
為此,研究團隊另辟蹊徑,通過直接優(yōu)化模型預(yù)測的文本條件概率差異與人為設(shè)定的目標值之間的差距,幫助模型學(xué)習(xí)AI文本檢測的內(nèi)在知識,可以精準捕捉人機文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。
“我們的檢測器如同有了‘火眼金睛’,即便只‘學(xué)習(xí)’過DeepSeek-R1的文本,也能精準識別像GPT-5這樣最新大模型生成的內(nèi)容。”付嘉晨說。
團隊還提出了一個全面的測試基準數(shù)據(jù)集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構(gòu)造了接近10萬條人類-AI文本對。
“MIRAGE是目前唯一聚焦于對商用大語言模型檢測的基準數(shù)據(jù)集。直觀地說,之前的基準數(shù)據(jù)集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強大的大模型聯(lián)合命題,形成一套高難度又有代表性的檢測試卷。”論文通訊作者、南開大學(xué)計算機學(xué)院副教授郭春樂說。
MIRAGE的測試結(jié)果顯示,現(xiàn)有檢測器的準確率從在簡單數(shù)據(jù)集上的90%驟降至約60%;而使用團隊的檢測器仍保持85%以上的準確率。與斯坦福大學(xué)提出的DetectGPT相比,性能相對提升71.62%;與馬里蘭大學(xué)、卡內(nèi)基梅隆大學(xué)等共同提出的Binoculars方法相比,性能相對提升68.03%。
“AIGC發(fā)展日新月異,我們將持續(xù)迭代升級評估基準和技術(shù),致力于實現(xiàn)更快、更準、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。”研究團隊負責(zé)人、南開大學(xué)計算機學(xué)院教授李重儀說。
- 哈爾濱工業(yè)大學(xué),太寶藏了吧!
- 精準識別AI生成內(nèi)容:讓AI“識破”AI
- 西北華北等地多降雨和對流天氣 黃淮江淮等
- 北京市氣象臺發(fā)布暴雨藍色預(yù)警信號
- 華南降雨持續(xù)北方強對流頻發(fā) 中東部高溫盛
- 只有初中學(xué)歷卻破解了世界級難題,他為什么
- 文化“加碼” 旅游“升溫”
- 暑期入境游持續(xù)紅火 各地打造特色旅游產(chǎn)品
- 水利部維持針對北京、四川等6省區(qū)市洪水防
- 山洪+積水內(nèi)澇雙預(yù)警 北京這些地區(qū)需注意
- (鄉(xiāng)村行·看振興)福建永安:制種有“稻”
- 多元業(yè)態(tài)融合 各地暑期消費活力十足
- 決勝“十四五” 打好收官戰(zhàn)|讓“信號滿格
- 來北京,見證一場機器人的“狂歡”
- 何以中國|走近“腦機接口”,探秘如何“心
- 安徽首款全自研繩驅(qū)機器人首秀
- 新華全媒+|來2025世界機器人大會,體驗“
- 論文工廠產(chǎn)業(yè)化、AI代寫成風(fēng) 科學(xué)出版業(yè)面
- 氫鋰雙引擎延伸工業(yè)無人機航線
- 科學(xué)與健康丨幫助作物“優(yōu)生優(yōu)育”!首臺全
- 秀我中國|和機器人過高能量的一天
- 7月電商物流指數(shù)再創(chuàng)年內(nèi)新高
- 抓住數(shù)智變革機遇降低物流成本
- 智能機器人的八大應(yīng)用場景
- 7月快遞發(fā)展指數(shù)同比提升5.2% 以舊換新政
- 走近全球首臺兆瓦級漂浮式波浪能發(fā)電裝置
- 秀我中國|在世界機器人大會上,我解鎖了47
- 新華視點|人形機器人:從“跑起來”到“用
- 促進機器人產(chǎn)業(yè)實現(xiàn)更多創(chuàng)新突破
- “智”造科技生活 共享美好未來











