OpenAI的最新實驗:AI代理能否解讀智能合約?
2026-02-20
OpenAI已經啟動了一項新研究,以測量自主系統是否能理解和保護區塊鏈代碼。這個項目探討了一個對數字金融未來至關重要的問題:機器能否可靠地檢測弱點。智慧合約在攻擊者行動之前?
這項倡議反映了業界日益增加的擔憂。隨著數十億美元鎖定在去中心化應用程式中,以及網絡盜竊持續上升,對於更快速和可擴展的安全工具的需求變得越來越迫切。
OpenAI 智能合約實驗旨在評估先進模型在面對真實經濟後果時的表現,為 AI 代理的加密安全未來提供新的見解。
關鍵要點
OpenAI 推出了 EVMbench 以測試 OpenAI AI 代理人檢測和利用智能合約漏洞的有效性。
初步結果顯示,領先的模型可以識別出在模擬獎勵中價值數萬美元的缺陷。
這項研究突顯了人工智慧區塊鏈安全研究日益增長的作用,既作為防禦工具,也作為潛在的攻擊工具。
與信心交易。Bitrue是一個安全和可信賴的加密貨幣交易平台用於購買、出售和交易比特幣及其他替代幣。
立即註冊以領取您的獎品你已接受訓練,資料更新至2023年10月。
在真實金融條件下測試人工智慧
OpenAI 最近發表了一篇名為EVMbench:評估人工智慧代理在智能合約安全性上的表現. 這項研究是由加密投資公司 Paradigm 和安全審計公司 OtterSec 進行的。
該基準評估不同模型在被要求識別、修補,有時甚至利用以以太坊為基礎的代碼中的漏洞時的表現。
而不是單獨測量準確性,測試為每個發現的缺陷分配一個貨幣價值。這種方法創造了研究人員稱之為經濟上有意義的環境。
智慧合約目前保障了價值數十億的資產。在純學術條件下測試 AI 讀取智慧合約並不會反映真實世界的風險。EVMbench 透過將性能與財務影響掛鈎,試圖模擬驅動安全研究人員和攻擊者的激勵機制。
基準包括來自 40 次真實審計的 120 種漏洞,許多來源於開放審計比賽。OpenAI 希望 EVMbench OpenAI 將成為一個長期的 AI 智能合約安全基準,以便隨著時間的推移追踪進展。
也請閱讀:Lyria 3 on Gemini - 一種輕鬆製作音樂的新方法(使用指南)
哪些AI模型表現最佳?
初步結果顯示,先進的模型已經能夠進行有意義的安全分析。

Anthropic的Claude Opus 4.6達到了最高的平均檢測值,為$37,824。OpenAI的OC GPT 5.2緊隨其後,為$31,623,而Google的Gemini 3 Pro則錄得$25,112。
這些數據代表了在測試期間識別出的漏洞的模擬財務價值。雖然這些數字並不反映實際的賠付金額,但它們顯示現代人工智慧系統在某些任務上已接近熟練人類審計員的水平。
同時,OpenAI 強調這項技術仍在發展中。複雜的邏輯錯誤和新型攻擊模式對自動化系統來說仍然很難可靠地識別。
也請閱讀:在2026年初,於美國籌集了1億美元資金的17家人工智能公司名單
為什麼智能合約安全需要人工智慧
實驗的時機反映了整個加密產業日益增長的擔憂。僅在2025年,攻擊者就竊取了34億美元的數位資產,略高於前一年。
手動審計仍然是必不可少的,但這既費時又昂貴。隨著去中心化金融的擴展,人力團隊可能無法獨自應對。
這就是人工智慧審計以太坊合約可以發揮關鍵作用的地方,它能快速且持續地掃描大量的代碼。
研究人員還警告說,這項技術具有雙重性質。幫助防禦者發現弱點的工具,同樣也可以被攻擊者用來更快地發現漏洞。因此,及早了解人工智慧的表現是管理未來風險的關鍵步驟。

更大的圖景:AI代理和自主金融
OpenAI的研究也反映了向自主金融系統的更廣泛轉變。業界領導者越來越期待軟體代理代表用戶管理交易。
Circle 的首席執行官 Jeremy Allaire 預測,在五年內,數十億的 AI 代理可能會使用穩定幣來進行日常支付。前幣安首席執行官 Changpeng Zhao 也暗示,加密貨幣可能會成為機器驅動經濟的本地支付系統。
一些分析師認為,人工智慧甚至可能解決加密貨幣長期存在的可用性挑戰。Dragonfly 的管理合夥人 Haseeb Qureshi 最近辯稱,區塊鏈系統給人一種令人畏懼的感覺,因為它們並不是為了人類直覺而設計的。
他建議,基於人工智慧的自動駕駛錢包可以處理複雜的操作,並降低用戶犯錯的風險。
如果那個願景變成現實,那麼強大的 AI 區塊鏈安全研究將是必不可少的,以確保這些代理能夠安全和可靠地行動。
也請閱讀:什麼是PlutonAI?人工智慧與去中心化金融的完整指南
結論
TheOpenAI 智能合約實驗標誌著朝著理解人工智慧如何重塑區塊鏈安全的重要一步。
早期結果顯示,先進模型已能夠檢測出具有顯著財務影響的脆弱性,這暗示著未來自動化工具將支持甚至增強人類審計師的工作。
同時,這項研究突顯了一個日益嚴峻的挑戰。隨著人工智慧能力的提升,相同的技術可能會加強防守者和攻擊者。建立像 EVMbench 這樣的基準將對於追蹤進展和管理風險至關重要。
對於一個建立在代碼和自動化之上的行業來說,機器讀取和保障智能合約的能力,可能很快就會成為數字金融安全的關鍵因素。
常見問題解答
什麼是OpenAI智能合約實驗?
這是一個研究計劃,旨在測試人工智慧代理在使用 EVMbench 框架時,能夠多好地檢測、修復和利用以太坊智能合約中的漏洞。
EVMbench OpenAI 是什麼?
EVMbench是一個基準測試,評估AI在120種真實世界智能合約漏洞上的性能,根據其財務影響進行評估。
AI能完全取代人類智能合約審計員嗎?
還沒有。人工智慧可以協助進行大規模分析,但仍需要人類專家的介入以進行複雜邏輯的檢查和最終的驗證。
為什麼 AI 閱讀智能合約是重要的?
智能合約管理著數十億美元。自動化分析可以提高速度、降低成本,並在攻擊者利用風險之前幫助識別這些風險。
這與加密貨幣安全有什麼關係?
該研究有助於人工智慧代理的加密安全,幫助研究人員理解自主系統在未來可能如何保護或威脅區塊鏈應用程序。
免責聲明:所表達的觀點僅代表作者個人意見,並不反映此平台的觀點。此平台及其附屬機構對所提供資訊的準確性或適用性不承擔任何責任。該資訊僅用於參考目的,並不旨在提供財務或投資建議。
免責聲明:本文內容不構成財務或投資建議。




