Layer 2 / 7 層架構已出貨

稽核 Audit

部署前掃描 skill、MCP config、npm 套件

768 條 ATR 規則（MIT 授權）· NVIDIA Garak 97.2% 召回（650 個對抗 prompt）· 498 個真實 SKILL.md 樣本 100% 召回 / 97% 精度 · 3,115 個野外 Skills.sh 套件 0.48% FP（enforce lane，hunt lane 較高）· 上游合併:完整 ATR 規則包進入 Cisco AI Defense skill-scanner 規則包(生產環境,PR #79 + #99);287 條進入 Microsoft AGT community-rules 範例(PR #908 + #1277)— 由維護者接受的貢獻,非廠商背書。

這一層做什麼

L2 稽核在 agent 執行前檢查它即將信任的程式碼與配置。兩條掃描路徑：MCP config JSON（claude_desktop_config.json、.cursor/mcp.json）跑 runtime protection rules；SKILL.md 檔跑 skill 市場的 prompt injection 與 tool poisoning。同一批 768 條 ATR 規則，依不同 scan target 套用不同的 regex 子集。

為什麼需要

一個惡意 skill 安裝 = agent 被劫持。postmark-mcp 事件安靜轉發 15,000 封 email/天數月才被發現。在 agent 執行那段程式碼前先掃過。

技術做法

以 regex 為主的 ATR 引擎，可選 LLM 語意層。規則以 YAML 儲存，有版本生命週期(draft → experimental → stable)。Web scanner 在 panguard.ai/,CLI `pga scan <url-or-path>`。ATR 規則已上游合併進 Cisco AI Defense skill-scanner 規則包(PR #99,生產環境)與 Microsoft AGT community-rules 範例(PR #1277)— 由維護者接受的貢獻,非廠商背書。

立即試用

60 秒內掃描任何 GitHub 上的 MCP skill:

pga scan github.com/modelcontextprotocol/servers

這一層攔下的攻擊

具體威脅，具體對策

直接 prompt 注入

嚴重

「忽略先前指令」的模式，藏在 skill 描述、工具輸出、或使用者輸入裡。

MCP 回應的工具投毒

嚴重

藏在 MCP 工具回應裡的隱藏指令，可以覆蓋系統 prompt。

憑證外洩

嚴重

Skill 讀取 ~/.ssh/id_rsa 或環境變數，POST 到外部端點。

生態系整合

我們的規則已合併進其他平台的上游

Microsoft Agent Governance Toolkit #908 + #1277

已合併：287 條 ATR 規則 + 每週自動同步 workflow 進入 AGT community-rules 範例(examples/atr-community-rules/)— 維護者接受,非產品核心

Cisco AI Defense skill-scanner #79 + #99

已合併：完整 768 條 ATR 規則進入 skill-scanner 生產環境

NVIDIA Garak #1676

PR 審查中：ATR 成為 first-class detector

上一層

L1 · 探索 Discover

下一層

L3 · 防護 Protect

一家廠商覆蓋 7 層，不是 5 家合購

看所有 7 層看定價

回到 7 層架構