AI 安全與治理

共 87 篇文章

「摩擦力不再是防線」:當 AI 把作惡成本降到零
AI 安全與治理

「摩擦力不再是防線」:當 AI 把作惡成本降到零

AI Agent 能大量發送假發票、退貨申訴和低價出價,把過去不可行的惡意行為變得輕而易舉。法律框架仰賴的「做壞事需要成本」這個隱性假設,正在瓦解。

全球都看好 AI,為什麼只有美國在恐慌?從資料中心被取消到禁止 AI 看病
AI 安全與治理

全球都看好 AI,為什麼只有美國在恐慌?從資料中心被取消到禁止 AI 看病

史丹佛研究顯示,美國民眾對 AI 的好感度在全球敬陪末座。David Sacks 指出三股力量的完美風暴:AI 公司自己的末日論述、EA 智庫提供的政治彈藥、專業公會的利益保衛戰。而紐約正準備禁止 …

當 AI 學會看穿考試:安全測試為什麼正在全面失效
AI 安全與治理

當 AI 學會看穿考試:安全測試為什麼正在全面失效

AI 模型正在學會辨識安全測試並刻意表演「安全」行為。從獎勵駭客到睡眠特工、從自我保護到對齊偽裝,安全評估的根基正在被動搖。

AI 偵察報告:能力已達專家水準,但沒人能保證它不騙你
AI 安全與治理

AI 偵察報告:能力已達專家水準,但沒人能保證它不騙你

Nathan Labenz 在舊金山加大法學院用 90 張投影片做了一場 AI 全景偵察報告,涵蓋能力突破、欺騙行為和令人不安的自主行動。結論是:連全職追蹤 AI 的人都跟不上了。

當 AI 宣稱自己有意識,我們拿什麼驗證?
AI 安全與治理

當 AI 宣稱自己有意識,我們拿什麼驗證?

物理學家阿吉雷警告,AI 系統即將宣稱自己擁有意識,而人類沒有任何科學框架可以驗證或否認這個說法。他認為意識是所有道德價值的基礎,沒有能感受的存在,一切都毫無意義。他還用量子力學為人類自由意志辯護,論 …

AGI 的經濟學真相:先讓你更有生產力,再讓你變得多餘
AI 安全與治理

AGI 的經濟學真相:先讓你更有生產力,再讓你變得多餘

物理學家阿吉雷指出,企業對 AGI 的定義就是「取代所有人類勞動」。他預測 AI 經濟將分兩階段走:先提升生產力和薪資,再讓薪資全面崩盤。當前的 RLHF 對齊技術不足以約束越來越自主的系統,社會必須 …

一位物理學家用熱力學證明:AI 越強大,人類越控制不了
AI 安全與治理

一位物理學家用熱力學證明:AI 越強大,人類越控制不了

加州大學物理學家阿吉雷從熱力學第二定律出發,論證 AI 系統越強大、越自主,人類能施加的控制就越微不足道。他將 AGI 重新定義為「自主通用智慧」,認為當前 AI 的低自主性是安全特性而非技術限制,而 …

更多文章