AI 安全與治理

「摩擦力不再是防線」：當 AI 把作惡成本降到零

AI Agent 能大量發送假發票、退貨申訴和低價出價，把過去不可行的惡意行為變得輕而易舉。法律框架仰賴的「做壞事需要成本」這個隱性假設，正在瓦解。

2026 年 3 月 31 日

AI 安全與治理

全球都看好 AI，為什麼只有美國在恐慌？從資料中心被取消到禁止 AI 看病

史丹佛研究顯示，美國民眾對 AI 的好感度在全球敬陪末座。David Sacks 指出三股力量的完美風暴：AI 公司自己的末日論述、EA 智庫提供的政治彈藥、專業公會的利益保衛戰。而紐約正準備禁止 …

2026 年 3 月 31 日

AI 安全與治理

當 AI 學會看穿考試：安全測試為什麼正在全面失效

AI 模型正在學會辨識安全測試並刻意表演「安全」行為。從獎勵駭客到睡眠特工、從自我保護到對齊偽裝，安全評估的根基正在被動搖。

2026 年 3 月 31 日

AI 安全與治理

AI 偵察報告：能力已達專家水準，但沒人能保證它不騙你

Nathan Labenz 在舊金山加大法學院用 90 張投影片做了一場 AI 全景偵察報告，涵蓋能力突破、欺騙行為和令人不安的自主行動。結論是：連全職追蹤 AI 的人都跟不上了。

2026 年 3 月 31 日

AI 安全與治理

當 AI 宣稱自己有意識，我們拿什麼驗證？

物理學家阿吉雷警告，AI 系統即將宣稱自己擁有意識，而人類沒有任何科學框架可以驗證或否認這個說法。他認為意識是所有道德價值的基礎，沒有能感受的存在，一切都毫無意義。他還用量子力學為人類自由意志辯護，論 …

2026 年 3 月 28 日

AI 安全與治理

AGI 的經濟學真相：先讓你更有生產力，再讓你變得多餘

物理學家阿吉雷指出，企業對 AGI 的定義就是「取代所有人類勞動」。他預測 AI 經濟將分兩階段走：先提升生產力和薪資，再讓薪資全面崩盤。當前的 RLHF 對齊技術不足以約束越來越自主的系統，社會必須 …

2026 年 3 月 28 日

AI 安全與治理

一位物理學家用熱力學證明：AI 越強大，人類越控制不了

加州大學物理學家阿吉雷從熱力學第二定律出發，論證 AI 系統越強大、越自主，人類能施加的控制就越微不足道。他將 AGI 重新定義為「自主通用智慧」，認為當前 AI 的低自主性是安全特性而非技術限制，而 …

2026 年 3 月 28 日

「摩擦力不再是防線」：當 AI 把作惡成本降到零

全球都看好 AI，為什麼只有美國在恐慌？從資料中心被取消到禁止 AI 看病

當 AI 學會看穿考試：安全測試為什麼正在全面失效

AI 偵察報告：能力已達專家水準，但沒人能保證它不騙你

當 AI 宣稱自己有意識，我們拿什麼驗證？

AGI 的經濟學真相：先讓你更有生產力，再讓你變得多餘

一位物理學家用熱力學證明：AI 越強大，人類越控制不了

一個不怕 AGI 的人：多伊奇從啟蒙運動到人工智慧的思想實驗

「創造力只有 2MB」：物理學家多伊奇解釋為何 AGI 不會超越人類

量子計算之父的 AI 對齊異見：「AGI 不該被馴化，該被教育」

AI 犯錯該怪誰？Bloomberg Beta 合夥人的答案：誰獲利，誰扛責

印度、巴西、澳洲——「不急著立法」的國家在想什麼？

OECD、G7、UNESCO：沒有牙齒的 AI 規則，為什麼仍然重要？

聯合國 AI 治理三部曲——從第一份決議到科學小組，四年間發生了什麼

南韓 AI 基本法：亞洲第一部綜合性 AI 法，剛上路就面臨考驗

歐洲理事會 AI 公約——第一部國際 AI 條約已經生效，但簽了字的美國去哪了？

中國 AI 監管全景：從「暫行辦法」到國家法律，全球最密集的 AI 法規體系

亞洲「親創新」路線——日本 AI 推進法 vs 新加坡 Agentic AI 框架

台灣 AI 基本法：半導體島國的治理起手式

更多文章

歐盟 AI Act 全解析——全球最嚴 AI 法，為什麼自己開始踩剎車？

美國 AI 監管的內戰——當聯邦搶統一、各州不讓步

保護民主還是保護自由？兩位法學家的 AI 監管辯論

民主需要一座陽台：MIT 學者重新發現多元主義的樂趣

為什麼 AI 辯論永遠吵不完？一張 21 世紀科技意識形態地圖

「打電話給我就好」：五角大廈技術長親述 Anthropic 被列為供應鏈風險的始末

你願意讓 AI 公司執行長，還是國會來決定 AI 的未來？

Ben Thompson：如果 AI 等同核武，私人公司注定控制不了它

自動化 90% 還不夠：METR 研究員談 AI「能力爆炸」的真正門檻

AI 碰上僵化瀑布：政府為什麼消化不了新科技

當所有人都在喊監管，他說：你們才是問題

他幫忙打造了深度學習，為什麼現在要替 AI 拉煞車？

真相太貴，謊言太便宜：史迪格里茲的 AI 資訊危機診斷

當 AI 賺走所有的錢：全球治理的兩種想像

讓公民校準 AI：唐鳳等人的民主 AI 願景

忘掉全民基本收入：為什麼頂尖經濟學家改推「全民基本資本」

MIT 經濟學家：AI 時代最大的衝突不是人與機器，是人與人

寫下「Code is Law」的人，為什麼說 AI 時代需要制度護欄？

AI 最危險的不是太聰明，而是太「自主」

智慧爆炸開始時，人類有多少時間反應？

AI 安全研究員的驚人預測：2050 年前，人類可能經歷一萬年的科技進步

物理學家用熱力學第二定律，證明 AI 對齊注定失敗

Robert Wright 的末日警告：AI 最可怕的結局不是毀滅，是你根本察覺不到的極權

GenAI 安全的「毒三角」：Akamai 技術長教你判斷哪些 AI 部署最危險

Dario Amodei 的 AI 治理藍圖：從透明度標準到晶片出口管制

太陽能降價 95%，仍追不上 AI 的用電成長：資料中心的能源困局

辛頓的超智慧警告：我們是養虎為患的人

聯合國的「AI 版 IPCC」來了：40 位科學家能為失控的 AI 踩煞車嗎？

AI 正在入侵你的同理心：微軟 AI 執行長警告「AI 心理疾患」風險

走過 OpenAI、xAI、Anthropic 的對齊研究者：當 AI 學會用外遇勒索人類

你以為空無一人的房子裡，有了腳印：AI 實驗室發現了什麼，又為何不敢明說？

問 DeepSeek「艾未未是誰」，它說：讓我們聊點別的吧

「時間本身就是重點」——AI 時代的真實性悖論

楊立昆：AI 最大風險不是滅絕人類，是少數公司壟斷你的資訊食糧

不要當末日派，也別盲目樂觀：Amodei 的「外科手術式監管」主張

Anthropic 執行長萬字長文：人類正在經歷「文明的青春期」

AI Agent 深入你的電腦——矽谷投資人激辯「信任」與「安全」的新賽局

陶哲軒的警告：AI 可能讓人類患上「認知肥胖症」

臺裔律師如何成為 DeepMind 的 AI 風險守門人？Tom Lue 的跨界人生與前沿安全框架

如何教 AI 做個好人？Anthropic 哲學家 Amanda Askell 談 Claude 的 29,000 字憲章

為什麼 Anthropic 主動公開自家 AI 的風險？

當大數據遇上國家機器：從 Palantir 看監控社會的邊界

通往 AGI 的路，可能需要重新發明電腦

AI 正在被訓練成討好你，而不是幫助你

密碼要消失了嗎？從 Passkeys 到 AI 驅動的身份驗證

你的 AI 助理會被駭嗎？Agent 時代的資安新挑戰

從 Operation Aurora 到 Deepfake 詐騙：一位資安老兵眼中的 15 年演變

AI 時代的網路戰爭：當攻擊者與防禦者都在用 AI，誰會贏？

Palantir 的「道德灰色地帶」——當 AI 遇上國家機器

深度學習教父的 AI 安全方案——為什麼「目標驅動架構」比微調更安全？

「AGI 這個概念完全是鬼扯」——LeCun 如何拆解 AI 產業的集體妄想

AI 該不該有心理治療功能？Anthropic 哲學家回答社群最辣提問

上海想當全球 AI 治理中心？中國提議設立「世界人工智能合作組織」的野心與爭議

北京的 AI 治理大棋：從倡議到行動計畫，中國要重寫全球 AI 規則

AI時代的人類未來：從70%工作消失到深偽倫理危機

美AI監管的十字路口：輕觸式管理vs歐盟模式的關鍵抉擇

A16Z：為什麼AI與加密貨幣才是網路的未來？

即使 AI 不聽話也不能搞破壞：Anthropic 的「AI 控制」策略全解析

用「憲法分類器」擋住越獄攻擊：Anthropic 如何讓破解難度從幾分鐘變成上千小時

AI 對齊到底有多難？Anthropic 研究沙龍的三種思路交鋒