代码是不是言论：从 Bernstein 到 AI 模型权重

一

1991 年夏天，菲律宾马尼拉一家小印刷厂收到一笔奇怪的订单——印刷一本厚约 900 页的书，封面写着 “PGP: Source Code and Internals”。这本书没有传统意义上的章节、没有可读性的散文，从第一页到最后一页几乎全部是 C 语言代码。订购它的是麻省理工学院出版社（MIT Press）。

这本书的存在是为了一个目的：让美国联邦调查局没法起诉一个叫 Phil Zimmermann 的程序员1。

Zimmermann 那时候四十二岁，是科罗拉多博尔德的一个软件工程师。同年六月，他发布了一个叫 Pretty Good Privacy（PGP）的程序——第一个让普通人能用公钥加密保护邮件的免费工具。他通过 FTP 在互联网上公开发布了 PGP，包括完整源代码2。

PGP 在几个小时内被全世界下载。这在 1991 年是不寻常的——那时候 World Wide Web 还没有正式出现，下载主要靠 FTP 和 BBS。但密码学社区对这种工具的需求高得惊人。一个能让任何人加密通信、不依赖政府或大公司的工具，被一群人当作“密码朋克”梦想的实现。

但同样在那一刻，PGP 把 Zimmermann 推向了一场长达三年的联邦刑事调查。

美国当时把强加密软件视为“武器”。具体说，它属于 ITAR——International Traffic in Arms Regulations，由国务院管理的武器贸易条例。把武器出口需要许可证。Zimmermann 没有申请许可证就把强加密软件“出口”到了全世界——通过 FTP 在公开互联网上发布的方式。技术上这违反了 ITAR3。

1993 年，美国海关开始对 Zimmermann 进行刑事调查。如果指控成立，他可能面临数年监禁。这件事在密码学社区引起轩然大波——它把抽象的“加密自由”问题变成了一个具体的人身刑罚。

Zimmermann 的辩护团队（包括 EFF 的律师们）想了一个聪明的办法：印书。

美国宪法第一修正案保护出版自由。一本印刷的书无论内容是什么，受联邦政府限制出版的能力都非常受限。如果你能证明 PGP 源代码本质上是“印刷品”——只是恰好用 C 语言而不是英语——那它就受第一修正案保护。1995 年，MIT Press 出版了《PGP: Source Code and Internals》这本厚书。任何人可以买这本书，然后用 OCR（光学字符识别）软件把它扫描回可执行的源代码。这是一个法律上的诡辩，但有效4。

司法部最终在 1996 年悄悄撤销了对 Zimmermann 的调查。他们没有公开声明理由，但当时的解读是：他们不想在法庭上输掉“代码不是言论”的论点。

二

撤销 Zimmermann 调查没有解决根本问题。三年后，1999 年，另一个程序员让法庭直接做出了判决。

Daniel J. Bernstein 是 UC Berkeley 的数学博士生，研究密码学。他写了一个叫 Snuffle 的加密程序，想公开发布——发到 sci.crypt 新闻组、印在学术论文里、做演讲。他向美国国务院申请确认这能不能算作“出口”。国务院的回应：可以，但你需要先注册成“武器商人”（munitions dealer），然后申请武器出口许可证5。

Bernstein 起诉国务院。这场官司从 1995 年打到 1999 年。期间出口管制的归口从国务院转给了商务部（从 ITAR 转到 EAR），但争议本质没变：政府是否可以要求程序员在公开源代码之前申请许可证。

1999 年 5 月 6 日，美国第九巡回上诉法院做出判决。法官 Betty B. Fletcher 写的多数意见里包括这样几句关键论述：

“Cryptographers use source code to express their scientific ideas in much the same way that mathematicians use equations or economists use graphs … Source code is the preferred means of communication among cryptographers because cryptography is a highly technical and mathematically based field.”

因此源代码是“言论”——是一种受美国宪法第一修正案保护的表达形式6。

法院进一步说：政府要求程序员在公开源代码之前申请许可证，等于“事前审查”（prior restraint）——这是第一修正案最严格保护的对象。法院推翻了商务部对 Bernstein 适用的出口管制规则7。

这就是著名的 Bernstein 案判决。它的意义远超一个加密软件的具体争议。它在法律上确立了“代码 = 言论”的原则。1999 年之后，美国开发者公开发布开源软件不再需要担心被起诉违反武器出口法。整个加密时代——从 OpenSSL 到 Signal、从 HTTPS 到 WhatsApp 端到端加密——能够在美国土壤上发展起来，靠的就是这个判例8。

但 Bernstein 案没有解决另一件事：它只覆盖了“美国程序员把源代码贴到公开互联网”这一种情况。它没有覆盖一个更复杂的问题——如果一个伊朗博士生在 MIT 实验室里学习美国教授写的代码，这算不算“出口”到伊朗？

这个问题有一个专门的法律术语：deemed export（视同出口）。

三

EAR——Export Administration Regulations——是商务部下属机构 BIS（Bureau of Industry and Security，工业与安全局）执行的出口管制法律。它管制的“出口”不只是物理物品的跨境运输，也包括“技术”和“软件”的传递9。

EAR 把“deemed export”定义为：在美国土壤上，把受 EAR 管制的“技术”或“源代码”释放给一个外国人。这个释放被“视同”出口到了那个外国人的母国10。

具体形式包括：

口头讲解（在课堂上、会议上、实验室里）
文档传递（包括邮件、文件共享、纸质文档）
屏幕展示
让外国人观察实验

实际效果：如果一个美国大学实验室在做某种受 EAR 管制的研究（比如某些加密算法、某些 AI 算法、某些核技术、某些生物技术），那么实验室不能让外国学生或外国访问学者接触相关的“技术”或“源代码”——除非大学申请并获得 deemed export 许可证。

这听起来很荒谬。如果一个伊朗博士生在加州伯克利学习一种 EAR 管制的加密技术，那么伯克利等于把这项技术“出口”到了伊朗。要合法做这件事，伯克利需要向商务部申请许可证——而对伊朗的许可证几乎不可能获批。

实际中存在一个重要例外：基础研究例外（Fundamental Research Exception）。如果某项研究是公开发表、非保密的“基础研究”，那么它不受 EAR 管制。大部分大学研究都属于这一类——所以大学的研究生院仍然能正常接收外国学生11。

但这个例外有限制。“基础研究”必须真的是基础研究——意思是没有公司赞助、没有政府保密协议、研究成果完全公开发表。一旦研究被某个公司的合同绑定，或者涉及政府机密，例外就消失。

到了 2014 年之后，EAR 的范围开始扩展。商务部开始把一些“新兴技术”列入管制清单——量子计算、先进半导体制造、特定的 AI 算法、合成生物学。这意味着越来越多的大学研究开始触及 EAR 边界。一个在 UC Berkeley 实验室做大模型训练的中国博士生，理论上可能涉及 EAR 管制的“技术”——如果他在某个 GPU 集群上训练某种特定模型，并且这种模型属于 BIS 后续定义的某个管制类别12。

实际操作中，这种灰色地带让大学的合规办公室、外国学生、研究 PI 都活在持续紧张中。已经出现过几起 deemed export 调查——多数针对中国籍研究者。最著名的是 2018 年起的几起对华人科学家的调查，多数最终因证据不足撤销或被法庭否决，但调查本身对当事人造成了长期影响。

四

Bernstein 案和 deemed export 学说之间有一个明显的不对称。

Bernstein 案处理的是“美国人把代码贴到公开互联网”。结论：这是受保护的言论，政府不能限制。

Deemed export 处理的是“美国人在美国土壤上向外国人传授技术”。结论：这可以被监管，需要许可证。

理论上这两个情况应该一致——如果代码是言论，那么向外国人传授代码也应该是受保护的言论。但 EAR 的实际执行没有这样的逻辑一致性。

为什么？因为这两种情况影响的是不同的国家利益。把代码贴到公开互联网，政府失去了对它流向哪里的精确控制——但这种“失控”是双向的，美国软件也因此能流向全世界。在美国土壤上向外国人传授技术，政府仍然有精确控制能力——它可以决定哪些外国人能进入美国、能进入哪些机构、能接触哪些项目。

这就是开源在第三阶段面对的法律基础矛盾。Bernstein 案保护了“源代码自由公开”；deemed export 学说限制了“源代码自由协作”。1999 年那时候这两个原则看起来是平衡的——你能发布代码但不一定能跟伊朗人一起开发它。在 2014 年之前，这种平衡基本能维持，因为大部分开源开发不需要刻意区分“贡献者来自哪个国家”。

2014 年之后开始变化。GitHub 2019 年的封锁、Linux 2024 年的删除——这些不是“代码不能贴到公网”，而是“代码协作不能跨过制裁边界”。Bernstein 案保护不了这些情况，因为它处理的是出版自由，不是协作自由。

五

到了 2023-2024 年，一个 Bernstein 案完全没有想到的新问题出现了：AI 模型权重算不算言论？

这个问题不像它表面那样简单。

一个深度学习模型——比如 Llama 70B、DeepSeek R1、Qwen 72B——是由几十亿到几千亿个浮点数（权重）组成的。这些数字不是程序员一个一个写出来的，是训练过程从大量数据中“学”出来的。一个完整的开放权重模型包括三部分：

模型架构代码（用 PyTorch、TensorFlow 等写的网络结构定义）
训练流程代码（如何用数据训练模型）
模型权重（训练后得到的数字）

前两部分是传统意义上的“源代码”——人写的、可读的、可修改的。第三部分不一样。模型权重是黑箱——你不能“读懂”它，不能通过看权重判断模型在做什么。它的功能性是 emergent，从训练过程中涌现出来的13。

那么 Bernstein 案的“源代码是言论”原则适用于模型权重吗？

法律学者已经开始辩论这个问题。一种观点是：模型权重当然是言论——它是表达智能的一种形式，是人类知识的编码。另一种观点是：模型权重不像源代码，它不是“为了让人理解”的——它的存在目的是让机器执行特定任务。它更像是一个工具，不是一个表达。

到 2026 年初为止，没有任何美国法院对这个问题做出判决。但美国政府已经开始按照“模型权重可以被管制”的逻辑行动。

2024 年 2 月，BIS 提出一个新的出口管制类别：4E091——“AI 模型权重”。具体规则到 2025 年 1 月发布，叫《Framework for Artificial Intelligence Diffusion》14。

这个 framework 的核心逻辑：

对闭权重（closed-weight，只通过 API 提供的）模型：如果训练计算量超过 10^26 operations，需要 license 才能“出口”
对开权重（open-weight，公开发布的）模型：不受此管制——理由是“已发布的开放权重模型不能召回”15

这是一个有趣的承认。BIS 实际上承认了：一旦一个开放权重模型被发布，它就像 Bernstein 案里的源代码一样——已经在互联网上散布，政府没法“收回”它。所以管制只对未来未发布的、超大模型有意义。

但这个让步没有解决另一个问题。联邦承包商（federal contractors）——任何为美国政府工作的公司——能不能使用已经发布的开放权重模型？

2025 年 1 月底，中国的 DeepSeek 公司发布 R1 模型。它在数学和推理 benchmark 上达到或超过 OpenAI 的 o1，但用的是较旧的 Nvidia H800 GPU（已经被出口管制限制了），并且完全开源（MIT License）16。

DeepSeek R1 在中文与英文社区都引起轰动。它似乎证明了：美国的芯片出口管制无法阻止中国 AI 进展。但它也很快引发美国政策反应。

2025 年 2 月，参议员 Bill Cassidy（路易斯安那共和党）和 Jacky Rosen（内华达民主党）联合提出 legislation：禁止联邦承包商在与联邦合同相关的任何活动中使用 DeepSeek 或它的后续模型17。

2025 年 4 月，众议院“对中国共产党战略竞争特别委员会”发布关于 DeepSeek 的报告，建议更新 FAR（Federal Acquisition Regulations）以禁止联邦政府采购基于中国模型的 AI 系统18。

2025 年 12 月，美国政府更新 AI 采购规则：联邦承包商被禁止使用中国 AI 模型。如果你是美国国防、医疗、公共基础设施领域的承包商，Qwen 和 DeepSeek 完全不可用19。

这意味着什么？意味着 BIS 在出口管制层面承认“开放权重模型已经在公地里”，但联邦采购层面通过另一条路径——你可以下载这些模型，但你不能用它们为美国政府工作——实质上把这些模型重新“领土化”了。

这是 Bernstein 案没有想到的情况。Bernstein 案保护了出版自由，但没有保护“使用自由”。一个 1999 年的法庭可能没有预见：未来一个开发者不只要担心代码能不能跨境流动，也要担心代码能不能被用于跨主权场景。

六

让我们把 1991 年 Phil Zimmermann 在墨西哥城印 PGP 源代码这件事，跟 2025 年 12 月联邦承包商被禁用 DeepSeek 这件事放在一起。

1991 年的情境：政府通过 ITAR 管制源代码出口。Zimmermann 用一本印刷书绕过这个管制，因为书受第一修正案保护。

2025 年的情境：政府通过 FAR 限制承包商使用已经全球公开的开放模型。这个限制不针对模型本身（你仍然能下载 DeepSeek R1），针对的是“在某些合同场景下使用”。Bernstein 案的言论自由保护不适用——因为政府没有禁止你下载，只是禁止你为它工作时使用20。

这是一个值得停下来的细节。三十四年间，管制的形式变了。1991 年管制源代码的“边界穿越”；2025 年管制的是“使用语境”。两种管制都不直接限制内容本身——但效果都是让特定主体在特定场景下不能使用特定代码。

这种“间接管制”在法律上比 Bernstein 案的“前置审查”更难挑战。前置审查直接禁止你出版——这是宪法明确保护的领域。间接管制只是说“你可以出版/使用，但不能在某个特定语境下”——这给政府留下了大量灰色地带。

而 Bernstein 案的“代码是言论”原则只覆盖前者，不覆盖后者。

七

更深一层的问题是：模型权重和源代码到底是不是同一种东西？

如果它们是同一种东西，那么 Bernstein 案的判决应该自然延伸——任何开放发布的模型权重都受第一修正案保护。

如果它们不是同一种东西，那么对模型权重的管制可以采用不同标准。

支持“是同一种东西”的论点：

模型权重是人类知识的编码——它编码了大量训练数据中的模式
模型权重可以被读、被分析（虽然很难）、被反向工程
模型权重可以传达信息——通过 prompt 输入，它可以生成各种输出
模型权重的存在和分发本质上是一种“表达”——开发者通过它表达“这是我们对智能的理解”

支持“不是同一种东西”的论点：

模型权重不是被人写出来的——它是机器学习的产物
模型权重不能被“读懂”——你看到一堆数字，无法判断它在做什么
模型权重的功能性来自数十亿参数的协同，没有“逐行理解”这种可能
模型权重更像是一个工具，不是一个表达——它的存在目的是被使用，不是被理解

这场辩论现在还在进行中。美国政府的实际行动倾向于把模型权重当作“工具”——可以被出口管制覆盖。但 NTIA 在 2024 年 7 月的报告里说，已经发布的开放权重模型应该用“监控”而不是“限制”来应对21。这是一种折中——承认 Bernstein 式的“已经发布无法收回”，但保留对未来发布的管制空间。

整个事情有一个让人想停下来的细节：DeepSeek R1 是用 MIT License 发布的。MIT License 是开源世界最宽松的许可证之一，不附带任何“道德”或“政治”条款。它的全部条款是：“这个软件按 as-is 提供，没有任何保证，作者不承担任何责任，你可以做任何事情。”22

按照 MIT License 的字面文义，美国政府承包商当然可以使用 DeepSeek R1——许可证里没有任何限制。但美国政府通过 FAR 创造了一个新的限制：不是 license 层面的限制，是合同层面的限制。开源许可证说“可以用”，联邦采购规则说“不可以用”——两个法律框架同时适用，结果是“在某些场景下不可以”。

这种叠加规制让“开源”在 2025 年之后变成一个复杂的概念。Bernstein 案的“代码是言论”仍然有效；MIT License 的“任何人可以使用”仍然有效；但叠加在上面的合规层让实际的可用性大幅缩水。

八

把所有这些放在一起看，会发现一个 Bernstein 案从根本上没有解决的问题。

代码是言论——这个判决保护的是创造和发布自由。任何人可以写代码，任何人可以发布代码。政府不能因为代码内容而限制创造和发布。

但开源代码的整个生命周期，远超过“创造和发布”。它包括：

分发（distribution）：通过 GitHub、Gitee 等平台
协作（collaboration）：通过 maintainer 之间的 pull request、issue 讨论
使用（use）：把代码集成到产品、服务、研究中
资助（funding）：通过 GitHub Sponsors、Tidelift、Sovereign Tech Fund

Bernstein 案只保护“发布”。其他四个环节都可以被各种规制覆盖：

分发受平台所在地法律管辖（GitHub 是美国公司，所以受 OFAC）
协作受 deemed export 学说约束（美国土壤上跟外国人协作可能需要许可证）
使用受承包商/合规规则约束（FAR、CRA、网信办备案等）
资助受反洗钱和制裁规则约束（不能向被制裁实体打钱）

每一个环节都不直接违反 Bernstein 案。每一个环节都不直接禁止代码本身。但叠加起来，它们能把一个完整开源项目的实际可用性切碎。

这是开源在 2024 年后面对的法律现实。Stallman 1985 年想象的那种“代码自由”——四项自由——在 Bernstein 案中得到了部分宪法保护。但他没有想象到一个状况：当代码的整个生命周期被分散到不同的法律领域，每个领域都有自己的规则，“四项自由”中的每一项都可能在某个环节被限制——而没有任何一个限制单独看起来违反宪法。

这就是 Bernstein 案的真正局限。它是一份关于“创造和发布”的判决书。开源运动的下一个十年里，最关键的问题不是“代码能不能被发布”——这个问题已经被答了。最关键的问题是“代码能不能被自由使用”——这个问题没有被任何法院明确回答23。

九

读到这里有人可能会问：那么开源运动应该怎么应对？

简单的回答：没有简单的答案。

事实层面，开源运动可以做几件事：

第一，结构上的“主权避险”。RISC-V International 2019 年从 Delaware 迁到瑞士就是这种逻辑。如果一个开源治理实体不愿意承担美国法律义务，它可以选择搬到一个法律框架更友好的国家。但这个选择会限制它在美国市场的影响力——美国大公司倾向于使用美国注册实体管理的项目。

第二，许可证层面的创新。Bruce Perens 在 2023 年提出 “Post-Open” 许可证的想法——它在 GPL/MIT 之外创造一种新类型，专门处理国家级使用场景。这个想法到 2026 年还没有成为成熟提案24。

第三，联邦化协作的备援。Codeberg、Gitea、Forgejo 这类去中心化的代码托管在 2022 年之后获得显著用户增长——部分是回应 GitHub 制裁的不确定性。但代码托管只是协作的一个环节——issue、CI、review 流程更难分散化。

第四，接受新的法律现实，在其中找位置。这是大多数大型开源项目实际在做的事。Linux Foundation 接受了 OFAC 合规要求——2024 年的 11 人删除是这个接受的结果。Apache Foundation 也在做同样的事。这不是投降——这是在新现实中保护项目长期生存的策略。

但每个选择都有代价。“主权避险”放弃了美国市场的便利；“许可证创新”会引起社区分裂；“备援”难以达到主流协作密度；“接受新现实”意味着开源运动失去了某种纯粹性。

到 2026 年初，没有任何一个选择已经被开源世界整体接受。各方都在自己的位置上试探。这是一个开放的局面——它的解决可能要再过五年或十年。

十

Bernstein 案现在已经过去 27 年。Phil Zimmermann 在 2021 年的一次 The Register 采访里说，他不后悔 1991 年的选择——但他承认现在的环境比当时复杂得多25。

1991 年，“代码自由”的争议主要是国家 vs 个人——一个程序员能不能不被政府阻止地发布加密软件。这是一个清晰的二元对立，而第一修正案给了一个清晰的答案。

2026 年，“代码自由”的争议变成了多个国家 + 多个法律领域 + 多种协作角色——一个开源 maintainer 在做出每个 commit 决定时，可能需要考虑：贡献者来自哪个国家？这个代码会被谁使用？基金会注册在哪里？训练这个模型用了多少计算？这个使用语境是不是受合规规则覆盖？

每个问题都有具体的法律答案。但合起来看，开源运动当初想象的那种“代码是全球公地”的姿态，已经无法在所有问题上都得到肯定答案。

Stallman 1985 年写的那句话——“the freedom to use, study, distribute, and modify”——四项自由——仍然是开源的根基。Bernstein 案 1999 年保护的“代码是言论”原则——仍然有效。MIT License 仍然允许任何人使用任何代码做任何事。

但围绕这些“根基”的所有具体环节——平台、协作、使用、资助——都已经被国家主权穿透。这种穿透不是 Stallman 或 Bernstein 案的失败——他们仍然保护了他们当时关心的东西。这种穿透是新一代的法律工具填补了他们当时没有覆盖到的空白。

下一章，我们会回到 2014 年。Heartbleed 那时候揭示了一个比法律层面更直接的脆弱——开源的物质基础是几十个被遗忘的志愿者。

References

Wikipedia: Phil Zimmermann. 包括 MIT Press 出版 PGP 源代码作为印刷品规避 ITAR 的故事。Link →
The Register 2021-06-08: “Cryptography whizz Phil Zimmermann looks back at 30 years of Pretty Good Privacy”. Link →
Wikipedia: International Traffic in Arms Regulations. ITAR 在 1980-1990 年代把强加密软件视为“munitions”。Link →
Cypherspace PGP Timeline. 记录 PGP 1991-1996 的法律历程。Link →
EFF: Bernstein v. US Department of Justice case page. Link →
Wikipedia: Bernstein v. United States. 包括 1999 年第九巡回法庭判决的主要论述。Link →
FindLaw: BERNSTEIN v. UNITED STATES DEPARTMENT OF JUSTICE 100 (1999). 判决全文。Link →
EFF: “EFF at 25: Remembering the Case that Established Code as Speech” (2015). Link →
Bureau of Industry and Security: Export Administration Regulations overview. EAR 是商务部下属机构 BIS 执行的出口管制法律。
Bureau of Industry and Security: “What is a deemed export?”. 官方定义。Link →
USF Office of Research: Deemed Exports. 包括基础研究例外的描述。Link →
UCSB Office of Research: Foreign Nationals and Deemed Exports. 提到对 AI 等新兴技术的扩展可能性。Link →
Federal Register 2024-02-26: “Dual Use Foundation Artificial Intelligence Models With Widely Available Model Weights”. NTIA 评估的官方文本。Link →
Federal Register 2025-01-15: “Framework for Artificial Intelligence Diffusion”. Link →
Sidley: “New U.S. Export Controls on Advanced Computing Items and Artificial Intelligence Model Weights” (2025-01). Link →
MIT Technology Review 2025-01-24: “How Chinese company DeepSeek released a top AI reasoning model despite US sanctions”. Link →
CyberScoop: “Senators move to quash the use of Chinese AI system by federal contractors”. Link →
Mintz: “House Select Committee Publishes Report on DeepSeek”. 2025-04-24. Link →
Inside Government Contracts: “U.S. Federal and State Governments Moving Quickly to Restrict Use of DeepSeek”. Link →
Wiley: “Chinese AI Firm DeepSeek Triggers a Wide U.S. Policy Response”. Link →
NTIA 2024-07 报告关于开放权重模型管制的评估。Brookings 引述这一评估。Brookings link →
Wikipedia: MIT License. 包括许可证全文及“非常宽松、几乎无限制”的特点描述。Link →
Wikipedia: International Traffic in Arms Regulations vs. EAR/CCL 转换历史。1990 年代加密软件从 ITAR 转到 EAR 是 Bernstein 案后果之一。
Bruce Perens “Post-Open” license 提案。2023 年起在多个公开演讲和邮件列表中提出。
The Register 2021-06-08: Phil Zimmermann 30 周年访谈中关于“现在更复杂”的评论。Link →