一
1991 年夏天,菲律宾马尼拉一家小印刷厂收到一笔奇怪的订单——印刷一本厚约 900 页的书,封面写着 “PGP: Source Code and Internals”。这本书没有传统意义上的章节、没有可读性的散文,从第一页到最后一页几乎全部是 C 语言代码。订购它的是麻省理工学院出版社(MIT Press)。
这本书的存在是为了一个目的:让美国联邦调查局没法起诉一个叫 Phil Zimmermann 的程序员1。
Zimmermann 那时候四十二岁,是科罗拉多博尔德的一个软件工程师。同年六月,他发布了一个叫 Pretty Good Privacy(PGP)的程序——第一个让普通人能用公钥加密保护邮件的免费工具。他通过 FTP 在互联网上公开发布了 PGP,包括完整源代码2。
PGP 在几个小时内被全世界下载。这在 1991 年是不寻常的——那时候 World Wide Web 还没有正式出现,下载主要靠 FTP 和 BBS。但密码学社区对这种工具的需求高得惊人。一个能让任何人加密通信、不依赖政府或大公司的工具,被一群人当作“密码朋克”梦想的实现。
但同样在那一刻,PGP 把 Zimmermann 推向了一场长达三年的联邦刑事调查。
美国当时把强加密软件视为“武器”。具体说,它属于 ITAR——International Traffic in Arms Regulations,由国务院管理的武器贸易条例。把武器出口需要许可证。Zimmermann 没有申请许可证就把强加密软件“出口”到了全世界——通过 FTP 在公开互联网上发布的方式。技术上这违反了 ITAR3。
1993 年,美国海关开始对 Zimmermann 进行刑事调查。如果指控成立,他可能面临数年监禁。这件事在密码学社区引起轩然大波——它把抽象的“加密自由”问题变成了一个具体的人身刑罚。
Zimmermann 的辩护团队(包括 EFF 的律师们)想了一个聪明的办法:印书。
美国宪法第一修正案保护出版自由。一本印刷的书无论内容是什么,受联邦政府限制出版的能力都非常受限。如果你能证明 PGP 源代码本质上是“印刷品”——只是恰好用 C 语言而不是英语——那它就受第一修正案保护。1995 年,MIT Press 出版了《PGP: Source Code and Internals》这本厚书。任何人可以买这本书,然后用 OCR(光学字符识别)软件把它扫描回可执行的源代码。这是一个法律上的诡辩,但有效4。
司法部最终在 1996 年悄悄撤销了对 Zimmermann 的调查。他们没有公开声明理由,但当时的解读是:他们不想在法庭上输掉“代码不是言论”的论点。
二
撤销 Zimmermann 调查没有解决根本问题。三年后,1999 年,另一个程序员让法庭直接做出了判决。
Daniel J. Bernstein 是 UC Berkeley 的数学博士生,研究密码学。他写了一个叫 Snuffle 的加密程序,想公开发布——发到 sci.crypt 新闻组、印在学术论文里、做演讲。他向美国国务院申请确认这能不能算作“出口”。国务院的回应:可以,但你需要先注册成“武器商人”(munitions dealer),然后申请武器出口许可证5。
Bernstein 起诉国务院。这场官司从 1995 年打到 1999 年。期间出口管制的归口从国务院转给了商务部(从 ITAR 转到 EAR),但争议本质没变:政府是否可以要求程序员在公开源代码之前申请许可证。
1999 年 5 月 6 日,美国第九巡回上诉法院做出判决。法官 Betty B. Fletcher 写的多数意见里包括这样几句关键论述:
“Cryptographers use source code to express their scientific ideas in much the same way that mathematicians use equations or economists use graphs … Source code is the preferred means of communication among cryptographers because cryptography is a highly technical and mathematically based field.”
因此源代码是“言论”——是一种受美国宪法第一修正案保护的表达形式6。
法院进一步说:政府要求程序员在公开源代码之前申请许可证,等于“事前审查”(prior restraint)——这是第一修正案最严格保护的对象。法院推翻了商务部对 Bernstein 适用的出口管制规则7。
这就是著名的 Bernstein 案判决。它的意义远超一个加密软件的具体争议。它在法律上确立了“代码 = 言论”的原则。1999 年之后,美国开发者公开发布开源软件不再需要担心被起诉违反武器出口法。整个加密时代——从 OpenSSL 到 Signal、从 HTTPS 到 WhatsApp 端到端加密——能够在美国土壤上发展起来,靠的就是这个判例8。
但 Bernstein 案没有解决另一件事:它只覆盖了“美国程序员把源代码贴到公开互联网”这一种情况。它没有覆盖一个更复杂的问题——如果一个伊朗博士生在 MIT 实验室里学习美国教授写的代码,这算不算“出口”到伊朗?
这个问题有一个专门的法律术语:deemed export(视同出口)。
三
EAR——Export Administration Regulations——是商务部下属机构 BIS(Bureau of Industry and Security,工业与安全局)执行的出口管制法律。它管制的“出口”不只是物理物品的跨境运输,也包括“技术”和“软件”的传递9。
EAR 把“deemed export”定义为:在美国土壤上,把受 EAR 管制的“技术”或“源代码”释放给一个外国人。这个释放被“视同”出口到了那个外国人的母国10。
具体形式包括:
- 口头讲解(在课堂上、会议上、实验室里)
- 文档传递(包括邮件、文件共享、纸质文档)
- 屏幕展示
- 让外国人观察实验
实际效果:如果一个美国大学实验室在做某种受 EAR 管制的研究(比如某些加密算法、某些 AI 算法、某些核技术、某些生物技术),那么实验室不能让外国学生或外国访问学者接触相关的“技术”或“源代码”——除非大学申请并获得 deemed export 许可证。
这听起来很荒谬。如果一个伊朗博士生在加州伯克利学习一种 EAR 管制的加密技术,那么伯克利等于把这项技术“出口”到了伊朗。要合法做这件事,伯克利需要向商务部申请许可证——而对伊朗的许可证几乎不可能获批。
实际中存在一个重要例外:基础研究例外(Fundamental Research Exception)。如果某项研究是公开发表、非保密的“基础研究”,那么它不受 EAR 管制。大部分大学研究都属于这一类——所以大学的研究生院仍然能正常接收外国学生11。
但这个例外有限制。“基础研究”必须真的是基础研究——意思是没有公司赞助、没有政府保密协议、研究成果完全公开发表。一旦研究被某个公司的合同绑定,或者涉及政府机密,例外就消失。
到了 2014 年之后,EAR 的范围开始扩展。商务部开始把一些“新兴技术”列入管制清单——量子计算、先进半导体制造、特定的 AI 算法、合成生物学。这意味着越来越多的大学研究开始触及 EAR 边界。一个在 UC Berkeley 实验室做大模型训练的中国博士生,理论上可能涉及 EAR 管制的“技术”——如果他在某个 GPU 集群上训练某种特定模型,并且这种模型属于 BIS 后续定义的某个管制类别12。
实际操作中,这种灰色地带让大学的合规办公室、外国学生、研究 PI 都活在持续紧张中。已经出现过几起 deemed export 调查——多数针对中国籍研究者。最著名的是 2018 年起的几起对华人科学家的调查,多数最终因证据不足撤销或被法庭否决,但调查本身对当事人造成了长期影响。
四
Bernstein 案和 deemed export 学说之间有一个明显的不对称。
Bernstein 案处理的是“美国人把代码贴到公开互联网”。结论:这是受保护的言论,政府不能限制。
Deemed export 处理的是“美国人在美国土壤上向外国人传授技术”。结论:这可以被监管,需要许可证。
理论上这两个情况应该一致——如果代码是言论,那么向外国人传授代码也应该是受保护的言论。但 EAR 的实际执行没有这样的逻辑一致性。
为什么?因为这两种情况影响的是不同的国家利益。把代码贴到公开互联网,政府失去了对它流向哪里的精确控制——但这种“失控”是双向的,美国软件也因此能流向全世界。在美国土壤上向外国人传授技术,政府仍然有精确控制能力——它可以决定哪些外国人能进入美国、能进入哪些机构、能接触哪些项目。
这就是开源在第三阶段面对的法律基础矛盾。Bernstein 案保护了“源代码自由公开”;deemed export 学说限制了“源代码自由协作”。1999 年那时候这两个原则看起来是平衡的——你能发布代码但不一定能跟伊朗人一起开发它。在 2014 年之前,这种平衡基本能维持,因为大部分开源开发不需要刻意区分“贡献者来自哪个国家”。
2014 年之后开始变化。GitHub 2019 年的封锁、Linux 2024 年的删除——这些不是“代码不能贴到公网”,而是“代码协作不能跨过制裁边界”。Bernstein 案保护不了这些情况,因为它处理的是出版自由,不是协作自由。
五
到了 2023-2024 年,一个 Bernstein 案完全没有想到的新问题出现了:AI 模型权重算不算言论?
这个问题不像它表面那样简单。
一个深度学习模型——比如 Llama 70B、DeepSeek R1、Qwen 72B——是由几十亿到几千亿个浮点数(权重)组成的。这些数字不是程序员一个一个写出来的,是训练过程从大量数据中“学”出来的。一个完整的开放权重模型包括三部分:
- 模型架构代码(用 PyTorch、TensorFlow 等写的网络结构定义)
- 训练流程代码(如何用数据训练模型)
- 模型权重(训练后得到的数字)
前两部分是传统意义上的“源代码”——人写的、可读的、可修改的。第三部分不一样。模型权重是黑箱——你不能“读懂”它,不能通过看权重判断模型在做什么。它的功能性是 emergent,从训练过程中涌现出来的13。
那么 Bernstein 案的“源代码是言论”原则适用于模型权重吗?
法律学者已经开始辩论这个问题。一种观点是:模型权重当然是言论——它是表达智能的一种形式,是人类知识的编码。另一种观点是:模型权重不像源代码,它不是“为了让人理解”的——它的存在目的是让机器执行特定任务。它更像是一个工具,不是一个表达。
到 2026 年初为止,没有任何美国法院对这个问题做出判决。但美国政府已经开始按照“模型权重可以被管制”的逻辑行动。
2024 年 2 月,BIS 提出一个新的出口管制类别:4E091——“AI 模型权重”。具体规则到 2025 年 1 月发布,叫《Framework for Artificial Intelligence Diffusion》14。
这个 framework 的核心逻辑:
- 对闭权重(closed-weight,只通过 API 提供的)模型:如果训练计算量超过 10^26 operations,需要 license 才能“出口”
- 对开权重(open-weight,公开发布的)模型:不受此管制——理由是“已发布的开放权重模型不能召回”15
这是一个有趣的承认。BIS 实际上承认了:一旦一个开放权重模型被发布,它就像 Bernstein 案里的源代码一样——已经在互联网上散布,政府没法“收回”它。所以管制只对未来未发布的、超大模型有意义。
但这个让步没有解决另一个问题。联邦承包商(federal contractors)——任何为美国政府工作的公司——能不能使用已经发布的开放权重模型?
2025 年 1 月底,中国的 DeepSeek 公司发布 R1 模型。它在数学和推理 benchmark 上达到或超过 OpenAI 的 o1,但用的是较旧的 Nvidia H800 GPU(已经被出口管制限制了),并且完全开源(MIT License)16。
DeepSeek R1 在中文与英文社区都引起轰动。它似乎证明了:美国的芯片出口管制无法阻止中国 AI 进展。但它也很快引发美国政策反应。
2025 年 2 月,参议员 Bill Cassidy(路易斯安那共和党)和 Jacky Rosen(内华达民主党)联合提出 legislation:禁止联邦承包商在与联邦合同相关的任何活动中使用 DeepSeek 或它的后续模型17。
2025 年 4 月,众议院“对中国共产党战略竞争特别委员会”发布关于 DeepSeek 的报告,建议更新 FAR(Federal Acquisition Regulations)以禁止联邦政府采购基于中国模型的 AI 系统18。
2025 年 12 月,美国政府更新 AI 采购规则:联邦承包商被禁止使用中国 AI 模型。如果你是美国国防、医疗、公共基础设施领域的承包商,Qwen 和 DeepSeek 完全不可用19。
这意味着什么?意味着 BIS 在出口管制层面承认“开放权重模型已经在公地里”,但联邦采购层面通过另一条路径——你可以下载这些模型,但你不能用它们为美国政府工作——实质上把这些模型重新“领土化”了。
这是 Bernstein 案没有想到的情况。Bernstein 案保护了出版自由,但没有保护“使用自由”。一个 1999 年的法庭可能没有预见:未来一个开发者不只要担心代码能不能跨境流动,也要担心代码能不能被用于跨主权场景。
六
让我们把 1991 年 Phil Zimmermann 在墨西哥城印 PGP 源代码这件事,跟 2025 年 12 月联邦承包商被禁用 DeepSeek 这件事放在一起。
1991 年的情境:政府通过 ITAR 管制源代码出口。Zimmermann 用一本印刷书绕过这个管制,因为书受第一修正案保护。
2025 年的情境:政府通过 FAR 限制承包商使用已经全球公开的开放模型。这个限制不针对模型本身(你仍然能下载 DeepSeek R1),针对的是“在某些合同场景下使用”。Bernstein 案的言论自由保护不适用——因为政府没有禁止你下载,只是禁止你为它工作时使用20。
这是一个值得停下来的细节。三十四年间,管制的形式变了。1991 年管制源代码的“边界穿越”;2025 年管制的是“使用语境”。两种管制都不直接限制内容本身——但效果都是让特定主体在特定场景下不能使用特定代码。
这种“间接管制”在法律上比 Bernstein 案的“前置审查”更难挑战。前置审查直接禁止你出版——这是宪法明确保护的领域。间接管制只是说“你可以出版/使用,但不能在某个特定语境下”——这给政府留下了大量灰色地带。
而 Bernstein 案的“代码是言论”原则只覆盖前者,不覆盖后者。
七
更深一层的问题是:模型权重和源代码到底是不是同一种东西?
如果它们是同一种东西,那么 Bernstein 案的判决应该自然延伸——任何开放发布的模型权重都受第一修正案保护。
如果它们不是同一种东西,那么对模型权重的管制可以采用不同标准。
支持“是同一种东西”的论点:
- 模型权重是人类知识的编码——它编码了大量训练数据中的模式
- 模型权重可以被读、被分析(虽然很难)、被反向工程
- 模型权重可以传达信息——通过 prompt 输入,它可以生成各种输出
- 模型权重的存在和分发本质上是一种“表达”——开发者通过它表达“这是我们对智能的理解”
支持“不是同一种东西”的论点:
- 模型权重不是被人写出来的——它是机器学习的产物
- 模型权重不能被“读懂”——你看到一堆数字,无法判断它在做什么
- 模型权重的功能性来自数十亿参数的协同,没有“逐行理解”这种可能
- 模型权重更像是一个工具,不是一个表达——它的存在目的是被使用,不是被理解
这场辩论现在还在进行中。美国政府的实际行动倾向于把模型权重当作“工具”——可以被出口管制覆盖。但 NTIA 在 2024 年 7 月的报告里说,已经发布的开放权重模型应该用“监控”而不是“限制”来应对21。这是一种折中——承认 Bernstein 式的“已经发布无法收回”,但保留对未来发布的管制空间。
整个事情有一个让人想停下来的细节:DeepSeek R1 是用 MIT License 发布的。MIT License 是开源世界最宽松的许可证之一,不附带任何“道德”或“政治”条款。它的全部条款是:“这个软件按 as-is 提供,没有任何保证,作者不承担任何责任,你可以做任何事情。”22
按照 MIT License 的字面文义,美国政府承包商当然可以使用 DeepSeek R1——许可证里没有任何限制。但美国政府通过 FAR 创造了一个新的限制:不是 license 层面的限制,是合同层面的限制。开源许可证说“可以用”,联邦采购规则说“不可以用”——两个法律框架同时适用,结果是“在某些场景下不可以”。
这种叠加规制让“开源”在 2025 年之后变成一个复杂的概念。Bernstein 案的“代码是言论”仍然有效;MIT License 的“任何人可以使用”仍然有效;但叠加在上面的合规层让实际的可用性大幅缩水。
八
把所有这些放在一起看,会发现一个 Bernstein 案从根本上没有解决的问题。
代码是言论——这个判决保护的是创造和发布自由。任何人可以写代码,任何人可以发布代码。政府不能因为代码内容而限制创造和发布。
但开源代码的整个生命周期,远超过“创造和发布”。它包括:
- 分发(distribution):通过 GitHub、Gitee 等平台
- 协作(collaboration):通过 maintainer 之间的 pull request、issue 讨论
- 使用(use):把代码集成到产品、服务、研究中
- 资助(funding):通过 GitHub Sponsors、Tidelift、Sovereign Tech Fund
Bernstein 案只保护“发布”。其他四个环节都可以被各种规制覆盖:
- 分发受平台所在地法律管辖(GitHub 是美国公司,所以受 OFAC)
- 协作受 deemed export 学说约束(美国土壤上跟外国人协作可能需要许可证)
- 使用受承包商/合规规则约束(FAR、CRA、网信办备案等)
- 资助受反洗钱和制裁规则约束(不能向被制裁实体打钱)
每一个环节都不直接违反 Bernstein 案。每一个环节都不直接禁止代码本身。但叠加起来,它们能把一个完整开源项目的实际可用性切碎。
这是开源在 2024 年后面对的法律现实。Stallman 1985 年想象的那种“代码自由”——四项自由——在 Bernstein 案中得到了部分宪法保护。但他没有想象到一个状况:当代码的整个生命周期被分散到不同的法律领域,每个领域都有自己的规则,“四项自由”中的每一项都可能在某个环节被限制——而没有任何一个限制单独看起来违反宪法。
这就是 Bernstein 案的真正局限。它是一份关于“创造和发布”的判决书。开源运动的下一个十年里,最关键的问题不是“代码能不能被发布”——这个问题已经被答了。最关键的问题是“代码能不能被自由使用”——这个问题没有被任何法院明确回答23。
九
读到这里有人可能会问:那么开源运动应该怎么应对?
简单的回答:没有简单的答案。
事实层面,开源运动可以做几件事:
第一,结构上的“主权避险”。RISC-V International 2019 年从 Delaware 迁到瑞士就是这种逻辑。如果一个开源治理实体不愿意承担美国法律义务,它可以选择搬到一个法律框架更友好的国家。但这个选择会限制它在美国市场的影响力——美国大公司倾向于使用美国注册实体管理的项目。
第二,许可证层面的创新。Bruce Perens 在 2023 年提出 “Post-Open” 许可证的想法——它在 GPL/MIT 之外创造一种新类型,专门处理国家级使用场景。这个想法到 2026 年还没有成为成熟提案24。
第三,联邦化协作的备援。Codeberg、Gitea、Forgejo 这类去中心化的代码托管在 2022 年之后获得显著用户增长——部分是回应 GitHub 制裁的不确定性。但代码托管只是协作的一个环节——issue、CI、review 流程更难分散化。
第四,接受新的法律现实,在其中找位置。这是大多数大型开源项目实际在做的事。Linux Foundation 接受了 OFAC 合规要求——2024 年的 11 人删除是这个接受的结果。Apache Foundation 也在做同样的事。这不是投降——这是在新现实中保护项目长期生存的策略。
但每个选择都有代价。“主权避险”放弃了美国市场的便利;“许可证创新”会引起社区分裂;“备援”难以达到主流协作密度;“接受新现实”意味着开源运动失去了某种纯粹性。
到 2026 年初,没有任何一个选择已经被开源世界整体接受。各方都在自己的位置上试探。这是一个开放的局面——它的解决可能要再过五年或十年。
十
Bernstein 案现在已经过去 27 年。Phil Zimmermann 在 2021 年的一次 The Register 采访里说,他不后悔 1991 年的选择——但他承认现在的环境比当时复杂得多25。
1991 年,“代码自由”的争议主要是国家 vs 个人——一个程序员能不能不被政府阻止地发布加密软件。这是一个清晰的二元对立,而第一修正案给了一个清晰的答案。
2026 年,“代码自由”的争议变成了多个国家 + 多个法律领域 + 多种协作角色——一个开源 maintainer 在做出每个 commit 决定时,可能需要考虑:贡献者来自哪个国家?这个代码会被谁使用?基金会注册在哪里?训练这个模型用了多少计算?这个使用语境是不是受合规规则覆盖?
每个问题都有具体的法律答案。但合起来看,开源运动当初想象的那种“代码是全球公地”的姿态,已经无法在所有问题上都得到肯定答案。
Stallman 1985 年写的那句话——“the freedom to use, study, distribute, and modify”——四项自由——仍然是开源的根基。Bernstein 案 1999 年保护的“代码是言论”原则——仍然有效。MIT License 仍然允许任何人使用任何代码做任何事。
但围绕这些“根基”的所有具体环节——平台、协作、使用、资助——都已经被国家主权穿透。这种穿透不是 Stallman 或 Bernstein 案的失败——他们仍然保护了他们当时关心的东西。这种穿透是新一代的法律工具填补了他们当时没有覆盖到的空白。
下一章,我们会回到 2014 年。Heartbleed 那时候揭示了一个比法律层面更直接的脆弱——开源的物质基础是几十个被遗忘的志愿者。
References
-
Wikipedia: Phil Zimmermann. 包括 MIT Press 出版 PGP 源代码作为印刷品规避 ITAR 的故事。Link →
-
The Register 2021-06-08: “Cryptography whizz Phil Zimmermann looks back at 30 years of Pretty Good Privacy”. Link →
-
Wikipedia: International Traffic in Arms Regulations. ITAR 在 1980-1990 年代把强加密软件视为“munitions”。Link →
-
Cypherspace PGP Timeline. 记录 PGP 1991-1996 的法律历程。Link →
-
EFF: Bernstein v. US Department of Justice case page. Link →
-
Wikipedia: Bernstein v. United States. 包括 1999 年第九巡回法庭判决的主要论述。Link →
-
FindLaw: BERNSTEIN v. UNITED STATES DEPARTMENT OF JUSTICE 100 (1999). 判决全文。Link →
-
EFF: “EFF at 25: Remembering the Case that Established Code as Speech” (2015). Link →
-
Bureau of Industry and Security: Export Administration Regulations overview. EAR 是商务部下属机构 BIS 执行的出口管制法律。
-
Bureau of Industry and Security: “What is a deemed export?”. 官方定义。Link →
-
USF Office of Research: Deemed Exports. 包括基础研究例外的描述。Link →
-
UCSB Office of Research: Foreign Nationals and Deemed Exports. 提到对 AI 等新兴技术的扩展可能性。Link →
-
Federal Register 2024-02-26: “Dual Use Foundation Artificial Intelligence Models With Widely Available Model Weights”. NTIA 评估的官方文本。Link →
-
Federal Register 2025-01-15: “Framework for Artificial Intelligence Diffusion”. Link →
-
Sidley: “New U.S. Export Controls on Advanced Computing Items and Artificial Intelligence Model Weights” (2025-01). Link →
-
MIT Technology Review 2025-01-24: “How Chinese company DeepSeek released a top AI reasoning model despite US sanctions”. Link →
-
CyberScoop: “Senators move to quash the use of Chinese AI system by federal contractors”. Link →
-
Mintz: “House Select Committee Publishes Report on DeepSeek”. 2025-04-24. Link →
-
Inside Government Contracts: “U.S. Federal and State Governments Moving Quickly to Restrict Use of DeepSeek”. Link →
-
Wiley: “Chinese AI Firm DeepSeek Triggers a Wide U.S. Policy Response”. Link →
-
NTIA 2024-07 报告关于开放权重模型管制的评估。Brookings 引述这一评估。Brookings link →
-
Wikipedia: MIT License. 包括许可证全文及“非常宽松、几乎无限制”的特点描述。Link →
-
Wikipedia: International Traffic in Arms Regulations vs. EAR/CCL 转换历史。1990 年代加密软件从 ITAR 转到 EAR 是 Bernstein 案后果之一。
-
The Register 2021-06-08: Phil Zimmermann 30 周年访谈中关于“现在更复杂”的评论。Link →