第十期：第四层——同意与数据飞轮

一

先理解第四层要解决的那个问题。

一个普通印度人的数据，散落在无数个互不相通的地方：银行有他的流水，税务系统有他的报税记录，电信商有他的通话数据，保险公司有他的保单。这些数据的价值，对这个人自己来说，常常是被锁死的——比如，一个小商贩想申请一笔贷款，他明明有稳定的现金流（都在银行流水和 UPI 交易记录里），但他没有办法方便、安全、可信地把这些证据出示给放贷的机构。数据在那里，但他用不上；而机构想要这些数据，又往往只能通过粗暴的、过度索取的方式去拿。

第四层的思路，是建一个“同意层”来解决这个困局。它的核心是一套电子数据同意机制：数据的主人——也就是你——可以通过一个标准化的、有时限和目的限定的“同意凭证”，授权某个机构在特定时间内、为特定目的、调取你在另一个机构那里的特定数据1。整个过程你是闸门：你决定谁能看、看什么、看多久。

在金融领域，这套机制已经落地，叫账户聚合器（AA）。它由印度央行 RBI 监管，本身是一类特殊的非银行金融公司，但它有一个关键的设计——它只是数据流动的“管道”，自己不存储、不查看数据内容2。它做的，是在数据提供方（比如你的银行）和数据使用方（比如想给你放贷的机构）之间，传递一份你签署的同意凭证，然后促成一次受控的、点对点的数据传输。

二

这套同意机制的设计原则，被概括成一个英文缩写 ORGANS——开放（Open）、可撤销（Revocable）、细粒度（Granular）、可审计（Auditable）、有通知（Notice）、默认安全（Security by design）3。

把这几个词拆开看，能看出设计者想达到的理想状态。可撤销，意味着你授权之后随时可以收回。细粒度，意味着你可以只授权“我最近六个月的银行流水”，而不是“我的全部账户信息”。可审计，意味着每一次数据调取都留下记录，事后可查。有通知，意味着每次有人调你的数据，你都会被告知。这套原则的雄心，是把数据共享从一个“要么全给、要么不给”的粗暴选择，变成一个由数据主人精确控制的、可追溯的过程。

从落地情况看，它已经初具规模。自 2021 年 9 月在 RBI 监管框架下启动以来，到 2025 年，账户聚合器生态已经有约七千万个人同意共享他们的数据，每月新增约一千万份同意4。从 2025 年 6 月起，账户聚合器开始实时地把每一次同意和数据调取请求，与这套标准模板进行校验5。

如果这套机制真的按设计运转，它确实是一种赋权——它把原本被各个机构圈占、个人无从置喙的数据，重新置于个人的同意之下。一个小商贩第一次能够主动地、安全地用自己的数据去换一笔贷款；一个普通人第一次对“谁在用我的数据”有了实际的控制权。这是设计者最理直气壮的地方：第四层不是来拿你数据的，是来帮你管你数据的。

三

但同一套机制，从另一个角度看，是另一回事。

把“同意层”放回整套堆栈的脉络里：身份层让国家和机构知道“你是谁”，支付层让它们知道“你的钱怎么流动”，而同意层做的，是把所有这些数据——以及银行、税务、电信、保险里的数据——变成可以被合法、合规、大规模地调取和聚合的资源。关键词是“合法合规”：在第四层出现之前，机构想大规模获取个人数据，要么违法，要么靠用户稀里糊涂地点了“同意”按钮；而第四层做的，是给数据的流动建了一条合规的高速公路。

这条高速公路上跑的是什么，取决于谁在用它、为什么用它。它可以跑“普惠信贷”——帮小商贩拿贷款；也可以跑别的东西。而在 2025 年之后的语境里，那个“别的东西”有了一个越来越清晰的名字：人工智能的训练数据。

这就是为什么这一章的标题里有“数据飞轮”这个词。数据飞轮，指的是这样一个自我强化的循环：你有越多的数据，就能训练越好的模型；越好的模型吸引越多的用户；越多的用户产生越多的数据。在这个循环里，能够合法、大规模、结构化地获取数据的能力，是飞轮转动的起点。而印度的第四层，恰恰提供了这种能力——一套覆盖十四亿人、有同意背书、因而在法律和伦理上“干净”的数据获取基础设施。

这里有一个值得专门拆开的概念问题：什么是真正的“同意”？

第四层的全部正当性，都建立在“个人同意”这个支点上。但“同意”在数字世界里，是一个被反复掏空的词。任何一个点过无数次“我已阅读并同意用户协议”的人都知道，那种同意往往是形式化的、无奈的、根本没读过的。一套依赖“点击同意”的机制，如果用户面对的是密密麻麻的条款、是“不同意就不给服务”的胁迫式选择、是一天几十次的授权请求，那么这种“同意”在多大程度上还是真正的自主决定，是存疑的。

DEPA 的设计者显然意识到了这个问题，ORGANS 原则里的“细粒度”“可撤销”“有通知”，正是试图让同意变得更真实——让你能精确地知道授权了什么、随时能收回、每次被调取都被告知。这些设计在纸面上确实比“一揽子点击同意”前进了一大步。但设计和现实之间永远有距离：一个被海量授权请求疲劳轰炸的用户，会不会最终又退回到“闭眼点同意”的老路？一个急需贷款、被告知“不授权就批不了”的人，他的同意还算不算自由？这些问题，决定了第四层到底是把控制权真的还给了个人，还是只是给数据采集套上了一层更精致、更合规的外衣。同意机制设计得再好，也敌不过一个根本性的权力不对称——当一方急需服务、另一方掌握服务，“同意”很容易退化成“别无选择”。

四

把尼勒卡尼自己的那句名言放到这里，意味就变了。

2017 年，他在印度理工学院马德拉斯分校的毕业典礼上说：“数据已经成为新的石油。就像石油是 20 世纪转型的基础，数据是 21 世纪的基础。”6 但他紧接着加了一句限定，这句限定常被忽略，却是他整套思想的关键：“如果数据是新的石油，那么数据应当被民主化——让数据能被所有人使用。”6

这句限定，正是第四层的意识形态内核。它试图回答一个问题：当数据成为最有价值的资源时，谁该拥有它、谁该从中获益？硅谷的答案是：拥有平台的大科技公司。中国的答案被描述为：国家。而尼勒卡尼想给出的第三个答案是：数据应该“民主化”——既不被企业独占，也不被国家独占，而是在个人同意的前提下流动，让整个社会都能从中创造价值，包括那些想用印度数据训练印度模型的本土玩家。

这个理想很有吸引力。但它也带着一个尚未解决的问题：在一个“民主化”的数据生态里，那些技术能力最强、资本最雄厚、最擅长把数据转化为模型和利润的玩家，会不会又一次赢家通吃？把数据从机构的孤岛里解放出来，让它“流动”，究竟是让普通人受益，还是只是为那些有能力消化海量数据的人，铺好了一条更顺畅的获取通道？前面讲支付层时已经见过一次这样的反讽——开放的轨道，最后跑得最快的是资本最雄厚的玩家。第四层会不会重演同样的故事，是它最大的悬念。

五

所以，对第四层，需要同时持有两个判断，不能只取其一。

一方面，它在设计上确实是这套基建里最“亲个人”的一层。前三层更多是国家和机构的工具（发身份、收支付），而第四层第一次把个人放到了数据流动的控制位上。ORGANS 原则、可撤销的同意、细粒度的授权，这些都是真实的、值得肯定的制度设计，它们让印度的数据治理在纸面上比很多国家都更尊重个人。

另一方面，它也是这套基建从“身份和支付”跃向“数据和人工智能”的那道闸门。当这道闸门打开，前面三层积累起来的、关于十四亿人的海量数据，第一次有了一条合规的、可规模化的出口。这道出口通向哪里，取决于谁站在出口的另一端，以及那个“个人同意”在现实中到底有多大的实际控制力——一个被海量“同意按钮”训练得习惯性点击的用户，他的“同意”是真正的赋权，还是又一次形式化的橡皮图章？

第四层是这套国家级 API 的最后一块拼图，也是它面向未来的赌注所在。它已经搭好了，但它通向的那个未来——一个印度用自己的公共数据基础设施，喂养出自己的人工智能的未来——才刚刚开始。下一章，就去看这个未来正在长成什么样子。

参考文献

NITI Aayog，“Data Empowerment and Protection Architecture”：电子数据同意、时限与目的限定的同意凭证机制。niti.gov.in（访问于 2026-06）。
账户聚合器（AA）由 RBI 监管、作为不存储不查看数据内容的“管道”，连接数据提供方（FIP）与数据使用方，见 ORF 与 Sahamati。orfonline.org；sahamati.org.in（访问于 2026-06）。
同意凭证的 ORGANS 原则（Open / Revocable / Granular / Auditable / Notice / Security by design），见 Sahamati 与 DEPA 文件。sahamati.org.in（访问于 2026-06）。
AA 生态自 2021 年 9 月启动，至 2025 年约 7000 万个人同意、月新增约 1000 万份同意，见 Sahamati 与 Medium 分析。sahamati.org.in（访问于 2026-06）。
自 2025 年 6 月 1 日起 AA 实时校验同意与数据调取请求，见 Sahamati。sahamati.org.in（访问于 2026-06）。
Nilekani 在 IIT Madras（2017）关于“数据是新石油……数据应当被民主化”的演讲，见 Asian Age / Deccan Chronicle 报道。asianage.com（访问于 2026-06）。