先理解第四层要解决的那个问题。

一个普通印度人的数据,散落在无数个互不相通的地方:银行有他的流水,税务系统有他的报税记录,电信商有他的通话数据,保险公司有他的保单。这些数据的价值,对这个人自己来说,常常是被锁死的——比如,一个小商贩想申请一笔贷款,他明明有稳定的现金流(都在银行流水和 UPI 交易记录里),但他没有办法方便、安全、可信地把这些证据出示给放贷的机构。数据在那里,但他用不上;而机构想要这些数据,又往往只能通过粗暴的、过度索取的方式去拿。

第四层的思路,是建一个“同意层”来解决这个困局。它的核心是一套电子数据同意机制:数据的主人——也就是你——可以通过一个标准化的、有时限和目的限定的“同意凭证”,授权某个机构在特定时间内、为特定目的、调取你在另一个机构那里的特定数据1。整个过程你是闸门:你决定谁能看、看什么、看多久。

在金融领域,这套机制已经落地,叫账户聚合器(AA)。它由印度央行 RBI 监管,本身是一类特殊的非银行金融公司,但它有一个关键的设计——它只是数据流动的“管道”,自己不存储、不查看数据内容2。它做的,是在数据提供方(比如你的银行)和数据使用方(比如想给你放贷的机构)之间,传递一份你签署的同意凭证,然后促成一次受控的、点对点的数据传输。

这套同意机制的设计原则,被概括成一个英文缩写 ORGANS——开放(Open)、可撤销(Revocable)、细粒度(Granular)、可审计(Auditable)、有通知(Notice)、默认安全(Security by design)3

把这几个词拆开看,能看出设计者想达到的理想状态。可撤销,意味着你授权之后随时可以收回。细粒度,意味着你可以只授权“我最近六个月的银行流水”,而不是“我的全部账户信息”。可审计,意味着每一次数据调取都留下记录,事后可查。有通知,意味着每次有人调你的数据,你都会被告知。这套原则的雄心,是把数据共享从一个“要么全给、要么不给”的粗暴选择,变成一个由数据主人精确控制的、可追溯的过程。

从落地情况看,它已经初具规模。自 2021 年 9 月在 RBI 监管框架下启动以来,到 2025 年,账户聚合器生态已经有约七千万个人同意共享他们的数据,每月新增约一千万份同意4。从 2025 年 6 月起,账户聚合器开始实时地把每一次同意和数据调取请求,与这套标准模板进行校验5

如果这套机制真的按设计运转,它确实是一种赋权——它把原本被各个机构圈占、个人无从置喙的数据,重新置于个人的同意之下。一个小商贩第一次能够主动地、安全地用自己的数据去换一笔贷款;一个普通人第一次对“谁在用我的数据”有了实际的控制权。这是设计者最理直气壮的地方:第四层不是来拿你数据的,是来帮你管你数据的。

但同一套机制,从另一个角度看,是另一回事。

把“同意层”放回整套堆栈的脉络里:身份层让国家和机构知道“你是谁”,支付层让它们知道“你的钱怎么流动”,而同意层做的,是把所有这些数据——以及银行、税务、电信、保险里的数据——变成可以被合法、合规、大规模地调取和聚合的资源。关键词是“合法合规”:在第四层出现之前,机构想大规模获取个人数据,要么违法,要么靠用户稀里糊涂地点了“同意”按钮;而第四层做的,是给数据的流动建了一条合规的高速公路

这条高速公路上跑的是什么,取决于谁在用它、为什么用它。它可以跑“普惠信贷”——帮小商贩拿贷款;也可以跑别的东西。而在 2025 年之后的语境里,那个“别的东西”有了一个越来越清晰的名字:人工智能的训练数据。

这就是为什么这一章的标题里有“数据飞轮”这个词。数据飞轮,指的是这样一个自我强化的循环:你有越多的数据,就能训练越好的模型;越好的模型吸引越多的用户;越多的用户产生越多的数据。在这个循环里,能够合法、大规模、结构化地获取数据的能力,是飞轮转动的起点。而印度的第四层,恰恰提供了这种能力——一套覆盖十四亿人、有同意背书、因而在法律和伦理上“干净”的数据获取基础设施。

这里有一个值得专门拆开的概念问题:什么是真正的“同意”?

第四层的全部正当性,都建立在“个人同意”这个支点上。但“同意”在数字世界里,是一个被反复掏空的词。任何一个点过无数次“我已阅读并同意用户协议”的人都知道,那种同意往往是形式化的、无奈的、根本没读过的。一套依赖“点击同意”的机制,如果用户面对的是密密麻麻的条款、是“不同意就不给服务”的胁迫式选择、是一天几十次的授权请求,那么这种“同意”在多大程度上还是真正的自主决定,是存疑的。

DEPA 的设计者显然意识到了这个问题,ORGANS 原则里的“细粒度”“可撤销”“有通知”,正是试图让同意变得更真实——让你能精确地知道授权了什么、随时能收回、每次被调取都被告知。这些设计在纸面上确实比“一揽子点击同意”前进了一大步。但设计和现实之间永远有距离:一个被海量授权请求疲劳轰炸的用户,会不会最终又退回到“闭眼点同意”的老路?一个急需贷款、被告知“不授权就批不了”的人,他的同意还算不算自由?这些问题,决定了第四层到底是把控制权真的还给了个人,还是只是给数据采集套上了一层更精致、更合规的外衣。同意机制设计得再好,也敌不过一个根本性的权力不对称——当一方急需服务、另一方掌握服务,“同意”很容易退化成“别无选择”。

把尼勒卡尼自己的那句名言放到这里,意味就变了。

2017 年,他在印度理工学院马德拉斯分校的毕业典礼上说:“数据已经成为新的石油。就像石油是 20 世纪转型的基础,数据是 21 世纪的基础。”6 但他紧接着加了一句限定,这句限定常被忽略,却是他整套思想的关键:“如果数据是新的石油,那么数据应当被民主化——让数据能被所有人使用。”6

这句限定,正是第四层的意识形态内核。它试图回答一个问题:当数据成为最有价值的资源时,谁该拥有它、谁该从中获益?硅谷的答案是:拥有平台的大科技公司。中国的答案被描述为:国家。而尼勒卡尼想给出的第三个答案是:数据应该“民主化”——既不被企业独占,也不被国家独占,而是在个人同意的前提下流动,让整个社会都能从中创造价值,包括那些想用印度数据训练印度模型的本土玩家。

这个理想很有吸引力。但它也带着一个尚未解决的问题:在一个“民主化”的数据生态里,那些技术能力最强、资本最雄厚、最擅长把数据转化为模型和利润的玩家,会不会又一次赢家通吃?把数据从机构的孤岛里解放出来,让它“流动”,究竟是让普通人受益,还是只是为那些有能力消化海量数据的人,铺好了一条更顺畅的获取通道?前面讲支付层时已经见过一次这样的反讽——开放的轨道,最后跑得最快的是资本最雄厚的玩家。第四层会不会重演同样的故事,是它最大的悬念。

所以,对第四层,需要同时持有两个判断,不能只取其一。

一方面,它在设计上确实是这套基建里最“亲个人”的一层。前三层更多是国家和机构的工具(发身份、收支付),而第四层第一次把个人放到了数据流动的控制位上。ORGANS 原则、可撤销的同意、细粒度的授权,这些都是真实的、值得肯定的制度设计,它们让印度的数据治理在纸面上比很多国家都更尊重个人。

另一方面,它也是这套基建从“身份和支付”跃向“数据和人工智能”的那道闸门。当这道闸门打开,前面三层积累起来的、关于十四亿人的海量数据,第一次有了一条合规的、可规模化的出口。这道出口通向哪里,取决于谁站在出口的另一端,以及那个“个人同意”在现实中到底有多大的实际控制力——一个被海量“同意按钮”训练得习惯性点击的用户,他的“同意”是真正的赋权,还是又一次形式化的橡皮图章?

第四层是这套国家级 API 的最后一块拼图,也是它面向未来的赌注所在。它已经搭好了,但它通向的那个未来——一个印度用自己的公共数据基础设施,喂养出自己的人工智能的未来——才刚刚开始。下一章,就去看这个未来正在长成什么样子。


参考文献

  1. NITI Aayog,“Data Empowerment and Protection Architecture”:电子数据同意、时限与目的限定的同意凭证机制。niti.gov.in(访问于 2026-06)。

  2. 账户聚合器(AA)由 RBI 监管、作为不存储不查看数据内容的“管道”,连接数据提供方(FIP)与数据使用方,见 ORF 与 Sahamati。orfonline.orgsahamati.org.in(访问于 2026-06)。

  3. 同意凭证的 ORGANS 原则(Open / Revocable / Granular / Auditable / Notice / Security by design),见 Sahamati 与 DEPA 文件。sahamati.org.in(访问于 2026-06)。

  4. AA 生态自 2021 年 9 月启动,至 2025 年约 7000 万个人同意、月新增约 1000 万份同意,见 Sahamati 与 Medium 分析。sahamati.org.in(访问于 2026-06)。

  5. 自 2025 年 6 月 1 日起 AA 实时校验同意与数据调取请求,见 Sahamati。sahamati.org.in(访问于 2026-06)。

  6. Nilekani 在 IIT Madras(2017)关于“数据是新石油……数据应当被民主化”的演讲,见 Asian Age / Deccan Chronicle 报道。asianage.com(访问于 2026-06)。