标签 数据溯源 下的文章

  AI法律工具正以迅猛的态势迅速渗透进入律所以及法务部门, 不过数据安全方面暗藏存在的“暗礁”却让不少人头疼得不行。我每天都在处理合规案件, 在这个过程当中发现, 许多同行针对于数据泄露风险的认识仍然停留在比较浅显的层面的表面。

  关于那借助AI所构建的系统, 内部所存有的客户相关信息, 还有案件的具体细节, 要是一旦碰到被滥用这种状况, 那由此产生的后果, 跟传统的泄密情形相比较而言, 是显得更加隐蔽的, 而要是去追查的话, 也会变得更加困难。

  目前, 主流的法律人工智能平台都在努力加强加密技术, 端到端的数据传输保护就是其中一个典型的做法。不过, 我发现很多律所还在用通用云存储来处理敏感卷宗, 这其实隐藏着风险。真正的发展走向是采用“本地化部署 + 权限分级”的方式,也就是把核心数据安全地锁在私有服务器上, 而人工智能只对脱敏后的标签信息进行解析。

  还有一个关键要点, 即为训练数据的合规情况。存在一些AI模型, 运用公开判决书来学习是没有问题的呢;然而, 一旦是偷偷地去爬取律所内部文档用于训练, 那就触碰了红线。我所接触的头部机构, 已然开始要求供应商提供“数据溯源声明”, 以此来保证每个案例的来源都是合法的。

  在监管方面, 国内正在筹划法律 AI 专用的数据安全指南, 去年某个省份进行试点, 要求所有法律 AI 系统都务必通过“数据残留检测”这种活动, 以此来防止被删除的客户记录被恢复, 这样的硬性规定将会逐渐大范围推行开展, 从业者需要提前对工作流作出调整。

  请留意最后这一提醒: 不要盲目地迷信AI具备的“自动合规”功能。我曾见识过某一系统宣称自己有能力自动屏蔽敏感词汇, 然而最终的结果却是连“保护当事人权益”这样的内容都被过滤掉了。应当促使人工复核以及机器筛查相互补充, 这才是未来最为稳妥安全的路线抉择。