2 min read496 words

数据安全合规与 AI 风险管理

企业部署 AI 时最常被忽视的问题不是"模型好不好用"，而是"万一出问题谁负责"。数据泄漏、幻觉输出、歧视性决策——这些风险不能等出了事再处理。PM 需要在产品设计阶段就把风险识别、缓解、监控纳入进来。

AI 风险全景图

graph TB subgraph 数据风险 D1["个人数据泄露\n（PDPA / GDPR）"] D2["训练数据污染\n（Backdoor Attack）"] D3["数据出境合规\n（跨境传输限制）"] end subgraph 模型风险 M1["幻觉 / 事实错误\n（Hallucination）"] M2["偏见与歧视\n（Bias）"] M3["可解释性缺失\n（Black Box）"] M4["提示注入攻击\n（Prompt Injection）"] end subgraph 合规与治理风险 C1["监管合规缺失\n（行业特定法规）"] C2["供应商依赖\n（Vendor Lock-in）"] C3["AI 决策责任归属\n（Accountability Gap）"] end CONTROL["风险治理层\n(Risk Governance)"] --> 数据风险 CONTROL --> 模型风险 CONTROL --> 合规与治理风险 style CONTROL fill:#E3F2FD,stroke:#1565C0 style M1 fill:#FFCDD2,stroke:#C62828 style D1 fill:#FFCDD2,stroke:#C62828

AI 风险评估框架

from dataclasses import dataclass
from enum import Enum
from typing import List
class RiskLevel(Enum):
LOW = "低"
MEDIUM = "中"
HIGH = "高"
CRITICAL = "极高"
@dataclass
class AIRiskItem:
use_case: str
data_sensitivity: RiskLevel      # 输入数据敏感程度
decision_impact: RiskLevel       # 决策对人的影响程度
explainability_required: bool    # 是否需要结果可解释
regulated_industry: bool         # 金融/医疗/法律等受监管行业
mitigations: List[str]
@property
def overall_risk(self) -> RiskLevel:
score = 0
score += {RiskLevel.LOW: 1, RiskLevel.MEDIUM: 2, RiskLevel.HIGH: 3, RiskLevel.CRITICAL: 4}[self.data_sensitivity]
score += {RiskLevel.LOW: 1, RiskLevel.MEDIUM: 2, RiskLevel.HIGH: 3, RiskLevel.CRITICAL: 4}[self.decision_impact]
if self.explainability_required: score += 2
if self.regulated_industry:      score += 2
if score <= 3:  return RiskLevel.LOW
if score <= 6:  return RiskLevel.MEDIUM
if score <= 9:  return RiskLevel.HIGH
return RiskLevel.CRITICAL
RISK_REGISTRY = [
AIRiskItem(
use_case="客服问答机器人（FAQ）",
data_sensitivity=RiskLevel.LOW,
decision_impact=RiskLevel.LOW,
explainability_required=False,
regulated_industry=False,
mitigations=["内容安全过滤", "敏感词库", "人工升级转接"]
),
AIRiskItem(
use_case="AI 辅助简历筛选",
data_sensitivity=RiskLevel.HIGH,
decision_impact=RiskLevel.HIGH,
explainability_required=True,
regulated_industry=False,
mitigations=["人工最终决策", "偏见审计", "候选人知情同意", "决策日志"]
),
AIRiskItem(
use_case="银行贷款信用评分",
data_sensitivity=RiskLevel.CRITICAL,
decision_impact=RiskLevel.CRITICAL,
explainability_required=True,
regulated_industry=True,
mitigations=["中央银行合规审查", "模型可解释性报告", "人工复审通道", "数据留存合规"]
),
AIRiskItem(
use_case="AI 生成营销文案",
data_sensitivity=RiskLevel.LOW,
decision_impact=RiskLevel.LOW,
explainability_required=False,
regulated_industry=False,
mitigations=["内容审核人工审读", "品牌安全关键词过滤"]
),
]
for item in RISK_REGISTRY:
print(f"[{item.overall_risk.value}] {item.use_case}")
print(f"  缓解措施: {', '.join(item.mitigations[:2])}…")

马来西亚 PDPA 合规要点

原则	内容	AI 产品对应措施
知情同意（Consent）	用户须明确同意数据被处理	注册/使用时显式同意条款 + AI 功能说明
目的限制（Purpose）	数据只能用于收集时声明的目的	不得将用户数据用于模型训练（需单独同意）
数据最小化	只收集必要数据	Prompt 中不发送不必要的 PII
访问权（Access）	用户有权查看/更正其数据	提供数据导出和删除 API
安全保障	采取合理措施防止数据泄露	静态加密 + 传输加密 + 访问日志
数据保留	不超过必要期限保留数据	设定自动删除策略（如 90 天清除对话历史）

本章小结

📌 AI 风险不等于技术风险，"幻觉 + 决策影响大 + 受监管"三项叠加是极高风险信号
📌 PDPA / GDPR 的核心要求是：知情同意 + 目的限制——AI 产品最容易踩的坑是用用户数据偷偷训练模型
📌 构建 AI 风险注册表（Risk Registry）是 AI 治理的基础设施，不是一次性文档
📌 高风险 AI 决策（贷款、招聘）必须保留人工复审通道，这是监管 + 公信力的双重要求

下一节：AI 产品的组织变革管理