본문 바로가기

논문 분석

DOMIAS: Membership Inference Attacks against Synthetic Data through Overfitting Detection

728x90
  • 논문 이론
    • MIA(Membership Inference Attack)는AI 모델이 어떤 데이터셋으로 학습되었는지 유추하는 공격법. 그 중에서도 DOMIAS는 데이터셋에서 적은 비중을 차지하는 부분의 데이터, 즉 원본 데이터셋에서 과적합된 데이터셋을 찾아내는데 효과적인 성능을 보임. 논문의 제목이 DOMIAS: Membership Inference Attacks against Synthetic Data through Overfitting Detection인 이유임.

  • Attack AUC: 특정 데이터가 학습 데이터셋에 속하는지 추론하는데 얼마나 효과적인가를 나타냄. 값이 높다면 공격에 대해 민감하다는 의미.
  • DOMIAS는 과적합된 모델에 대해 좋은 성능을 나타내기 때문에 모델 Epoch이 높을수록 다른 모델 보다 높은 공격 성능을 나타내는 것을 확인할 수 있음.

  • 위 수식은 생성 분포 예측을 실제 데이터 기반으로 하고 있기 때문에, 데이터셋에 적은 분량을 차지하고 있는 데이터셋을 추정하기 어려움

  • 그래서 본 논문은 Reference Data와 노이즈의 분포까지 실제 데이터에 추가하여 표현이 아닌 실질적인 분포를 추정하도록 조정함.

                                         <Eq 1.>                                                                               <Eq 2.>

  • 의 경우 A가 과적합된 부분으로 본래 가지고 있는 데이터임에도 실제 생성 표현만 주목하기 때문에 찾아낼 수 없음.
  • 그러나 의 경우는 과적합된 A를 찾아내어 기존 데이터로 분류가능