개인정보위, AI 개발 시 공개 데이터 처리 기준 제시

고학수 개인정보위원장이 10일 오후 정부서울청사에서 제12회 위원회 전체회의 개의선언을 하고 있다. [연합]

[헤럴드경제=권제인 기자] 개인정보보호위원회가 인공지능(AI) 개발에 활용되는 공개 데이터가 개인정보 규율체계 내에서 처리될 수 있도록 ‘AI 개발·서비스를 위한 공개된 개인정보 처리 안내서’를 17일 공개했다.

공개 데이터는 인터넷상 누구나 합법적으로 접근할 수 있는 데이터로, 챗지피티(ChatGPT) 등 생성형 AI 개발을 위한 학습 데이터의 핵심 원료로 쓰인다. AI 기업들은 커먼크롤(common crawl), 위키백과(wikipedia), 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 등의 방식으로 수집해 학습데이터로 활용하고 있다.

공개 데이터에는 주소, 고유식별번호, 신용카드번호 등 여러 개인 정보가 포함될 수 있지만, 현행 개인정보 보호법에는 이러한 공개된 개인정보처리에 적용될 수 있는 명확한 기준이 없다.

개인정보위는 이에 따라 공개된 개인정보 수집‧활용의 법적기준을 명확화하고 AI 개발 및 서비스 단계에서 어떤 안전조치를 취하는 것이 적정한지 기업이 참고할 수 있는 최소한의 기준을 제시하는 안내서를 마련하게 되었다고 밝혔다.

먼저, 개인정보 보호법 제15조에 따른 ‘정당한 이익’ 조항에 의해 공개된 개인정보를 AI 학습·서비스 개발에 활용할 수 있다. 정당한 이익 조항이 적용되기 위해서는, AI 개발 목적의 정당성, 공개된 개인정보 처리의 필요성, 구체적 이익형량 등 세 가지 요건을 충족하여야 한다.

또한, 개인정보위는 AI 기업이 ‘정당한 이익’을 근거로 공개된 개인정보를 처리하기 위해 고려할 수 있는 기술적‧관리적 안전성 확보 조치와 정보주체 권리보장 방안을 안내했다.

다만, 모든 안전조치를 의무적으로 시행해야 하는 것은 아니며, 안내서에 제시된 여러 안전조치의

순기능과 AI 성능저하, 편향성 등 부작용과, 기술 성숙도를 고려해 기업의 특성에 맞는 ‘안전조치의 최적 조합’을 스스로 선택하여 이행할 수 있다.

더불어 개인정보보호 책임자(CPO)를 구심점으로 하는 ‘(가칭)인공지능(AI) 프라이버시 담당조직’을 자율적으로 구성·운영하고 안내서에 따른 기준 충족 여부를 평가해 그 근거를 작성‧보관하도록 권고했다. AI 성능 개선 등 중대한 기술적 변경이나 개인정보 침해 발생 우려 등 위험 요인을 주기적으로 모니터링하고, 개인정보 유·노출 등 침해사고 발생 시 신속한 권리구제 방안도 마련하도록 했다.

고학수 개인정보위 위원장은 “AI 기술 진보가 빠르게 이루어지고 있지만 개발의 핵심 관건인 공개 데이터 학습이 적법하고 안전한지 여부는 공백인 상황이었다”면서 “이번 안내서를 통해 국민이 신뢰하는 AI·데이터 처리 관행을 기업 스스로 만들어 나가고 이렇게 축적된 모범사례가 안내서에 지속적으로 반영될 수 있기를 기대한다”고 말했다.

eyre@heraldcorp.com