연구

  • 국회미래연구원 메인페이지
  • 연구
  • 미래산업전략연구

페이지 인쇄하기
(연구보고서 25-27) AI 데이터 생태계 혁신을 위한 규체체계 혁신 방안

연구보고서

(연구보고서 25-27) AI 데이터 생태계 혁신을 위한 규체체계 혁신 방안

  • 연구책임자

    여영준

  • 연구진

  • 발간일

    2025-12-29

  • 조회수

    54

요약

  본 보고서는  AI 기술 역량과 정책적 관심이 빠르게 확대되고 있음에도 불구하고, AI 학습용 데이터의 생산·가공·결합·활용 전 과정에서 여전히 구조적 제약이 존재하는 상황을 진단하고, AI 데이터 생태계를 전주기 관점에서 분석하여 규제체계 재설계 방향을 모색했다.

  보고서에 따르면 2024년 기준 국내 AI 산업 규모는 약 6조 3천억 원으로 전년 대비 12.5% 증가하며 지속적인 성장세를 보이고 있다. 그러나 2025년 산업계 조사 결과, 기업의 59.5%는 ‘필요한 데이터의 부족 또는 품질 미흡’을, 47.9%는 ‘과도한 규제와 법적 불확실성’을, 약 45%는 ‘전문인력 부족’을 주요 애로사항으로 지적했다.

  글로벌 AI 경쟁이 알고리즘 중심 경쟁을 넘어 데이터 접근·활용 역량을 둘러싼 구조적 경쟁으로 전환되는 가운데, 해외 주요국은 AI 학습데이터를 중심으로 제도 전환을 가속화하고 있다. 영국 Tortoise Media의 글로벌 AI 경쟁력 평가에서 한국은 인프라 6위, 개발 능력 3위, 정부 전략 4위로 기술·정책 역량은 선진국 수준을 기록했으나, 데이터 활용 법령과 운영환경은 35위로 크게 뒤처진 것으로 나타났다.

  보고서는 AI 데이터 생태계를 전주기 관점에서 ▲AI 학습 데이터 확보·품질 관리 단계, ▲공공 및 민간 데이터 통합·표준·공유 단계, ▲AI 서비스 모델링·위험관리 및 거버넌스 단계로 구분하여 각 단계별 구조적 병목 요인을 분석했다. 분석 결과, 우리나라 데이터 규제체계는 위험 최소화 중심의 정태적 구조에 머물러 있으며 핵심 규제 영역에서 제도적 공백이 지속되고 있다고 지적했다.

  ‘AI 학습 데이터 확보·품질 관리 단계’에서는 개인정보보호법, 저작권법, 산업기밀 보호 등 데이터 관련 규제 해석의 불명확성과 제도적 기반 미비로 인해 데이터 활용 범위가 구조적으로 제한되고 있다고 분석했다. 산업별 원천데이터는 비정형성이 강한 반면, 공공데이터는 행정 목적 중심으로 구축돼 AI 학습 수요와의 정합성이 낮아 고품질 학습데이터 축적이 어렵다고 지적했다.

  특히 데이터 정제·가공·라벨링·품질 관리는 AI 성능과 직결되는 핵심 과정임에도 이를 체계적으로 지원할 제도와 인프라는 충분히 구축되지 못한 상황이다. 이로 인해 기업들은 동일 데이터를 반복 전처리하거나 보수적으로 활용할 수밖에 없으며, 이는 비용 증가와 일정 지연으로 이어지고 있다고 보고서는 설명했다.

  ‘공공 및 민간 데이터 통합·표준·공유 단계’에서는 데이터 생성 목적과 관리체계의 차이로 인해 결합을 위한 추가 정합화 작업이 필수적이나, 이를 뒷받침할 통합 표준과 운영 기준은 충분히 마련되지 못했다고 분석했다. 이로 인해 데이터 사일로 현상이 심화되고 기관·기업 간 협업이 지연되는 구조가 고착화되고 있다고 지적했다.

  ‘AI 서비스 모델링·위험관리 및 거버넌스 단계’에서는 학습데이터 출처 관리, 운영 과정에서 발생하는 위험 통제, 책임 귀속 문제를 포괄적으로 지원할 제도가 충분히 마련되지 못한 상황이라고 밝혔다. 생성형 AI 확산으로 개인정보 및 기밀정보 재노출 위험이 증가하고, 판단·생성 과정의 불투명성으로 사고 발생 시 책임 규명이 어려워지고 있다고 지적했다.

  이를 바탕으로 보고서는 AI 데이터 생태계를 전주기 관점에서 재정비하기 위한 단계별 개선 방향을 제시했다. AI 학습 데이터 확보·품질 관리 단계에서는 공공데이터의 AI 학습 목적 정밀화, 산업별 비정형데이터 전주기 관리체계 구축, 민간 데이터 축적 인센티브 강화, 개인정보·저작권 규제의 예측가능성 제고 등을 제안했다.

  공공 및 민간 데이터 통합·표준·공유 단계에서는 국가 단위 공공–민간 공동 데이터 표준 확립, 데이터 가치평가 및 보상 규범 제도화, 결합·공유 절차 일원화 등을 제시했으며, AI 서비스 모델링·위험관리 및 거버넌스 단계에서는 책임성과 투명성을 중심으로 한 제도 정비와 통합 거버넌스 구축의 필요성을 강조했다.