"AI의 발전은 데이터에서 시작된다"... 크라우드웍스, K-AI 데이터 주권 지원 나서

크라우드웍스는 최신 AI 기술 개발을 위한 데이터 공급망을 구축하기 위해 한국형 AI인 'K-AI' 지원에 나섰다. 최근 이 회사는 대표이사 직속의 'AI 정책 전담 태스크포스(TF)'를 신설하고 본격적으로 운영하고 있다. 이 조직은 한국 정부가 도입한 K-AI(Model) 정책에 따라 데이터 지원 및 참여 방안을 마련하는 역할을 맡고 있다.
이재명 정부는 국가 차원에서 AI 모델 개발 능력을 강화하고, 해외 모델 의존도를 줄이며 데이터 주권을 확보할 계획이다. 이를 성공적으로 실현하기 위해서는 고품질 데이터의 확보가 필수적이며, 이는 정부의 중점 과제로 추진되고 있다.
김우승 크라우드웍스 대표는 "현재 AI 산업의 패러다임이 고품질 데이터 중심으로 이동하고 있다. 데이터는 AI 산업을 발전시키는 필수 요소로, 반도체나 GPU와 같은 중요성을 지닌다"고 밝혔다. 그는 메타가 AI 데이터 라벨링 기업 스케일AI에 20조 원을 투자한 사실과 서비AI가 10억 달러의 자금을 유치하려는 계획이 같은 맥락에서 이해해야 한다고 덧붙였다.
크라우드웍스는 방대한 데이터셋과 축적된 경험을 바탕으로, AI 모델 학습에 필요한 검증된 고품질 데이터를 제공하고 있다. 이는 AI 학습 과정에서 발생할 수 있는 저작권 문제를 해소하며, 기업들이 데이터 확보에 소요되는 시간과 노력을 줄일 수 있는 강점이 있다.
'A1' 플랫폼을 통해 한국어를 포함한 다국어 데이터, 의료, 금융, 로봇 분야의 산업 특화 데이터, 알바니아어 및 아랍어를 포함한 40개국 이상의 희소 언어 데이터를 보유하고 있다. 데이터의 정제와 검수, 라이선스 유통을 통합적으로 제공하여, 고객 기업들이 합법적이고 신뢰성 있는 데이터를 쉽게 확보할 수 있도록 지원하고 있다.
김 대표는 "AI 주권은 결국 데이터 주권에서 시작된다"며, "크라우드웍스는 저작권 이슈에 대응 가능한 구조적 플랫폼을 제공하여 산업과 공공 부문의 수요를 연결하는 데이터 인프라 역할을 할 수 있다"고 강조했다.
현재 크라우드웍스는 대규모 AI 개발 사업에 맞춰 고품질 데이터 구축과 활용에 대한 방법론을 마련하고 있으며, 글로벌 AI 데이터 기업들과의 파트너십을 통해 AI 데이터 커버리지를 확대해 나가고 있다. 이를 통해 언어별, 분야별 데이터의 교차 제공도 촉진할 방침이다.
이러한 노력을 통해 크라우드웍스는 한국의 AI 데이터 생태계를 지원하고, 데이터 주권 강화를 위한 기초를 다져가고 있다.
