
바야흐로 인공지능(AI) 시대다. 모든 화두의 중심에는 AI가 있다. AI가 아닌 그 무엇을 놓치고 있지 않은지 돌아볼 여유조차 쉽지 않다. 쏟아지는 새로운 개념, 기술, 서비스 등을 쫓아가려 하지만 변화의 방향이나 크기는 가늠조차 어렵다. 정치, 경제, 사회, 문화 각 부문에 미칠 영향에 대한 전문가 전망이 며칠 사이 겸연쩍게 되는 경우도 적지 않다. 그럼에도 최근 언급이 잦은 소버린(sovereign) AI는 한동안 우리 AI 산업 전반의 가늠자가 될 것이 분명하다.
네이버에 따르면 “소버린 AI는 각 국가가 자체 데이터와 인프라를 활용해 그 국가나 지역의 제도, 문화, 역사, 가치관을 정확하게 이해하는 AI”다. 이를 판단하는 합리적 기준은 “기술적 자립 여부보다는 해당 국가가 사용하는 AI에 자국의 가치관과 윤리, 문화적 특성이 충분히 반영되었는지, 그리고 해당 국가의 이익과 존속을 지켜낼 수 있는지”다.
잘 알려진 것처럼 현재 AI 분야의 세계 패권은 미국과 중국이 가지고 있다. 이들의 AI 시장 점유율, 투자 및 인프라 비율, 특허 비율은 절대적이다. 이들이 어떤 국가, 어떤 언어를 중심으로 데이터 학습을 했는지는 뻔하다. 우리나라를 비롯한 세계 각국이 자신만의 AI 기술을 개발하려는 이유는 산업이나 경제만 국한되지 않는다. 몇 개 국가가 독점하는, 한정되거나 편향된 AI가 가져올 국가 및 문화 정체성 혼란이 우려된다. 급기야 시장은 물론 문화 종속까지 걱정할 수밖에 없는 것이 현실이다. AI 산업에서 자주와 주권의 강조는 자연스러운 흐름이다.
이러한 소버린 AI의 필요성과 중요성은 뉴스라는 콘텐츠를 다시 보게 만든다. 뉴스는 한 사회의 일기다. 시시각각 일어나는 사회적 의미를 가진 이슈가 정리되고 평가된다. 정치, 경제, 사회, 문화 전반을 아우르고 장기간에 걸쳐 생산되기에 한 사회의 역사로서 축적된다. 한 이슈에 대해 여러 언론매체를 통해 각양각색의 시각을 접할 수 있기에 사회적 다양성이 확보된다. 물론 우리 뉴스에 대한 비판과 한계는 존재한다. 하지만 우리 제도, 문화, 역사, 가치관 등을 이해하는 AI 개발을 위한 데이터의 핵심 원천 중 하나는 뉴스 콘텐츠일 수밖에 없다.
뉴스 콘텐츠는 양질의 데이터로서 AI 모델의 학습과 검증에 최적화돼 있다. 단어의 연결과 언어적 맥락을 정확히 파악하는 데 필수다. 특히 신문의 뉴스 콘텐츠는 이미 체계적이고 정제돼 있는 전형적인 정형 데이터다. 그리고 지역신문의 뉴스 콘텐츠는 AI 시대에 자칫 흔들릴 수 있는 해당 지역의 정체성과 문화를 굳건하게 만들 수 있는 근간이 된다. 당연한 얘기지만 지역이 모여 우리 사회가 구축된다. 우리나라 소버린 AI 전략에서 지역신문이 빠질 수 없는 이유다.
안타까운 점은 뉴스 저작권을 둘러싼 우리 언론사와 빅테크 기업의 갈등이다. 언론사는 저작권 침해를, 빅테크 기업은 공정 이용(fair use)을 각각 주장한다. 양측이 주장이 첨예해 쉽사리 합의에 도달하기 어렵다. 현재 저작권 전반은 특정 국가에만 한정해 주장하기 어렵기에 해외 사례에 대한 관심이 높다. 뉴스 콘텐츠도 마찬가지다. 해외 판결이나 합의에 양측의 희비가 엇갈린다. 우려스러운 것은 우리 법이나 제도의 맹점을 파고드는 해외 빅테크 기업의 공세다. 법과 제도의 미비는 우리 소버린 AI 전략이 차질을 빚을 가능성을 높일 뿐이다. 이제 우리 언론사와 빅테크 기업이 머리를 맞대 합의를 도출해야 할 때다.