객체인식 등 시각기술 ‘세계 수준’…원천기술과 투자규모는 주요국에 뒤져

이른바 4차 산업혁명 시대가 도래하면서 인공지능(AI)에 대한 관심이 갈수록 커지고 있다. 인공지능이야말로 4차 산업혁명을 실현하는 핵심 기술 중에서도 백미로 꼽히기 때문이다. 이 때문에 미국, 중국, 유럽 등 세계 주요 국가들과 선진 기업들은 4차 산업혁명 시대의 주도권을 잡기 위해 인공지능 기술 확보에 총력을 기울이고 있다. 그렇다면 현재 우리나라는 인공지능 분야에서 어느 수준에 와 있을까. 이와 관련해 최근 한국정보화진흥원(NIA)은 미국 스탠퍼드대가 개발한 인공지능 지수(Stanford AI Index)를 활용해 한국의 인공지능 현주소를 분석한 흥미로운 보고서를 발간해 눈길을 끌고 있다. 한국정보화진흥원이 정기적으로 발간하는 최신호에 실린 관련 내용을 살펴본다.

우리나라 인공지능 기술은 최근 수년간 크게 발전했지만, 원천기술 등에서는 아직 부족하다는 평가다.

인공지능은 인간의 지각, 학습, 추론 등의 능력을 컴퓨터 프로그램으로 구현해내는 기술이다. 인간의 지능을 모방하는 만큼 시각인식, 음성인식, 자연어 처리, 기계학습(머신러닝) 등 다양한 첨단기술이 필요한 분야다.

인공지능은 2016년 ‘알파고 쇼크’ 이후 전 세계적인 관심사로 급부상했다. 우리나라에서도 주요 기업들이 인공지능 기술 확보와 상용화에 속속 뛰어들고 있다. 하지만 인공지능은 복잡하고 다양한 기술을 아우르고 있는 데다 발전 속도가 빨라서 일반인은 물론이고 전문가들도 전체적인 수준을 가늠하기 쉽지 않다는 게 중론이다. 요컨대 혁명적인 변화가 일어나고 있는 것은 분명한데, 그 정도와 실체를 파악하기가 쉽지 않다는 것이다.

실제 지금까지 우리나라에서 인공지능 분야의 기술 수준을 측정한 대부분의 시도들은 전문가들을 대상으로 한 설문조사, 인공지능 관련 논문이나 특허 수 등을 토대로 주요 선진국과의 기술 격차를 가늠하는 데 그쳤다는 평가가 지배적이다.

이에 비해 스탠퍼드 인공지능 지수는 객관적인 데이터를 기반으로 전반적인 인공지능 기술 수준을 합리적으로 추정할 수 있는 툴(Tool)을 제시했다는 점에서 중요한 의의가 있다는 게 한국정보화진흥원 연구팀의 설명이다.

스탠퍼드 인공지능 지수는 스탠퍼드대의 ‘인공지능 100년 연구(One Hundred Year Study on AI at Stanford University)’ 프로젝트의 하나로서, 인공지능과 관련된 주요 현황과 기술 발전 동향을 파악하기 위한 목적으로 기획됐다. 특히 인공지능 분야의 세계적인 석학들이 주도적으로 지수 개발에 참여해 공신력을 인정받고 있다.

한국정보화진흥원은 바로 이 스탠퍼드 인공지능 지수 방법론을 활용해 우리나라 인공지능 분야의 전반적인 현주소를 제대로 파악하기 위한 최초의 시도를 한 셈이다.

‘스탠퍼드 AI 지수’ 방법론으로 평가

스탠퍼드 인공지능 지수는 ▲인공지능 분야 출간 논문 수 ▲인공지능 관련 스타트업 수 ▲인공지능 관련 일자리 ▲객체인식 기술 ▲기계번역 기술 등 총 17개의 세부 지표별로 데이터를 수집, 분석해 인공지능 수준을 평가하는 구조로 이뤄져 있다.

그럼 한국정보화진흥원의 조사 결과를 주요 세부 지표별로 살펴보도록 하자. 먼저 인공지능 관련 논문 수를 살펴보면, ‘알파고 쇼크’가 있었던 2016년 이후 한국을 비롯해 미국, 중국, 유럽연합(EU) 등 대부분 주요 국가에서 논문 수가 급증하는 추세를 보이고 있다.

한국은 2016년 인공지능 관련 논문 수가 전년 대비 11.76% 증가했고, 2017년에는 전년 대비 25.43%나 늘어났다. 다만 2010년 이후로 분석 대상 기간을 확대하면 한국의 인공지능 논문 수 증가율은 연평균 1% 미만에 그친다. 이런 지표로 미뤄 볼 때 2016년 이후에 인공지능 관련 연구가 크게 늘었다는 점을 알 수 있다.

2017년 기준 인공지능 관련 논문 수를 주요 국가별로 살펴보면 미국 7865건, EU 1만4660건, 중국 1만3820건에 달했다. 반면 한국은 주요 국가에 비해 크게 부족한 1514건에 그쳤다. 특히 전 세계적으로 출간되는 인공지능 관련 논문 수에서 한국이 차지하는 비중은 3% 수준에서 감소세를 나타내고 있는 것으로 조사됐다. 미국, 중국, EU 등 주요 국가들의 인공지능 연구가 가속화되는 데 따른 영향을 받는 것으로 풀이된다.

다음으로 인공지능 기술 개발과 상용화에 진출하는 스타트업(신생기업) 수를 살펴보면, 2018년 11월 기준 우리나라의 인공지능 관련 스타트업은 465개로 나타났다. 이 가운데 ‘벤처 인증’을 받은 기업은 154개사였다. 한국정보화진흥원 연구팀은 이들 154개사를 ‘인공지능 스타트업’ 범주로 분류했다. 전체 벤처 인증 기업 3만6529개사 중에서 인공지능 스타트업 154개사가 차지하는 비율은 약 1.12%로 나타났다.

인공지능 스타트업 수 못지않게 이들 기업에 투자되는 재원도 중요한 의미를 지닌다. 인공지능 관련 기업들의 저변 확대와 성장을 위해서는 적정한 규모의 투자가 반드시 수반돼야 하기 때문이다.

한국정보화진흥원의 조사 결과에 따르면, 인공지능 스타트업 154개사에 투자된 금액은 꾸준한 증가세를 나타내고 있다. 특히 2018년에는 총 1163억원의 금액이 투자되면서 전년 대비 약 124%의 증가율을 기록했다. 다만 인공지능 스타트업에 대한 투자 금액의 급격한 증가세는 주로 상위 10% 기업에 국한되고 있어 ‘투자 쏠림’ 현상이 나타나는 것으로 관측된다.

아울러 국내 인공지능 스타트업에 대한 투자 금액 규모도 주요 국가에 비해 매우 부족하다는 게 전문가들의 견해다. 실제 미국의 경우에는 인공지능 관련 스타트업에 대한 투자가 연간 50억 달러에 이르는 것으로 알려졌다.

인공지능에 대한 일반의 관심도를 가늠할 수 있는 지표로 인공지능 관련 뉴스의 생산량을 꼽을 수 있다. 아무래도 언론매체들이 보도하는 뉴스와 기사들은 독자들의 최근 관심사를 반영하기 때문이다.

한국정보화진흥원은 2015~2017년에 걸쳐 3년 동안 인공지능이라는 키워드가 포함된 뉴스 및 기사를 분석했다. 그 결과 우리나라에서는 2016년을 기준으로 인공지능 관련 뉴스와 기사가 급증한 것으로 나타났다. 실제 2016년 인공지능 관련 뉴스 건수는 약 6만5000여건으로, 전년 대비 9배 이상 증가한 것으로 조사됐다. 2017년에는 인공지능 관련 뉴스가 더욱 늘어나 총 15만1000여건에 달했다.

인공지능을 구현하는 핵심 기술 수준을 조사한 결과도 눈길을 끈다. 우선 객체 인식 기술 분야에서 우리나라는 2017년 기준 세계 최고 인공지능 시스템과 1%가량의 성능 차이만을 나타낼 만큼 높은 수준의 역량을 확보한 것으로 나타났다.

이는 2014~2017년 개최된 인공지능 기술 분야 국제 경진대회 ‘LSVRC 이미지넷(Large Scale Visual Recognition Challenge ImageNet)’ 대회의 객체 인식 부문에 참가한 한국 팀 중에서 가장 우수한 성능을 나타낸 팀의 결과를 토대로 평가한 것이다.

우리나라 팀들은 LSVRC 이미지넷 대회 참가 초기인 2014년 세계 최고 인공지능 시스템과 7% 이상의 차이가 났지만, 이후 빠른 속도로 기술력을 끌어올려 세계 최고 수준과 어깨를 나란히 할 만한 정도가 됐다.

흥미로운 것은 객체 인식 부문에서 인간과 인공지능의 능력을 비교한 대목이다. 인간은 객체 인식 정확도가 약 94.90%다. 그런데 지난 2015년부터 세계 최고 수준의 인공지능 시스템들이 인간의 객체 인식 능력을 넘어서기 시작했다. 2017년 기준 세계 최고 인공지능 시스템의 객체 인식 정확도는 97.75%에 달했다.

아울러 시각 데이터에 대한 문답 지표에서도 우리나라 인공지능 기술은 세계 수준에 이른 것으로 평가됐다. 2017년 기준 국내 최고 인공지능 시스템의 시각 데이터 문답 정확도는 66.89%로, 세계 최고 인공지능 시스템의 68.40%와 근소한 차이만을 기록했다.

현대자동차 연구원들이 남양연구소에서 지능형 음성인식 비서 서비스 기술을 테스트하고 있다. 연합뉴스

자연어 처리 기술은 세계 수준과 격차

인간의 시각 데이터 문답 정확도는 평균 83.30%다. 이 지표에서는 아직 인간이 인공지능을 상당 부분 앞서고 있는 셈이다. 하지만 인공지능 기술 발전 속도가 매우 빠르기 때문에 언제 추월을 허용할지 모를 일이다.

인공지능 기술 중에서 시각 인식과 함께 양대 축으로 꼽히는 분야가 자연어 처리다. 우리나라는 자연어 처리 기술에서는 아직 세계 최고 수준과 제법 격차가 있는 것으로 조사됐다.

우선 인공지능의 질문-응답 정확도 지표에서 한국은 세계 12위 정도로 추정된다. 한국정보화진흥원은 스탠퍼드대가 개발한 ‘문장 독해력 데이터셋(SQuAD: The Stanford Question Answering Dataset)’을 기반으로 한 경진대회에 출전한 한국 팀의 최고 성적(정확도 81.5%)을 기준으로 이 같은 추정 결과를 도출했다. 한국 팀의 최고 성적은 인간의 정확도 82.3%에 못 미치고 있으며, 구글이 보유한 세계 최고 정확도 87.43%와도 다소 격차가 존재한다.

또 음성인식 기술 지표를 살펴보면 우리나라 인공지능 연구자들의 기술 수준이 꾸준하게 상승하고 있는 것으로 분석됐다. 다만 한국어를 기반으로 음성인식 기술 수준을 진단할 수 있는 공개적인 데이터가 부족한 탓에 객관적인 평가나 비교는 어렵다. 다만 전문가들은 한국어 음성인식 기술이 상당히 우수한 수준이라고 평가한다는 게 한국정보화진흥원 연구팀의 설명이다.

스탠퍼드 인공지능 지수는 한 나라의 인공지능 수준을 평가하는 데 일부 한계도 갖고 있다. 특히 미국의 상황을 반영한 지표들이기 때문에 우리나라 현실에 딱 들어맞지 않는 부분도 있다. 이 때문에 17개 세부 지표 중 ▲정리 증명 ▲충족 가능성 문제 해결 등 2개 항목은 이번 조사에서 측정이 불가한 것으로 나타났다.

그럼에도 불구하고 한국정보화진흥원의 이번 조사 결과는 우리나라 인공지능 분야의 현주소를 가늠하는 데 상당히 유용한 단서를 제공했다는 점에서 의의가 적지 않다는 평가다.

한국정보화진흥원 연구팀은 “우리나라 인공지능 분야의 기술적 성능은 지속적으로 개선되고 있으나, 원천기술과 기술기반은 매우 취약한 수준에 머무르고 있는 것으로 파악된다”며 “인공지능 분야의 원천기술 개발 촉진을 위한 국가적 차원의 개선책을 마련할 필요가 있으며, 미국의 마이크로소프트나 구글처럼 우리나라 대표 기업들의 인공지능 원천기술에 대한 관심과 투자도 확대될 필요가 있다”고 강조했다.



김윤현 기자 unyon21@hankooki.com