우리말 바탕 정보사회 건설 '21세기 세종계획' 지난해 1단계 완료말뭉치 구축등일정한 성과… 후속사업은 활용 방안 모색에 초점

오늘날 지식정보사회는 방대한 디지털 정보가 온라인 네트워크를 통해 생산, 유통, 소비되는 것을 특징으로 한다. 과거 아날로그 시대와 달리 정보량이 매순간 기하급수적으로 늘어날 수 있는 것은 바로 정보의 디지털화 덕분이다. 그 정보의 대부분은 역시 언어 정보다. 사람들이 일상적으로 쓰는 말과 글이 디지털 정보의 근간인 것이다.

언어는 얼마나 많은 사람이, 얼마나 넓은 지역에 걸쳐, 얼마나 자주 사용하느냐에 따라 그 힘이 결정된다. 영어가 20세기 들어 세계어의 권좌에 오른 것은 바로 그 기준에 가장 잘 부합했기 때문이다.

그렇다면 21세기 지식정보사회에는 어떤 언어가 지구촌의 패권을 잡을까. 위세가 여전한 영어, 혹은 급부상하고 있는 중국어일까. 물론 한 언어의 힘은 정치ㆍ경제적 영향력과 떼놓을 수 없다는 점에서 두 언어는 유력한 후보다.

하지만 완전히 다른 관점에서 이 문제를 들여다볼 필요가 있다. 바로 ‘언어의 정보화’라는 시각에서다. 온라인ㆍ디지털화가 가속화할 미래에는 사이버 공간에서 얼마나 널리 쓰이느냐 하는 기준이 언어의 패권구도에 결정적 변수가 될 공산이 크기 때문이다.

물론 현재로서는 영어가 사이버 공간에서도 절대적인 영향력을 미치고 있다. 단적인 예로 인터넷을 통해 유통되는 천문학적인 정보의 상당 부분은 영어 텍스트로 이뤄져 있다.

그렇다면 한국어의 ‘정보화를 통한 세계화’ 가능성은 어느 정도일까. 한국은 정보기술(IT) 강국이라는 칭호를 듣고 있을 만큼 우수한 IT 경쟁력을 갖고 있는 데다, 한글 역시 과학적 우수성을 널리 인정받고 있는 터다. 이런 점을 감안하면 ‘한국어 정보화’는 이론적으로나 현실적으로나 큰 타당성을 지닌다고 하지 않을 수 없다.

바로 이런 배경에서 출범한 국가 사업이 이른바 ‘21세기 세종계획’(이하 세종계획)이다. 세종계획은 ‘우리말과 우리글을 바탕으로 하는 정보사회 건설’이라는 웅대한 슬로건 아래 1998년 시작돼 2007년 사업이 완료됐다. 사업의 3대 목표는 ▲세계 수준의 국어 기초 언어자료 베이스 구축을 통한 우리말 정보화 ▲표준화된 전자사전 구축을 통한 우리말 체계화 ▲한민족 언어 정보화를 통한 우리말 세계화 등이다.

세종계획은 10년에 걸친 장기 프로젝트였던 만큼 우여곡절도 거쳤지만 여러 분야에서 적지 않은 결실을 맺었다.

우선 기초 언어자료 베이스 분야에서 2억 어절의 ‘말뭉치’(corpus)를 구축한 점이 단연 두드러진다. 말뭉치는 여러 단어가 쓰인 어절을 컴퓨터가 인식할 수 있도록 묶어 놓은 단위를 뜻한다. 2억 어절의 말뭉치 규모는 일찌감치 언어 정보화에 나선 선진국에 비해서도 월등히 많은 양이다. 1990년대 초반 국가 말뭉치를 구축한 영국의 경우 1억 어절에 불과하며, 미국 역시 2,200만 어절에 그치고 있다.

말뭉치가 국어 정보화에서 차지하는 비중은 매우 크다는 게 전문가들의 지적이다. 무엇보다 대규모의 말뭉치가 구축되면 컴퓨터를 이용한 기계번역과 문서요약, 맞춤법 교정 등이 보다 정교하고 수월해진다.

학문적으로도 활용 범위가 매우 넓다. 특히 국어의 계량적 연구와 사용 양상 연구 등에서 큰 역할을 할 수 있을 뿐만 아니라, 언어학, 교육학, 전산학, 인지과학 등 관련 학계에서도 연구 효율성을 높여주는 핵심자원이 될 수 있다. 아울러 국가 어문정책 수립과정이나 사전 편찬, 국어 교재 편찬, 국어 정보처리 기술 개발 등에도 쓰임새가 크다.

말뭉치 구축 외에 60만 어휘 규모의 전자사전을 개발한 것도 세종계획의 뚜렷한 성과로 꼽힌다. 전자사전은 정보검색과 텍스트 분석, 자동번역, 다국어 사전 구축 등에 활용도가 매우 높다.

국어 교육 및 학습 등에 널리 쓰일 수 있는 국어 정보화 시스템도 다수 개발됐다. 어문규정 시스템, 남북한 언어 비교사전 검색 시스템, 한국 방언 검색 시스템, 어휘 역사 검색 시스템, 문학작품에 사용된 어휘 검색 시스템, 전통문화 어휘 검색 시스템 등이 그런 사례다. 이밖에 옛 한글, 한자 등에 대한 문자코드 표준화, 전문용어 데이터베이스 구축 및 표준화 등에서도 적지 않은 성과를 냈다.

세종계획은 그러나 몇 가지 아쉬운 점과 숙제들도 남겼다. 당초 남북한 및 재외 동포를 대상 범주에 넣었던 ‘한민족 언어 정보화’가 여러 난관에 봉착하면서 ‘한국 내 언어 정보화’로 축소된 점, 전문가 집단이 협소한 데다 사업을 주관하는 구심점이 미약해 난항을 겪은 점 등이 그런 사례로 꼽힌다.

무엇보다 국어 정보화의 중요성에 대한 인식 부족이 가장 큰 장벽이었다는 게 프로젝트 참여 전문가들의 공통된 견해다. 그러다 보니 세종계획에 대한 홍보도 제대로 이뤄지지 못했고, 그나마 어렵사리 이뤄낸 성과물도 널리 활용되지 못하고 있는 상황이다.

하지만 세종계획은 단발성 사업으로 흐지부지 끝나서는 안 된다는 게 전문가들의 중론이다. 지난 10년의 성과를 냉정하게 분석하고 보완해 당초 목표와 취지를 온전하게 달성할 수 있도록 후속사업에 나서야 한다는 것이다. 그렇지 않으면 21세기 언어 주도권 경쟁에서 우리말은 또 다시 뒤처질 수밖에 없다는 지적이다.

국립국어원은 현재 세종계획의 성과를 분석ㆍ평가하고 향후 과제를 도출하는 작업을 진행하고 있다. 후속사업의 큰 방향은 세종계획의 성과 활용 및 발전적 승화 방안 마련에 맞춰져 있는 것으로 전해졌다.

국립국어원 국어정보화팀 김한샘 학예연구사는 “다른 나라들은 자국의 언어자원을 보다 심층적으로 구축하는 데 힘을 쏟고 있다. 우리나라도 이런 세계적 흐름을 반영해 세종계획의 성과를 발전시켜 나가는 방법을 모색해야 할 것”이라고 강조했다.

■ '세종대왕의 이름으로'한국어 보급 박차

몽골 울란바타르 대학과 세종학당 운영을 위한 업무협정 체결식.

세종대왕의 이름을 현판으로 내걸고 우리말 세계화에 나선 ‘세종학당’의 행보도 빨라지고 있다.

세종학당은 해외 한국문화원이나 관광공사 등을 거점으로 한 개방형 한국어문화학교다. 해외 현지의 일반 외국인들을 대상으로 한 한국어 보급 기관이라는 점에서 기존의 여타 한국어 보급 사업과는 차이가 있다.

그 동안 교육인적자원부 등이 주관해온 해외 한국어 보급 사업은 주로 재외 국민과 동포를 대상으로 이뤄졌다. 외국인들 중에는 학문적으로 한국어를 연구하는 사람들이 일부 보급 대상자였다.

세종학당은 국립국어원 주도로 지난해 처음 설립되기 시작해 올 6월 현재 중국, 몽골, 키르기스스탄, 카자흐스탄, 미국 등 5개국에 17곳이 문을 열었으며, 6개국 18곳은 설립 협정을 맺은 상태다. 2012년까지는 오대양 육대주에 걸쳐 모두 60곳으로 늘어날 예정이다.

세계 각국은 지금 자국어 전파 경쟁을 치열하게 벌이고 있다. 경제성장을 등에 업고 국제무대에 강자로 등장한 중국은 지난해까지 140개의 ‘공자학원’을 설립했으며, 독일(괴테 인스티튜트, 238개), 프랑스(알리앙스 프랑세즈, 1074개), 영국(브리티시 카운슬, 238개) 등도 자국어 보급기관 설립에 박차를 가해 왔다. 이 같은 자국어 보급기관 설립 붐은 국제사회에 대한 영향력 확대 전략과 무관치 않다.

세종학당은 일방적인 언어 보급보다 현지 문화 존중을 바탕으로 상호이해를 증진하는 방향으로 전개되고 있다. 언어가 가진 ‘문화이해의 코드’라는 특성을 충분히 살려 외국인들이 한국과 한국문화에 대해 우호적인 시각을 갖도록 하자는 것이다. 이는 새로운 한류의 동력이 될 수도 있다는 분석이다.

국립국어원은 아시아 지역 5개 언어로 만들어진 초급 한국어 교재를 이미 자체 개발해 세종학당 표준교재로 보급하고 있다. 교재에 사용된 언어는 중국어, 베트남어, 타갈로그어(필리핀어), 태국어, 몽골어 등이다.


김윤현 기자 unyon@hk.co.kr