본문 바로가기

흔적의 역사

후설, 견마지치…인공지능은 승정원일기를 어떻게 번역했나

2005년 네덜란드 출신의 딕 아드보카트(Advocaat)가 한국축구대표팀 감독으로 임명되었을 때의 일이다. 네덜란드어로 된 아드보카트 관련기사를 검색해서 번역기를 돌렸더니 ‘Lawyer(변호사)’라는 주어가 계속 보였다. 곧 그 이유를 알아냈다.

‘아드보카트’ 단어에 네덜란드어로 변호사라는 뜻이 있고, 영어에도 ‘Advocate(변호사)’가 있으니 그렇게 번역한 것이다.

‘견마지치’를 ‘미천한 신의 나이’로 정확하게 번역한 인공지능 번역기. 승정원의 별칭인 후설(喉舌)도 목구멍(喉)과 혀(舌)로 번역하지 않고 ‘승정원’이라 표현했다. 그러나 66살을 60살로 기록한다던가 ‘거의 쉬는 날도 없이’를 ‘거의 한 달도 지나지 않아’로 표현한다든가 한 것은 전문가의 다듬질이 필요한 대목이다. |한국고전번역원 제공  

이후에도 번역기가 ‘나는 소나무야, 탱크니 넌(I’m fine, thank you, and you)’으로 번역할 수 있다는 우스갯소리도 터져나왔다. 실제로 ‘He is a boy’를 ‘헬륨은 소년이다’라는 번역한 인공지능도 있었다던가.

하지만 요즘엔 영어소설 <위대한 개츠비>의 무라카미 하루키(村上春樹) 번역본과 구글 번역을 비교한 결과 큰 차이가 없을 정도로 발전했다.
인공지능은 조선시대 국왕들의 왕명출납을 담은 <승정원일기>(국보 303호) 번역에 도전하고 있다.

<승정원일기>는 지금으로 치면 7급 공무원인 주서가 국왕의 일거수일투족을 기록한 생생한 1차 자료이다. 군신간의 사적인 대화나 내밀한 궁궐이야기를 동영상 찍듯 기록해두었다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

문맥상 ‘거의’로 표현해야 할 것을 ‘겨우’로 했고, ‘연명하게 해주소서’라는 청유형을 ‘해야 합니다’ 는 강요형으로 번역한 부분 등 몇가지 손봐야 할 대목이 눈에 띈다. |한국고전번역원 제공 

스토리텔링의 보고라 할 수 있다. 조선 전기의 <승정원일기>가 임진왜란 때 소실된 것이 너무도 한스럽다. 그러나 인조~순종대까지 2억4000만자(3243책)가 남아있는 것은 천만다행이다.

그러나 2억4000만자를 언제 다 번역할 수 있다는 말인가. 1994년부터 전문고전번역가들이 23년간 매달렸지만 전체번역률은 21% 수준에 그쳤고, 앞으로도 40년 이상 족히 걸릴 작업이다.
지금 그걸 한국고전번역원과 한국정보화진흥원 등이 ‘인공지능’의 도움을 받아 앞당긴다는 것이다.

단어와 구문을 쪼개어 번역했던 기존 방식에서 벗어나 문장을 통째로 파악해 번역하는 최신 기술을 도입했다. 어순, 문맥의 의미와 차이 등을 반영할 수 있어 문장 맥락의 이해도와 정확도를 높였다.

이에 필요한 말뭉치 35만개를 구축했다.
예컨대 국왕의 ‘목구멍(喉)과 혀(舌)’ 역할을 한다는 승정원은 후설(喉舌)이라는 별칭을 갖고 있었다.

그런데 인공지능은 문맥을 정확히 읽어 ‘승정원’이라 번역했다. 국왕 앞에서 ‘신하의 나이’를 낮춰 표현하는 말로 ‘견마지치(犬馬之齒)’가 있다. 전문번역가는 ‘보잘 것 없는 신의 나이’로 표현했다.

그런데 인공지능 역시 ‘개와 말의 이빨’이 아닌 ‘미천한 자의 나이’라 했다. 적확한 번역이다. 인공지능은 ‘하늘이 무너지는 아픔(天崩)’도 착오없이 표현했다.

승정원일기 번역자들은 인공지능의 번역 기능에 60점(100점 만점)을 주었다. 그 정도면 준수한 편이다. 한국고전번역원과 한국정보화진흥원이 제시한 예시문을 보면 일반인이 보기에는 인공지능 번역이나 전문가의 번역에서 큰 차이가 없다.

그러나 고전번역은 디테일이 생명이다. 원전번역이 틀리면 역사가 왜곡되는 것이기에 한치의 오류도 허용할 수 없다.

일반인이 보기에는 번역가의 번역과 인공지능 번역은 큰 차이가 없다. 다만 사람의 이름인 ‘호랑(虎狼)’을 고전번역가는 ‘박호랑’이라는 인물로 표현했지만  인공지능 번역기는 ‘호린’으로 잘못 번역했다. |한국고전번역원 제공

예컨대 ‘나이가 이제 육십하고도 육이 되었다(今六十有六矣)’는 문장을 두고 전문번역가는 ‘66세’라고 표현했다. 60살에 또 6살을 더했으니 66살이라 한 것이다.

그러나 인공지능은 앞의 60(六十)만 읽고, 뒤의 육(有六)은 그냥 넘겼다. 그래서 60살로 잘못 읽었다. 또 문맥상 ‘거의’로 읽어야 할 단어(恰)을 ‘겨우’라 한 표현도 있다.

이밖에 ‘거의 쉬는 달도 없이(殆無虛月)’를 ‘거의 한 달이 지나지 않아’로 잘못 표현했다.

문맥상 ‘죽을 지경에 놓인 목숨을 연명하게 해주소서(비延濱死之喘)’라는 청유형 문장을 써야 할 ‘거의 죽게 된 목숨을 연장하게 해야 합니다’는 당위형 표현으로 잘못 번역했다.
‘포청죄인호랑(捕廳罪人虎狼)’ 문장을 보자. ‘포도청의 죄인인 호랑(虎狼)’이 인공지능 번역기에서는 ‘호린(虎麟)’으로 잘못 표기됐다.

인공지능 번역기가 기특하게도 ‘포청죄인호랑’을 ‘포청죄인인 호랑’, 즉 사람 이름으로 인식한 것은 나름 칭찬할 만 했다.

그러나 ‘호랑’이 당대 인물인 ‘박호랑’이라는 사실을 인공지능 번역기가 알지 못했다. 문제는 인공지능 번역기가 사람 이름을 ‘호랑’이 아니라 엉뚱하게도 ‘호린’으로 잘못 표기했다는 것이다. 번역기가 엉뚱한 버그를 내고도 시치미 뚝댄 것이다.
인공지능이 <승정원일기>를 번역한다는 소식은 전문번역가의 입장에서보면 다소 착잡할 것이다.

전문번역가 한사람을 키우는데 7~10년 걸린다는데 인공지능에게 너무도 쉽게 그 자리를 내어준다면 씁쓸한 일이다. 인간이 인공지능 알파고에 일패도지(一敗塗地)한 바둑을 보라. 경우의 수가 우주의 원자수보다 많고 인간이 5000년 이상 터득해온 바둑의 진리를 ‘알파고’가 이길 수 없다고 큰소리 뻥뻥치다가 어찌되었는가.
인공지능 번역은 어떨까. 인공지능 번역기가 제아무리 발전한다 해도 결국은 ‘초고’로 만족해야 하고, 마지막에 가서는 사람의 다듬질이 필요하지 않을까.

인공지능이 옛 사람이 남긴 붓의 흔적과 체취를 찾아내고 맡을 수 있을까. 사람 냄새 나는 번역, 그것은 인공지능은 할 수 없으리라. 그렇게 믿고 싶다. 경향신문 논설위원