세종시대의 한글, 인공지능으로 복원해보니…독창적인 '돋움체'에 절로 감탄
“네(수양대군)가 해야 할 일이 있다.” 훈민정음을 반포(1446년 10월·세종 28년)한 세종이 7개월전 죽은 부인(소헌왕후·1395~1446)의 명복을 빌기 위해 둘째아들 수양대군에게 특명을 내린다. 석가모니의 일대기를 편찬해서 불교신자인 부인을 추모하자는 것이었다.
이 명에 따라 수양대군(세조·1417~1468·재위 1455~1468)은 양나라 승우 율사(444~518)의 <석가보>와 당나라 도선 율사(596~667)의 <석씨보> 등을 바탕으로 <석보상절>을 편찬한 뒤 이를 훈민정음으로 번역했다.(1447년) 세종은 이 <석보상절>을 꼼꼼이 읽고 각 2구절에 따라 석가모니의 공덕을 찬양한 찬불가 583곡을 손수 지었다. 그것도 막 창제한 훈민정음으로…. 이것이 <월인천강지곡>이다.
인공지능으로 복원해본 훈민정음 창제 초기의 한글활자. 1447년(세종 29년) 무렵 한자 활자(갑인자)와 함께 막 창제한 한글의 동활자로 찍어낸 <석보상절>과 <월인천강지곡>을 토대로 복원해봤다.|한국기술교육대 연구팀 제공
■한글창제 후 첫번째 프로젝트
훗날 왕위에 오른 수양대군, 즉 세조는 1459년(세조 5년) <석보상절>과 <월인천강지곡>의 합본인 <월인석보>의 서문에 자초지종을 기록했다.
“세종께서 ‘죽은 이(소헌왕후)의 명복을 빌어주는 것은 전경(독경을 위한 불경)보다 더 큰 공덕은 없을 것이니 네(수양대군)가 석보를 번역하여 만들라’고 명하셔서…<석보상절>을 만들고 훈민정음으로 번역하여…세종에게 올렸더니 읽어보시고 바로 찬송을 지어 이름을 <월인천강지곡>이라 했다.”
인공지능을 활용해서 복원해낸 '니'자와 '텬'자. 모양을 복원한뒤 활자모형을 만들었다.
이 <석보상절> 및 <월인천강지곡>은 어떻게 간행했을까. 1434년(세종 16년) 개발한 갑인자(한자 활자)와 함께 이 두 책을 위해 특별히 주조한 한글 금속활자를 조판해서 간행했다. <석보상절>의 편찬이 1447년 9월에 완료되어 곧 간행된 것으로 보아 한글활자도 이 무렵에 주조된 것으로 보인다.
그러니까 두 책은 훈민정음 창제 후 1년 남짓 지났을 때 주조된, 그야말로 ‘따끈따끈한’ 최초의 한글금속활자로 간행된 것이다. 지금 <석보상절>의 경우 전체 24권 중 7권(6·9·11·13·19·23·24권)만이 전해져 각 권이 보물(제523~523-3호)로 지정됐고, <월인천강지곡>은 583곡 중 194곡이 실린 ‘권상’이 남아 국보(제320호)가 됐다. 하지만 이때 주조한 한글활자는 전해지는 것이 없다.
지금까지 이 두 책(<석보상절> <월인천강지곡>)에 쓰인 한글금속활자를 복원하는 연구는 있었다. 목활자로 각 한글들의 어미자를 일일이 새긴 뒤 이를 주물사주조법에 따라 금속활자로 만드는 방법이었다.(김성수의 ‘월인천강지곡 한글활자복원을 위한 실험주조·조판연구’, <서지학연구> 49권, 한국서지학회. 2011년)
현존하는 <석보상절> 7권 중 권 13과 권 19권, 그리고 <월인천강지곡> 권상을 데이터로 삼아 훈민정음 창제 당시의 한글활자를 복원해보았다. |한국기술교육대 연구팀 제공
■인공지능을 활용한 활자복원
그런데 이번에 570여 년 전 세종대왕이 주조한 최초의 한글금속활자를 최첨단 기술인 인공지능(AI)을 활용하여 분석·복원하는 기법이 처음으로 시도됐다. 정재영·최강선 한국기술교육대 연구팀은 “지난 4개월동안 인공지능 기술을 이용해서 현존하는 <석보상절>과 <월인천강지곡>의 활자본을 분석한 뒤 세종대왕 당시의 한글금속활자를 복원하는 과정을 개발했다”고 밝혔다.
정재영·최강선 교수팀은 지난 8일 충북 청주 고인쇄박물관이 개최한 ‘세종의 마음을 찍다’ 특별전 개막에 맞춰 박물관에서 열리는 인문학 토크 콘서트에서 개발내용을 발표하고 3D 기술로 복원한 한글금속활자 8자를 공개했다. 복원한 글자는 ‘월’, ‘인’, ‘천’, ‘강’, ‘지’, ‘곡’과 ‘니’, ‘텬’ 등이다.
두 책의 스캔 영상에서 배경과 번진 흔적 등을 제거하고 글자의 획 영역만을 추출한 뒤 모든 글자의 종류를 인식하고 위치를 파악하는 과정이다. |한국기술교육대 연구팀 제공
연구팀은 또 인공지능을 통해 <월인천강지곡> 권상에 들어간 글자(1만3335자) 가운데 ‘큰 글자(大字)’로 쓰인 한글만 무려 1만자(9988자)에 육박한다는 결과를 처음으로 얻어냈다.
이번에 연구팀이 대상으로 삼은 데이터는 <석보상절> 13권(126쪽)과 19권(85쪽·이상 국립중앙도서관 소장)과 <월인천강지곡 권상>(142쪽·한국학중앙연구원 소장) 등이다.
연구팀은 그 중 11개쪽(<석보상절>과 18개쪽(<월인천강지곡>)을 임의로 골라 컴퓨터 조작을 통해 1만3310개와 9504개의 학습데이터로 증폭시킨 뒤 이를 딥러닝 자료로 썼다.
대상 쪽에서 인식된 글자 중 같은 글자를 골라내는 과정이다. ‘텬’과 ‘니’ 등의 글자를 골라내고 있다. |한국기술교육대 연구팀 제공
‘니’자를 예로 들자면 책 한 권을 만들 때 많은 ‘니’자를 쓸 수 있다. 따라서 각 장마다 다른 ‘니’자 활자가 필요하다. 그러므로 각 장마다 찍힌 ‘니’자 활자는 각도가 1도라도, 굵기가 단 1㎜라도 차이가 날 수 있다. 이와같은 분석을 사람이 일일이 할 수 없다. 컴퓨터 조작을 통해 1도, 1㎜씩 다른 ‘니’자들을 계속 증폭시켜서 인공지능의 딥러닝을 위한 데이터를 확보해야 한다. 그런 학습자료를 2만3000여개를 만든 것이다.
이를 바탕으로 연구팀은 두 책의 스캔 영상에서 배경과 번진 흔적 등을 제거하고 글자의 획 영역만을 추출한 뒤 모든 글자의 종류를 인식하고 위치를 파악했다. 인공지능으로 집계한 글자 빈도의 예를 들면 ‘니’자가 62번, ‘시’자가 54번, ‘이’자가 46번, ‘사’자와 ‘바’자가 32번씩이었다.
이후 인식된 글자 가운데 비슷한 정도를 비교하여 90% 이상 겹치는 글자를 동일활자로 추정한 뒤 하나의 활자로 맞추었다. 최강선 교수는 “이렇게 맞춘 활자를 3D 활자모형으로 복원했다”고 소개했다.
90% 이상 겹치는 글자를 정합해서 하나의 글자를 만드는 과정. 3차원 모형의 ‘텬’자가 완성되었다.|한국기술교육대 연구팀 제공
■붓글씨 사회에서 ‘돋움체’를 창안
연구를 주도한 정재영 교수는 “연구를 진행하면서 훈민정음 창제와 보급을 위해 힘을 쏟은 세종의 분투를 느낄 수 있었다”고 전했다. 정재영 교수는 “특히 세종이 붓글씨만이 존재했던 당대에 ‘돋움체(고딕체)’의 한글을 창제한 것에 새삼 감탄했다”고 전한다.
이른바 ‘돋움체’는 서양에서는 ‘획의 삐침이 없는 글씨체’를 뜻한다. 산세리프, 혹은 고딕체로도 이름붙는 이 글씨체는 서양에서는 그 기원과 관련해서 여러가지 설이 있지만 18~19세기 사이에 유행한 글꼴인 것으로 알려졌다. 그러나 그보다 300~400년 전 조선의 세종이 다양한 획과 굵기로 써제끼는 한자 붓글씨 사회에서 점과 선 만을 이용한 ‘돋움체’의 글자, 즉 한글을 창제할 생각을 한 것이다. 가히 천재적인 영감이 아닌가.
<월인천강지곡>(위 사진)과 <석보상절>. 세종이 천(·) 지(ㅡ) 인(ㅣ)의 원리와 발성기관의 모양에 따라 창제하면서 ‘돋움체’(고딕체)가 되었다. |한국학중앙연구원·국립중앙도서관 소장
정재영 교수는 그것을 훈민정음 창제 원리와 연결짓는다. 즉 세종은 한글의 첫음(자음)은 발성기관의 모양을 본떴고, 가운데 소리(모음)는 하늘(·)과 땅(ㅡ), 사람(ㅣ)을 뜻하는 천지인을 바탕으로 만들었다.
사람의 발성기관을 본떴고, 자연 및 인간의 섭리를 담은 천지인을 떠올려 가장 간단한 점(·)과 선(ㅡㅣ)만으로 표현했는데 어떻게 흘림체나 삐침을 허용할 수 있겠는가. 그러니 지극히 간단하지만 심오한 뜻을 품고 있는 ‘돋움체’로 표현했다는 것이다.
■<월인천강지곡> 권상에만 한글 대자가 1만자
정교수는 또 “인공지능으로 <월인천강지곡>과 <석보상절> 등의 각 1권에 쓰인 활자수를 집계한 결과도 의미심장하다”고 전했다. 인공지능이 계산한 두 책의 글자수는 1만1874자(<월인천강지곡> 권상)와 1만7402자(<석보상절> 권13), 1만1974자(<석보상절> 권19) 등이었다. 그중 <월인천강지곡>의 경우 ‘큰 글자(大字)’ 수가 9988자, ‘작은 글자(小字)’가 3347자였다.
그런데 <월인천강지곡>은 ‘큰 글자(大字)’의 한글을 먼저 배치하고 그 다음에 그 한글글자에 관련된 한자를 ‘작은 글자(小字)’로 삼아 토를 다는 형식으로 구성되어 있다. 말하자면 한글 위주로 된 책이다.
따라서 <월인천강지곡>에 나오는 ‘큰 글자’(9988자)는 모두 한글인 것이다. 물론 그 9988자 중 중복되는 글자가 있기 때문에 주조된 한글활자가 정확히 얼마만큼인지는 알 수 없다. 그러나 현대국어에서도 표현될 수 있는 한글글자가 최소 2350자에서 최대 1만1172자라 한다. 한문은 어떤가. 최소 5만자가 넘는다.
<훈민정음> ‘해례본’(국보 제70호). 목판본인데, 막 창제된 훈민정음을 정교하게 새겼다. ㅏ와 ㅜ , ㅓ를 쓸 때 점(·)을 이용했다. 그러나 <석보상절>과 <월인천강지곡>에서는 ㅏ와 ㅜ ㅗ를 지금처럼 썼다. |간송미술문화재단 소장
그렇다면 지금은 쓰이지 않는 고어(古語)와 한자를 섞어 써야 했던 초창기 세종 시대에는 얼마나 많은 수의 한글과 한자 활자가 필요했을까. 정재영 교수는 “새롭게 창제된 한글 활자와 한자활자를 주조하는 세종대왕과 활자개발 실무자인 이천(1376~1451) 등의 분투를 느낄 수 있다”고 밝혔다.
정교수는 또 동활자를 쓴 <석보상절>과 <월인천강지곡>과, 목판본인 <훈민정음> ‘해례본’과도 다른 곳이 보인다고 전했다. 즉 <훈민정음> 해례본에는 ‘ㅏ’나 ‘ㅗ’ 등을 표현할 때 ‘ㅣ와 ·’ ‘ㅡ’와 ‘·’ 등으로 표현했는데 <석보상절> <월인천강지곡>에서는 지금처럼 ‘ㅏ’와 ‘ㅗ’로 바뀌었다. 초창기부터 좀더 실용적인 활자를 개발하려고 애쓴 흔적이라는 것이다.
세종이 활자의 백미라는 ‘갑인자’를 개발한 1434년이나, 훈민정음 창제 직후 <석보상절>과 <월인천강지곡>을 한글로 번역하고(<석보상절>) 지은(<월인천강지곡>) 1447~1448년이 어떤 때인가.
1434년이면 서양의 요하네스 구텐베르크(?~1468)가 인쇄술의 걸음마도 떼지 못했거나 막 내딛었던 때였고, 1447~48년은 어느 순간 금속활자술을 터득하고 고향인 마인츠로 돌아오던 때였다. 이 무렵 세종은 ‘지혜로운 사람은 아침나절이 되기 전에 어리석은 사람이라도 열흘이면 배울 수 있는’ 쉬운 글자를 창제하고 이를 곧바로 금속활자로 찍어내느라 동분서주하고 있었다.
이번 프로젝트를 진행한 정재영·최강선 교수는 “앞으로 <월인천강지곡>과 <석보상절>에 쓰인 한글활자가 대체 몇자인지를 제대로 분석하고 복원하는 작업에 힘을 쏟을 것”이라고 밝혔다. 경향신문 선임기자