NEWSLETTER

인공지능이 인간의 번역을 대체할 수 있는 이유 네 가지, 그리고 대체할 수 없는 이유 단 한 가지.

작성자
렉스코드
작성일
2020-02-27 18:42
조회
994

인공지능 기반의 자동번역 발전 속도가 눈부시다. 1~2년 전과 비교해서는 말할 것도 없고, 불과 서너 달 만에도 향상된 성능을 보여주고는 한다. 구글은 물론 국내 기업 네이버도 방대한 양의 언어 데이터와 전문 용어를 수집하면서 자동번역 성능을 가속화하고 있다. 이런 상황에서 인공지능 번역이 인간의 번역을 대체할 수 있는 이유 네 가지와 절대로 대체할 수 없는 이유 한 가지를 짚어 본다.

 

#자동번역이 인간의 번역을 대체할 수 있는 이유 네 가지

 

하나, 자동번역은 기술의 축적이 가능하다.
모든 인간은 태어나서 ‘엄마’라는 단어부터 똑같이 언어를 배워야 하며 그가 죽는 순간 그가 습득한 모든 언어 지식도 생명이 끝난다. 그의 다음 세대는 또다시 ‘엄마’부터 언어를 배우기 시작한다. 이에 반해서 자동번역은 수집된 언어 데이터뿐만 아니라 그것을 처리하는 기술 또한 100% 이전이 가능하고, 후대는 이 기술을 기반으로 더 나은 기술을 발전시켜 나갈 수 있다. 뿐만 아니라 자동번역은 수많은 사람들이 공동으로 개발, 발전시킬 수 있고 서로의 장점을 쉽게 이식하거나 학습시킬 수 있다. 이와 같은 과정이 반복되면 인간보다 자동번역의 수준이 높아질 것이다.

 

둘, 컴퓨팅 성능이 발전하고 있다.
현재 자동번역을 학습시키는 방법은 수십만에서 수백만 개에 달하는 언어 데이터를 인공지능 알고리듬(NMT)를 사용하여 원문과 번역문 간의 상호 연관성(패턴)을 찾도록 하는 것인데, 이것을 수행하기 위해서는 고성능 그래픽 카드를 장착한 컴퓨터가 필요하다. 또한 컴퓨터만 있다고 한 번에 뚝딱 되는 것이 아니라, 연산을 완성하는 데에는 데이터의 양에 따라 며칠 또는 몇 주라는 시간이 걸린다. 즉, 한번 테스트해서 결괏값을 보는데 수일에서 수 주가 걸린다는 말이다. 이런 상황에서 최근 구글은 기존의 슈퍼컴퓨터로는 1만 년이 걸리는 수학 연산을 시카모어라는 양자 컴퓨터를 통해 200초 만에 풀었다는 뉴스를 발표했다. 만약 이것을 이용해서 자동번역 연산을 수행한다면 데이터를 입력하는 즉시 학습된 엔진을 얻을 수 있을 것이다. 이처럼 비약적인 컴퓨팅 성능의 발전은 궁극적으로 거의 무제한의 데이터를 단시간에 학습할 수 있는 인공지능의 출현을 기대하게 하는 대목이다.

 

셋, 방대한 데이터를 수집하고 활용할 수 있다.
내가 하나의 문장을 쓰는 1분 동안 550명의 새로운 사용자가 SNS에 유입되고, 약 50만 건의 트윗이 생성되며, 400시간 분량의 비디오가 유튜브에 업로드되고 있다. 앞 문장을 쓴 1분 동안 페이스북에서는 50만 건 이상의 글이 새롭게 포스팅되었고, 13만 6천 장 정도의 사진이 업로드되었다. 구글에서는 매분 35억 건의 검색이 발생하고 있다. 이러한 활동을 통해서 우리는 매일 2,500,000,000,000,000,000바이트의 정보를 생성하고 있다. 인간은 하루에 책 한 권도 읽기 힘들다. 현대사회에서 쏟아지는 정보를 습득하기에는 택도 없는 분량인 것이다. 이에 비해 컴퓨터는 이 모든 정보를 크롤링(Crawling)해서 학습할 수 있다. 번역 능력이라는 것은 결국 자신이 학습한 정보에 비례한다고 전제할 때, 인간은 절대 컴퓨터를 능가할 수 없다.

 

넷, 휴먼번역으로 감당하기 불가능한 양의 정보가 생성된다.
당사의 최고로 숙달된 번역사는 하루에 20~30페이지 정도의 번역 분량을 소화할 수 있다. 일반적으로는 하루 10페이지를 적정 한계로 본다. 회사 단위에서 보자면 우리 회사는 매일 약 1천여 장의 번역을 처리해야 매월 약 5억 원의 매출을 유지할 수 있다. 하지만 만약 이것을 컴퓨터가 한다고 하면 현재 컴퓨팅 성능으로도 하루나 이틀이면 충분하리라 생각한다. 이처럼 사람에 의존하는 번역은 현대 사회에서 생성되는 정보의 속도를 처리하기에 본질적으로 불가능하다. 그리고 인간이 번역하고 부족한 부분을 기계가 채워줄 것이라는 말도 간혹 있는데, 이것은 맞지 않다. 엄밀하게 말해서 기계가 번역하고 부족한 부분을 인간이 채워준다고 말하는 것이 맞을 것이다.

 

하지만 이러한 네 가지 이유에도 불구하고, 자동번역이 인간의 번역을 대체할 수 없는 이유 단 한 가지.

“기계는 인간처럼 번역할 수 없다.”

 

 

요즘 화제인 영화 「기생충」의 한 대사다. 화면에서 보이는 대사 중 ‘서울대학교’를 ‘Seoul National University’로 번역했다면, 그리고 ‘짜파구리’를 ‘Jjapaguri’와 같이 음역하는 정도로 그쳤다면 해당 영화가 해외의 유수 영화제에서 외국어 영화상 등을 휩쓸 수 있었을지 의문이다. 사람은 서울대를 옥스퍼드로 번역할 수 있고 ‘옥스퍼드’ 대신 ‘하버드’를 넣어도 된다는 것을 판단할 수 있다. 그렇다고 프린스턴이나 동경대와 같은 이름을 사용하진 않는다. 말의 맥락이 달라진다는 것을 ‘판단’할 수 있기 때문이다. 이러한 판단은 기계가 수집하여 학습하기 불가능한 정도의 광범위한 비정형적 데이터 즉, 개인의 경험, 지식, 문화적 배경, 역사, 국가 간 상관관계 등을 기초로 형성될 뿐만 아니라, 이 대사를 통해서 달성하고자 하는 의도까지 파악할 수 있어야 가능한 것 때문에, 단순히 언어 간 상관관계를 맵핑하여 룰을 찾아내는 현재의 인공지능 방식으로는 영원히 노력해도 도달할 수 없는 영역이라고 확신할 수 있다. 컴퓨터에게는 수십만 개의 기보를 학습하여 룰을 익히는 것보다, 반지하에 사는 배우가 던진 대사 한마디의 맥락을 파악하는 것이 훨씬 더 어려운 일이다.

 

이와 같은 경우는 매우 특수한 사례가 아니냐고 반문할 수도 있을 것 같은데, 실은 이 사례는 일반 대중의 이해를 돕기 위하여 요즘 유행하는 영화의 예를 든 것일 뿐, 전문 번역의 영역에서는 이와 같은 판단을 기초로 하지 않고는 단 한 장의 번역도 제대로 완성할 수 없는 경우가 대다수라고 말할 수 있다. 예를 들어 당사가 한국관광공사와 함께 진행하고 있는 프로젝트의 경우, 연간 수천 개에 달하는 국내 음식명, 문화재, 관광지명과 같은 용어가 이와 같은 과정을 통해서 번역되고 있다.

 

<한국관광공사-외국어 관광안내 표기 개선을 위한 외국어 번역/감수 프로젝트 예시>


 

#결론은?

 

휴먼번역과 자동번역, 그래서 누가 더 낫냐고 물어본다면 질문의 관점부터 잘못된 것이라고 답할 것이다. 태극기에 있는 빨간색과 파란색 중 어떤 색이 더 낫냐고 물어본다면 여러분은 과연 뭐라고 답할 것인가? 언어는 인간의 지식과 경험, 감정을 총체적으로 표현하는 수단이다. 그중 기계가 잘 할 수 있는 영역은 분명히 있으며, 우리는 그것을 기계에게 맡기면 되고, 또 마찬가지로 기계는 할 수 없는, 사람만이 할 수 있는 영역은 우리 사람이 하면서 함께 협업하는 것이 답이다.



렉스코드 대표 함철용
yham@lexcode.com

전체 3

  • 2020-03-02 10:03

    예전과는 앞날을 예측할 수 없는 복잡계에 살고 있는 지금, 번역하는 입장에서 다시한번 생각해 보게 하는 글이네요^^
    양으로는 인간이 절대 따라갈 수 없죠. 하지만 상황에 따른 번역의 질은 아직은 인간이 우수하지 않을까 생각해 보아요.
    좋은글 감사합니다. 잘 읽고 갑니다.~~~


  • 2020-03-02 11:06

    20년 가까이 번역으로 먹고 살아온 사람으로서, 격하게 공감합니다. 기계가 잘하는 영역이 많겠지만 인간을 따라올 수 없는 영역도 분명히 있습니다. 그런 영역에서 경쟁력을 갖춘다면 앞으로 20년 정도는 더 번역으로 먹고 살 수 있겠죠?
    저도 잘 읽고 갑니다.^^


  • 2020-03-02 13:24

    이세돌과 알파고가 대결한다고 알려졌을때 반응이 바둑이라는 것은 경우의 수가 무궁무진하고 도의 경지에 오른 종목이라서 기계가 따라잡는 것은 무리다(적어도 당시로는) 라는 의견이 대세였다고 기억되는데..결국 알고보니 바둑이라는 것도 어떤 패턴, 경우의 수가 무한대로 커지면 다 따라잡을 수 있다는걸로 결론이나서 허탈해졌던 기억이 나네요.. 결국 번역도 시간문제일걸로 보이고,, 이 시간은 지수적으로 가까워질듯..


전체 257
번호 썸네일 제목 작성자 작성일 추천 조회
공지사항 렉스코드 원격근무 실시합니다.
렉스코드 원격근무 실시합니다.
렉스코드 원격근무 실시합니다.
렉스코드 | 2020.03.04 | 추천 6 | 조회 1138
렉스코드 2020.03.04 6 1138
256 인공지능이 인간의 번역을 대체할 수 있는 이유 네 가지, 그리고 대체할 수 없는 이유 단 한 가지.
인공지능이 인간의 번역을 대체할 수 있는 이유 네 가지, 그리고 대체할 수 없는 이유 단 한 가지.
인공지능이 인간의 번역을 대체할 수 있는 이유 네 가지, 그리고 대체할 수 없는 이유 단 한 가지. (3)
렉스코드 | 2020.02.27 | 추천 10 | 조회 994
렉스코드 2020.02.27 10 994
255 달력을 샀다.
달력을 샀다.
달력을 샀다.
렉스코드 | 2020.02.27 | 추천 6 | 조회 246
렉스코드 2020.02.27 6 246
254 꼭 짚어주마! 렉스코드가 알려주는 쓸만한 번역회사 2편
꼭 짚어주마! 렉스코드가 알려주는 쓸만한 번역회사 2편
꼭 짚어주마! 렉스코드가 알려주는 쓸만한 번역회사 2편
렉스코드 | 2020.02.27 | 추천 2 | 조회 319
렉스코드 2020.02.27 2 319
253 WHO부터 G20까지, 에퀴 통역 프로젝트 Best 5
WHO부터 G20까지, 에퀴 통역 프로젝트 Best 5
WHO부터 G20까지, 에퀴 통역 프로젝트 Best 5
렉스코드 | 2020.02.27 | 추천 3 | 조회 211
렉스코드 2020.02.27 3 211
252 나를 기억하는 곳
나를 기억하는 곳
나를 기억하는 곳
렉스코드 | 2020.02.27 | 추천 5 | 조회 207
렉스코드 2020.02.27 5 207
251 [번역 안내문 공유] 신종 코로나바이러스 감염 예방, 이렇게 하세요!
[번역 안내문 공유] 신종 코로나바이러스 감염 예방, 이렇게 하세요!
[번역 안내문 공유] 신종 코로나바이러스 감염 예방, 이렇게 하세요!
렉스코드 | 2020.02.07 | 추천 4 | 조회 953
렉스코드 2020.02.07 4 953
250 이거 번역하고 싶은데 어떻게 하면 되나요?
이거 번역하고 싶은데 어떻게 하면 되나요?
이거 번역하고 싶은데 어떻게 하면 되나요?
렉스코드 | 2020.01.30 | 추천 5 | 조회 972
렉스코드 2020.01.30 5 972
249 우리 시대의 봄날은…
우리 시대의 봄날은…
우리 시대의 봄날은…
렉스코드 | 2020.01.30 | 추천 2 | 조회 269
렉스코드 2020.01.30 2 269
248 DTP, nothing's impossible.
DTP, nothing's impossible.
DTP, nothing's impossible.
렉스코드 | 2020.01.30 | 추천 2 | 조회 237
렉스코드 2020.01.30 2 237
247 천국을 가기 위한 질문, “인생에서 기쁨을 찾았는가?”
천국을 가기 위한 질문, “인생에서 기쁨을 찾았는가?”
천국을 가기 위한 질문, “인생에서 기쁨을 찾았는가?”
렉스코드 | 2020.01.30 | 추천 2 | 조회 237
렉스코드 2020.01.30 2 237
246 2020년의 프롤로그, 렉스코드 시무식
2020년의 프롤로그, 렉스코드 시무식
2020년의 프롤로그, 렉스코드 시무식
렉스코드 | 2020.01.30 | 추천 3 | 조회 362
렉스코드 2020.01.30 3 362
245 [통역동향] 묵직한 ‘7080 중동붐’과 어여쁜 ‘1020 중동붐'
[통역동향] 묵직한 ‘7080 중동붐’과 어여쁜 ‘1020 중동붐'
[통역동향] 묵직한 ‘7080 중동붐’과 어여쁜 ‘1020 중동붐'
렉스코드 | 2020.01.28 | 추천 1 | 조회 241
렉스코드 2020.01.28 1 241