주메뉴바로가기 본문바로가기
전체메뉴
HOME > Target@Biz > 비즈

말하는 대로 자막 달아주는 AI, '영상 노가다' 구세주 되나

슈퍼 개발자 남세동 '브류' 사용자 간담회…'패턴'으로 구현해 단순작업 줄여

2018.10.26(Fri) 18:19:00

[비즈한국] “여러분, 5분짜리 영상을 만들기 위해 제가 몇 시간을 투자하는 줄 아십니까?” 유투버들의 단골 투정이다. 가끔 유투버들은 자신이 영상 만드는 과정인 ‘필름메이킹’ 콘텐츠를 올린다. 그때마다 ‘노가다’로 불리는 단순작업이 얼마나 고통스러운지 하소연한다.

그럴 만도 하다. 스마트폰으로 언제 어디서든 영상을 보는 시대에선 영상에 자막을 다는 것이 필수인 까닭에서다. 자막을 달기 위해선 우선 내가(유투버가 자기를 찍은 영상이라고 가정했을 때) 무슨 말을 했는지 일일이 받아 써야 한다. 이 작업을 하다 보면 사람이 5분 동안 얼마나 많은 말을 할 수 있는지 깨닫게 된다. 5분짜리 영상을 만들기 위해서 5분만 촬영할까. 아니다. 봉이 김선달처럼 청산유수 말할 자신이 없다면 1시간은 떠들어야 ‘쓸 만한 5분’​이 나온다.

‘슈퍼 개발자’ 남세동 보이저엑스 대표는 2015년 네이버를 그만두고 딥러닝 기술에 빠지더니 스타트업을 차렸다. 사진=박정훈 기자


영상을 올리면 자동으로 자막을 달아주는 프로그램이 있다면 어떨까. 아마 영상 편집자라면 쌍수를 들고 환영할 터. ‘슈퍼 개발자’로 손꼽히는 남세동 보이저엑스 대표가 선보인 ‘브류(Vrew)’는 영상에 담긴 음성을 모두 텍스트로 바꿔준다. 아, 물론 그런 서비스는 예전에도 있었다. 비슷한 거 아니냐고? 브류는 정확도가 90%가 넘는다.

참고로 초등학교 4학년 때 받아쓰기 하는, 딱 그 수준이다. 영어가 섞인 단어나, 신조어, 전문적 학술 용어의 인식률은 좀 떨어진다. 하지만 초등학생 4학년이 단어 몇 개 틀리게 적었다고 그 단어가 무슨 단어인지 맥락을 파악하지 못하랴. 브류는 현재 간단한 컷 편집 기능만 제공한다. 남세동 대표는 브류를 영상 편집 툴로 키울 계획이지만, 현재로서도 훌륭한 ‘초벌 편집’ 역할을 해내고 있다.

# 딥러닝 기술을 활용한 동영상 편집 툴, 브류(Vrew)

받아쓰기 정확도 90%, 어떻게 가능했을까? 핵심은 딥러닝 기술이다. 딥러닝 기술은 사람마다 각자가 가지고 있는 언어 습관을 찾아내 학습한다. 브류는 그 정보를 바탕으로 최대한 실제 대화에 가깝게 대화를 구현한다. 딥러닝 기술은 방대한 데이터를 학습해 그 속에 숨어 있는 ‘패턴’을 찾아낸다. 

남 대표는 네오위즈 인턴 시절 세계 최초의 웹 기반 채팅 서비스 ‘세이클럽’을 직접 만든 인물이다. 2005년 네이버에 350억 원에 인수된 검색엔진 ‘첫눈’ 개발에 참여했고, 2011년 ‘라인카메라’를 선보였다. 그는 최근 전 세계 3억 다운로드를 돌파한 애플리케이션(앱) ‘B612’를 탄생시킨 주인공이기도 하다. 2015년 남 대표는 네이버를 퇴사해 ‘딥러닝’에 푹 빠졌다. 급기야 창업에 이르렀다. 

브류(Vrew)는 영상에 담긴 음성을 자동으로 텍스트로 변환해 준다. 자막까지 자동으로 달아 준다. 타임라인은 스크립트 형태로 나타나기에 직감적으로 필요한 편집 점을 찾을 수 있다.  사진=보이저엑스 홈페이지 캡처


음성을 텍스트로 변형하니 놀라운 변화가 생겼다. 편집 타임라인을 ‘바’ 형태가 아닌 마치 워드프로세서나 파워포인트 형태로 구성할 수 있게 됐다. 영상 속 ‘나’가 언제 어디서 어떤 말을 했는지 한눈에 파악이 가능하다. 또한 영상에 들어갔으면 하는 말들이 잘 이어지게끔 직감적으로 편집 점을 찾아낼 수 있다. 가령 ‘바보’라는 텍스트를 클릭하면 ‘바보’라고 말한 영상 부분을 찾을 수 있고, ‘바보’라는 텍스트를 지우면 ‘바보’라고 말한 영상 부분이 지워진다.

영상 편집에서 ‘컷편집’은 흔히 ‘노가다’로 불리며 상당한 시간을 잡아먹는다. 브류는 컷편집 시간을 획기적으로 줄여주는 것. 남 대표는 “영상을 찍고 편집하다 보니까 창의적인 활동보다도 단순작업에 드는 시간이 너무 많다는 걸 깨달았다. 이 시간만 줄여도 나머지 에너지는 더 나은 콘텐츠를 만드는 데 쓸 수 있지 않을까 생각했다”며 “실제로 1시간 걸리던 작업이 5분으로 줄었다”고 설명했다.

# “패턴 분석이 가능한 모든 일은 인공지능이 예측 가능”

남 대표를 만난 건 지난 24일, 보이저엑스에서 마련한 브류 사용자간담회에서다. 전문 영상 편집자들이 모여 브류를 피드백하는 자리였다. 오후 7시에 시작한 간담회는 오후 9시쯤 끝났다. 이후 네트워킹 시간이 이어졌다. 딥러닝 기술의 미래가 가장 큰 화두였다. 한 참석자가 남 대표에게 물었다. “과거의 데이터를 분석해 미래를 예측하는 게 가능할까요?” 남 대표는 답은 간단했다. 

“과거의 데이터에서 패턴을 찾을 수 있다면 그것을 활용해 미래를 예측할 가능성이 높아집니다.”

남 대표는 “결국 딥러닝 기술이 하는 것은 ‘패턴’을 찾는 거다. 알파고가 이세돌을 이길 수 있었던 건 수백, 수천 개의 이세돌 경기를 분석해 그의 패턴을 찾아냈기 때문이다. 패턴을 찾아낼 수 없다면 예측을 할 수 없을지도 모른다. 하지만 우리가 기존에 패턴이 없다고 생각하던 것에도 패턴이 있을 수 있다는 점을 간과해선 안 된다”고 답했다.

브류 사용자 간담회에는 영상 편집을 업으로 하는 사람들이 모여 각자 의견을 주고받았다. 남세동 대표는 컷편집에 드는 단순노동 시간을 줄이고 싶었다고 설명했다. 사진=박정훈 기자


이어 그는 “폐암의 종류가 다양한데 의사들은 그것을 육안으로 구분하지 못하지만, 딥러닝은 구분한다. 우리가 몰랐던 패턴이 있었던 것”이라며 “딥러닝은 결국 사람이 직감적으로 하던 일을 대체할 거다. 예를 들어 소의 짝짓기 시기를 농부는 감각으로 아는데, 현재 인공지능(AI)이 그 패턴을 파악해 정확한 날짜까지 짚어낸다. 농부는 인공지능이 시키는 날에 짝짓기 시키면 된다. 앞으로 단순노동 시간을 줄고 창의력을 더욱 발휘하게 될 것”이라고 덧붙였다.

남 대표는 참석자들이 겪고 있는 어려움을 딥러닝 기술을 활용해 보완할 수 있다는 것을 짚어내기도 했다. 그중 하나는 ‘DI 작업’이다. DI 작업은 영상 후반부에 여러 영상을 균일하게 색 보정 하는 일이다. 외주를 쓸 만큼 많은 시간과 품이 들어가지만 딥러닝을 기술을 활용하면 단숨에 해결할 수 있다는 것. 한 참석자는 “몇천 만 원을 들여서라도 사고 싶은 기술”이라고 관심을 보이기도 했다.

남 대표는 “2~3년 걸린다고 예상했던 게, 2~3개월 만에 해결되기도 한다. 딥러닝 분야는 구글, 네이버, 카카오 등 대형 기업에 집중하고 있어 발전 속도를 예단하기 어려울 정도”라고 강조했다.​

 

박현광 기자

mua123@bizhankook.com

[핫클릭]

· 유명세만 있고 책임은 안 지는 SNS '1인 마켓'
· 우버 창업자의 '공유주방' 한국 상륙, 라이벌은 백종원?
· [단독] 최순실 옥중 재테크? 하남 부동산 팔아 1.4억 시세차익
· [단독] 20개월째 대금 미지급…K2 전차 국산화 실패 '줄도산' 현실화
· 남세동 보이저엑스 대표가 밝힌 '슈퍼 개발자'의 최소 조건


<저작권자 ⓒ 비즈한국 무단전재 및 재배포 금지>