주메뉴바로가기 본문바로가기
전체메뉴
HOME > Target@Biz > 비즈

접속장애로 드러난 '페이스북 인공지능'의 실체

머신러닝으로 이미지 학습하고 분석…놀라운 발전 속도에 사생활 침해 우려

2018.11.22(Thu) 17:52:33

[비즈한국] 동료가 “페이스북이 신기한 걸 보여준다”며 캡처 화면을 보냈다. 화면은 사람들과 함께 찍은 사진들이 깔려 있었는데 단순히 사진을 보여주는 데에서 끝나는 게 아니라 사진에 대한 설명이 글로 함께 표현됐다. ‘사람 3명, OOO님 포함, 웃고 있음, 선글라스, 근접촬영’ 같은 식이다.

 

사실 이 화면은 페이스북이 직접 사진을 설명하는 화면을 보여준 건 아니다. 피드를 읽어들일 때 인터넷 접속이 불안해서 이미지가 깨졌고, 대신 사진에 대한 설명이 텍스트로 드러난 것이다. 내용은 기가 막힌다. 사진 속 사람들의 이름은 물론이고 ‘앉아 있는 중’ ‘음료’ ‘실내’를 비롯해 ‘근접촬영’ 같은 설명이 붙는다. 사진의 내용을 ‘읽는다’는 의미다.

 

이미지를 분석하는 것은 페이스북을 비롯해 사진을 콘텐츠로 다루는 서비스들의 필수 기술이다. 머신러닝을 통해 반복적으로 이미지를 학습하고 분석할 수 있게 되면서 그 정확도는 급격히 좋아지고 있다. 이제는 사람이 사진을 이해하는 것처럼 맥락을 읽어들이는 단계로 접어들었다. 이는 곧 사진을 다양한 문장으로 검색할 수 있다는 뜻으로도 통한다.

 

페이스북이 사진 분석을 하는 것은 어제오늘의 일은 아니다. 이미 이미지 분석을 통해 사람들의 얼굴을 학습해왔고, 사진을 바탕으로 피드(글)에 주변 사람들을 태그하도록 했다. ‘사진 속의 사람이 이 사람 맞니?’라는 자연스러운 방법으로 얼굴을 분석한 셈이다. 페이스북은 이를 보안 용도로 활용하기도 했다.

 

페이스북 서비스 장애로 인해 우연히 페이스북이 이미지를 어떻게 데이터화하는지가 노출됐다. 사진=최호섭 제공

 

새로 로그인하는 기기에서 본인 인증의 방법 중 하나로 자주 대화를 주고받는 페이스북 친구들의 얼굴을 보여주고 이름을 맞히도록 했다. 기기가 사람을 시험하는 것처럼 보이기도 한다. 하지만 보안의 방법으로 이용자에게 부담이 적으면서도 효과는 확실하다.

 

사진 분석이라고 하면 구글을 떼어놓고 이야기할 수 없다. 구글은 오래전부터 이미지를 검색하기 위해 많은 노력을 기울였다. 특히 텐서플로를 비롯한 머신러닝 기술이 자리를 잡으면서 구글의 이미지 검색은 그 정확도가 놀랍도록 빠르게 좋아지고 있다. 특히 구글 포토는 사진 보관과 검색에 새로운 획을 그었다. 이용자가 따로 해시태그 등으로 분류하지 않아도 구글 포토는 사람, 사물, 위치 등을 읽어낸다.

 

물론 초기에는 적지 않은 오류가 있었다. 대표적인 사례가 한 흑인 여성을 침팬지라고 분류한 것이다. 종종 말썽을 빚기도 했지만 머신러닝은 실수를 다시 반영하면서 그 정확도를 꾸준히 높이고 있다. 때로는 그 정확도에 놀라움을 넘어 두려움이 생길 정도다. 대표적인 것이 아이들의 얼굴인데, 빠르게 성장하면서 얼굴이 계속 변하는 것까지 구글 포토는 정확히 읽어낸다. 이용자들이 놀라는 것을 비웃기라도 하듯 구글은 ‘우리 아이의 폭풍성장’처럼 비슷한 내용의 과거 사진을 묶어서 하나의 작품을 보여주기도 한다.

 

네이버나 카카오도 비슷한 서비스를 갖고 있다. 이미지는 인터넷에서 구할 수 있는 가장 대표적이고 기본적인 머신러닝의 학습 도구이기 때문이다. 사진을 적절한 주제로 분류하는 것은 인공지능 기반의 서비스 중에서 가장 결과물이 확실하게 드러나는 사례다.

 

구글 포토 서비스는 사용자가 별도로 태그를 달지 않아도 알아서 사진을 분석해 장소나 사진 설명을 붙여준다. 사진=최호섭 제공

 

무엇보다 광고가 중심이 되는 소셜미디어, 혹은 검색 관련 기업들로서는 엄청난 양의 이미지 데이터가 쌓이면 그 안에서 가치가 만들어진다. 사진 속의 내용을 읽을 수 있게 되면 이용자가 올리는 사진을 바탕으로 개개인의 관심사를 분류할 수 있다. 이는 곧 적절한 광고와 연결될 수 있다. 

 

또 개개인뿐 아니라 이용자들이 올리는 막대한 양의 사진을 통해 지역별, 연령별, 성별 등의 관심사 데이터를 뽑아낼 수 있다. 사진은 텍스트보다 분석이 어렵지만 그 안에는 많은 데이터가 담길 뿐 아니라 내용과 목적이 더 명확하기 때문에 더욱 가치가 높다.

 

이 이미지 분석은 점점 더 진화하고 있다. 대표적인 것이 카메라를 통한 실시간 분석이다. 구글은 지난해 개발자 컨퍼런스를 통해 ‘구글 렌즈’라는 서비스를 발표했다. 스마트폰의 카메라를 켜고 사물을 비추면 구글이 실시간으로 피사체를 분석해준다. 강아지의 품종이나 외국어 번역 등 늘 검색하고 싶었던 궁금한 것들을 해결해주기도 하고, 무선공유기에 연결할 수 있는 비밀번호를 찍으면 자동으로 무선랜에 접속해주기도 한다. IT 기업들이 꿈꾸던 ‘세상을 검색한다’는 말이 현실로 다가오는 것이다.

 

하지만 이를 마냥 즐겁게만 바라보기는 어렵다. 페이스북과 구글의 이미지 검색은 여전히 ‘개인정보’라는 위험을 안고 있다. 특히 페이스북은 서비스 안에서 사람들의 얼굴을 분석하고, 끊임없이 이름과 연결한다. 감시와 사생활 침해라는 지적에서 자유로울 수 없다. 때로는 무서울 정도이니 말이다. 

 

하지만 그 자체가 페이스북의 가장 큰 강점이라는 부분도 인정할 수밖에 없다. 데이터를 함부로 수집하지 않는 애플까지 가세하면서 이미지 분석은 기술의 완성도뿐 아니라 윤리적인 면에서도 시험대에 오르고 있다.​ 

최호섭 IT 칼럼니스트

writer@bizhankook.com

[핫클릭]

· [멋진신세계] 에어팟에 도전장, 자브라 '엘리트 액티브 65T' 블루투스 이어폰 리뷰
· '광고만 보고 사는 가장 비싼 물건' 아파트 분양제 바뀔까
· 이건희의 5대 신수종 사업 중 '이재용의 미래 플랜'에 남은 건?
· [골목의 전쟁] 대량생산시대에 '수제'가 넘쳐나는 이유
· '성장 끝 vs 새 수요' 반도체 경기를 둘러싼 논란


<저작권자 ⓒ 비즈한국 무단전재 및 재배포 금지>