[현장] 인공지능은 결국 플랫폼의 조련이 필요한 천재견

[비즈한국] 구글 클라우드의 새로운 서비스들과 비전, 생태계 등을 소개하는 컨퍼런스인 '구글 클라우드 서밋 2024'가 지난 6월 27일 서울 장충체육관에서 열렸습니다. 기업 대상의 크고 작은 클라우드 행사들은 수시로 열리고, 구글 클라우드 서밋도 매년 많은 사람들이 모여듭니다. 하지만 올해는 분위기가 사뭇 달랐습니다. 바로 인공지능(AI), 특히 대규모 언어 모델(LLM) 때문입니다.

'구글 클라우드 서밋 2024'는 인공지능, 특히 대규모 언어 모델(LLM)에 대한 뜨거운 관심 속에 서울 장충체육관에서 열렸다. 클라우드보다는 인공지능에 초점을 맞춘 이번 행사는 많은 참관객들이 모여 구글의 ‘인공지능 서밋’으로 느껴질 만큼 열띤 분위기를 연출했다. 사진=최호섭 제공

키노트가 열린 장충체육관에 들어서며 깜짝 놀랐습니다. 작은 공간이 아닌데다가 무대 배치나 1층 자리까지 그 규모는 이 자리에서 열리는 공연들 못지않았습니다. 자리는 거의 가득 찼고, 관심도도 대단해 보였습니다. 그리고 키노트부터 세션까지 거의 모든 내용이 인공지능과 맞물려 있었습니다. 클라우드는 거들 뿐이고 구글도, 참관객들도 구글의 '인공지능 서밋'을 만들어가는 듯했습니다.

종일 수많은 발표를 듣고 사람들과 마주치며 IT 시장의 두 가지 흐름을 읽을 수 있었습니다. 생성형 AI가 단순한 유행이 아니라 성큼 다가온 현실이라는 점, 그리고 생성형 AI가 하나의 단독 앱이나 서비스가 아니라 복합적인 플랫폼 생태계를 갖추어 나가고 있다는 점입니다.

#눈 떠 보니 현실이 되어 있는 생성형 AI

실제로 많은 기업들이 생성형 AI를 현업에 활용하고 있습니다. 엔씨소프트는 바르코(VARCO)라는 이름으로 게임 개발에 필요한 시나리오, 캐릭터, 이미지, 그리고 대사와 사운드까지 만들어내는 통합 생성형 AI 서비스를 제공합니다. 엔씨소프트는 키노트에서 바르코가 만드는 결과물들을 공개했는데, 인공지능이 만들어낸 것이 아니라 우리가 게임에서 흔히 만날 수 있는 약간 '간지러운' 느낌까지 자연스럽게 담아냈다는 인상을 주었습니다.

실제 게임 개발에서 시나리오 개발과 그에 따른 캐릭터 구성, 그 캐릭터들이 나누는 대사는 상당히 많은 시간과 노력이 들어가는 작업입니다. 한마디로 개발 기간이 결정되고, 이는 개발 비용과도 연결됩니다. 그에 비해 게임의 유행은 더 빨리 움직이고, 이용자들이 게임을 접하는 주기는 더 짧아집니다. 이전처럼 하나하나 사람의 혼이 담긴 결과물들이 아쉬운 것은 사실이지만 생성형 AI가 만든 것의 이질감이 가장 덜 느껴지는 것이 게임이기도 합니다.

기존 게임들의 데이터베이스를 바탕으로 게임 내 미션과 퀘스트를 만들어내기도 합니다. 퀘스트는 게임의 수명을 늘리는 가장 중요한 콘텐츠인데, 생성형 AI는 이를 잔뜩 생성해내고 기획자는 이를 선별해서 가다듬으면 됩니다. 사실상 무한히 퀘스트를 만들 수 있는 셈입니다. 심지어 인공지능이 제 맘대로 사실이 아닌 이야기를 지어내는 '환각 현상'이 더 강렬하게 이뤄질수록 게임적 상상력은 돋보이게 마련입니다.

카카오헬스케어의 사례도 흥미롭습니다. 카카오헬스케어는 최근 국내 대형 의료 기관들의 데이터를 함께 공동으로 연구할 수 있는 인공지능 플랫폼을 개발했습니다. 각 병원이 오랫동안 쌓아온 임상 데이터와 연구 기록은 높은 가치를 갖고 있지만 인공지능 기술을 더해서 깊은 통찰력을 얻으려면 더 큰 규모의 데이터가 필요합니다. 하지만 의료 데이터는 개인정보, 그리고 의료 그 자체로서의 민감도를 갖고 있기 때문에 데이터가 함부로 유통되기 어렵습니다. 병원의 가장 큰 자산 중 하나이기도 합니다. 그래서 카카오헬스케어는 병원들이 손잡고 서로 데이터는 주고받지 않지만 인공지능을 통해 각자의 데이터를 해석하고, 그 결과를 하나로 통합해서 큰 성과를 만들어내는 '연합 학습'을 적용했습니다. 의료 데이터가 병원을 벗어나지 않으면서도 그 가치를 높일 수 있는 방법입니다.

이날 서밋에는 여러 기업들이 생성형 AI를 실무에 적용하는 사례가 발표되었다. 발표를 맡은 기업들은 보안과 신뢰성 문제를 해결하며 AI를 상업적으로 활용할 수 있는 길을 앞다투어 제시했다. 사진=최호섭 제공

#보안과 신뢰성, 흔들리는 인공지능 기술의 장벽

이렇게 인공지능 기술은 그 영역과 범위를 가리지 않고 가장 예민한 부분까지 적용되고 있습니다. 특히 몇 가지 현실적인 문제점들이 허물어지면서 관심도는 급격하게 커지고 있습니다.

일단 데이터의 보안입니다. 인공지능 기술이 매력적인 것은 사람처럼 실제 행동들을 통해서 '학습'이 이뤄지기 때문입니다. 끊임없이 배우고, 그걸 토대로 더 나은 무엇인가를 만들어내는 것입니다. 그 규모가 커질수록 능력은 거대해지고, 사람과 더 닮아갑니다.

하지만 이는 결국 우리가 인공지능과 나누는 모든 내용이 학습될 수 있다는 위협으로 이어집니다. 나의 사생활, 관심사는 물론이고 기업의 정보, 소프트웨어 소스 코드까지 모두 대화를 나누는 순간 작게나마 인공지능 모델에 영향을 끼칠 수 있습니다. 이 때문에 기업들이 사내에서 생성형 AI를 쓰는 것을 경계하기도 합니다.

이를 풀어내는 것은 결국 플랫폼의 역할입니다. 구글은 거의 '원칙'이라는 느낌으로 데이터가 학습되지 않는다는 점을 강조했습니다. 구글 클라우드 내에서 특히 버텍스 AI라는 창구를 통해 접하는 기업의 인공지능 서비스들은 완전히 격리되고, 그 안에서만 작동하게 됩니다. 학습과 유출이 이뤄지지 않는다는 점이 실제로 기업들에게 투명하게 보고되고 있기도 합니다.

또 하나는 환각입니다. 생성형 AI는 아무리 곤란한 질문이라도 일단 답을 만들어냅니다. 그게 그의 역할이니까요. 그러다 보니 세상에 없는 이야기를 마구 지어내기도 합니다. 이를 할루시네이션, 환각이라고 부릅니다. 보통은 모델의 학습 기간에 따라서 환각이 일어나는 경우가 많습니다. 2024년 3월까지 학습된 모델이라면 4월 이후에 일어난 일은 배운 적이 없으니까요.

이를 해소하기 위한 장치들이 많은데, 구글은 검색을 활용합니다. 단순히 모델에 모든 정보를 맡겨두는 것이 아니라 검색을 통해 어떤 정보가 담겨야 할지 밑바탕 데이터를 꾸리고, 이를 바탕으로 언어 모델이 글을 지어내는 방식입니다. 아직 완벽한 것 같지는 않지만 이전보다는 훨씬 낫다는 인상입니다.

이 두 가지는 구글 클라우드의 생성형 AI가 조금 다른 느낌으로 받아들여지게 하는 요소가 되었습니다. 바로 어떤 데이터든 안심하고 넣을 수 있고, 구글 클라우드의 AI는 이를 바탕으로 내부적으로 별도 학습과 주어진 데이터 안에서 답을 만들어낼 수 있게 되는 것입니다.

AI는 이제 다양한 산업 분야로 빠르게 확산되며 빠르게 우리 실생활에 스며들고 있다. 사진=최호섭 제공

#생성형 AI, 아이디어를 현실로 생성

기업들의 인공지능에 대한 요구는 각자의 데이터를 통해 뭔가를 얻어내고자 하는 데 있는데, 보안과 정확성이 떨어지면 의미가 없던 것입니다. 이를 해소하기 위해서는 직접 모델을 만들고 튜닝해 가면서 자체 데이터센터를 통해 처리가 이뤄져야 하는데 이는 사실상 불가능한 일입니다. 이 문제가 해결되면 기업들로서는 주저할 이유가 별로 없습니다.

'김캐디'는 이렇게 인공지능 기술을 활용해서 빠르게 결과물을 만들어낸 사례입니다. 김캐디는 골프와 관련된 여러 서비스를 제공하는데, 실제 골퍼들이 고민하는 것 중 하나인 '내 골프채가 나와 맞나'라는 문제를 인공지능으로 해결합니다.

이는 보통 골프채를 판매하는 매장의 전문가들이 경험을 토대로 풀어내는데, 기본적으로 갖고 있는 클럽의 정보를 전달해야 합니다. 하지만 의외로 자기가 어떤 골프채를 쓰는지 아는 사람이 별로 없습니다. 그래서 김캐디는 사진을 찍어서 클럽의 정보를 읽도록 합니다. 흔히 아는 컴퓨터 비전 기술입니다. 하지만 세상에는 수만 가지 골프채가 있습니다. 이를 특정 AI에게 넣어서 알아봐 달라고 하는 것은 무리입니다. 정확도가 결국 이 문제의 답을 결정하기 때문입니다.

김캐디는 직접 대중적으로 인기 있는 클럽의 사진을 데이터베이스로 만들었고, 이를 구글 클라우드에 학습시켰습니다. 그리고 구글 클라우드의 컴퓨터 비전 엔진은 그 데이터를 바탕으로 제품을 식별합니다. 그렇게 데이터가 만들어지면 전문가들과 세운 기준에 맞춰서 다시 인공지능이 골프채가 나에게 맞는지에 대한 인사이트를 뽑아낼 수 있습니다.

이 모든 걸 1명의 개발자가 만들어냈다는 점도 눈여겨볼 부분입니다. 기능과 성능, 서비스 완성도를 모두 잡으면서도 자체 데이터베이스를 확보하고, 정확도도 잡은 셈입니다.

BHSN의 리걸 AI 서비스도 마찬가지입니다. 계약서 등 법적 자료들의 맥락을 읽어내는 AI 서비스로, 이용자들이 계약서를 업로드하면 그 안에 빠진 내용들, 꼼꼼히 봐야 하는 조항들, 그리고 누구의 관점에서 유불리를 판단하는 것까지 가능합니다.

이는 결국 인공지능을 학습시켜서 가능하게 만든 것입니다. 직접 모델을 만드는 것이 아니라 제미나이(Gemini)를 통해서 구글 클라우드에 치밀하게 계약서를 보는 방법을 학습시키고, 맥락을 읽어서 적절한 답을 내어줄 수 있도록 만든 것입니다.

데이터에 대한 신뢰성은 개방성으로 이어지고, 그 개방성은 활용의 범위를 넓히면서 하나의 인공지능 생태계가 만들어지는 흐름이라고 볼 수 있습니다.

인공지능에 대한 흐름은 이제 관심에서 현실로 빠르게 넘어오고 있습니다. 구글 클라우드만의 일이 아니라 오픈AI나 마이크로소프트, 최근의 애플까지 인공지능을 받아들이고, 적용하는 다양한 방법들이 각각의 방식으로 제안됩니다. 그 영역은 소프트웨어 서비스를 넘어 제조, 생산, 유통, 미디어까지 빠르게 번져나가고 있습니다. 늘 듣고 있는 인공지능 이야기지만 현장에서 느껴지는 열기는 분명 그 열기를 품고 다른 잠재력으로 이어지는 듯합니다.

최호섭 IT 칼럼니스트

writer@bizhankook.com

[핫클릭]

· 변호사가 쓰는 인공지능 '슈퍼로이어' 직접 써보니…
· [유럽스타트업열전] '금기' 깨고 이제 '실패'를 이야기할 시간
· [가장 보통의 투자] 혼란의 미국 대선 속 숨은 투자 기회는?
· [사이언스] 초기 우주에 초신성 폭발이 이렇게나 많았다고!
· 윤 대통령 'AI 빅 3개국' 선언했지만…하드웨어 투자 쏠림 어떡하나