(원문: 여기를 클릭하세요~)
8일 (현지시각) 구글I/O 2018이 열렸다. 장소는 지난해와 마찬가지로 구글 본사 바로 옆에 있는 쇼라인 앰피씨어터였다. 순다 피차이 구글 CEO는 여유롭게 무대 위에 올랐다. 그가 이 커다란 키노트를 이끌기 시작한 것도 벌써 5년이 되었다. 특유의 진지함과 긴장 대신 농담을 던지면서 이 축제의 분위기를 만든 것도 인상적이다.
그가 무대에 처음 올라서 꺼낸 이야기는 지난해 안드로이드 오레오를 발표하면서 새로 공개한 햄버거와 맥주 이모티콘이다. 지난해 이 아이콘들은 햄버거 속 치즈의 위치가 고기 패티 위가 아니라 맨 아래에 깔려 이상하다는 반응을 샀다. 이 문제는 생각보다 크게 번졌고, 구글은 실제로 사내 식당에서 ‘안드로이드 버거’라는 이름의 메뉴로 이 낯선 버거를 꺼내 놓는 특유의 농담으로 정리하긴 했지만 결국 이모티콘 속 치즈를 ‘익숙한’ 위치로 돌려 놓았던 바 있다. 이와 함께 맥주가 가득채워지지 않았는데 거품은 풍성한 맥주 이모티콘도 명백한 오류로 수정된 바 있다. 순다 피차이 CEO는 ‘채식주의자라서 디테일을 놓쳤다’는 농담으로 이 논란을 말끔하게 마무리했다. 간단해 보이는 문제일 수도 있지만 어쨌든 구글이 이용자, 개발자들과 계속해서 커뮤니케이션한다는 느낌을 준다는 정도로 읽으면 좋을 것 같다.
순다 피차이 구글 CEO는 치즈 모양이 어색한 이모티콘을 바로잡은 것으로 키노트를 열었다.
순다의 올해 구글I/O 키노트를 한 마디로 이야기하자면 재미있다고 할 수 있다. 이전에 없던 새로운 제품이나 서비스가 공개된 것은 없다. 언뜻 보면 싱겁다고 느낄 수도 있지만 구글은 머신러닝을 이용해 기술을 고도화시키고, 세세한 부분을 손봤다. 그리고 그 결과물은 모두 탄성을 이끌어냈다. 완성도가 높아진 것인데 단순히 이 단어로는 올해 구글의 변화를 풀이하기 어려울 만큼 구글은 획기적인 기술들을 쏟아냈다. 마치 ‘혁신’이라는 것이 세상에 없던 것을 끌어내는 것이 아니라고 비웃듯 상상속에서, 혹은 구글을 이용하면서 생각했던 것들이 앞당겨서 눈 앞에 나타난 것 같은 느낌이었다.
키노트 중에는 아주 짧게 지나갔지만 구글은 머신러닝을 의료 등 많은 부분에 활용할 수 있도록 시장을 넓혀 왔고, 이를 효과적으로 운영할 수 있도록 전용 프로세서인 TPU(Tensor Processor Unit, 텐서 프로세서 유닛)를 3.0으로 업그레이드해서 머신러닝을 더 효과적으로 쓸 수 있도록 했다. 그리고 이 TPU와 구글의 머신러닝 프레임워크 텐서플로를 이용해 우리가 잘 알고 있는 구글의 서비스를 개선하는 것이 올 구글 I/O의 방향성이다.
구글은 머신러닝을 빠르게 처리하는 가속 프로세서, TPU 3.0을 공개했다.
이번 구글 I/O의 하이라이트는 단연코 구글 어시스턴트였다. 구글은 어시스턴트에 6가지 새 목소리를 더했다. 영어에 한정되지만 이는 서서히 여러 언어로 확장될 가능성이 높다. 음성 어시스턴트는 대체로 여성의 목소리를 갖고 있다. 전달력이 좋아서라는 이유들이 나오긴 하지만 세계적으로 성차별에 대한 이야기가 나오면서 구글은 지난해 남성 어시스턴트의 목소리를 더한 바 있다. 한글 구글 어시스턴트도 남녀 목소리를 선택할 수 있다. 구글은 한발 더 나아가서 여러 목소리와 억양을 더했다. 단순히 기계음이 아니라 실제 사람의 목소리를 디지타이즈하는 식인데 그 중 하나는 R&B 싱어송라이터인 존 레전드의 목소리다.
구글 어시스턴트를 부르는 명령어는 ‘헤이 구글’로 자리를 잡는 듯하다. 애초 ‘오케이 구글’로 시작했지만 올해 CES를 기점으로 구글은 완전히 ‘헤이 구글’만 외부에 공개한다. 물론 ‘오케이 구글’도 아직 동작한다. 이 콜사인은 스마트폰이나 구글 홈 등 구글 어시스턴트와 대화를 시작하는 명령어인데, 이전까지는 말을 할 때마다 계속해서 ‘헤이 구글’을 외쳐야 했다. 하지만 새 구글 어시스턴트는 대화의 맥을 읽어서 이용자가 아직도 명령을 내리고 있다고 판단하면 계속해서 명령을 처리한다.
구글 어시스턴트를 한 번만 불러서 긴 대화를 하거나 여러가지 명령을 동시에 내릴 수 있게 됐다.
또한 한 문장 안에서 여러가지 명령을 동시에 내릴 수 있다. “TV를 켜고 팝콘을 만들어 줘” 같은 명령어가 가능하다는 이야기다. 구글은 ‘and’의 예를 들었는데 접속사 and는 문장 안에서 단어를 묶기도 하고 문장을 묶기도 한다. 그에 따라 묘하게 의미가 달라지기도 하는데 구글은 and를 기점으로 문장을 정확히 구분해준다.
이는 단순해 보일 수 있지만 기계와 사람이 대화를 나누는 관점에서 보면 또 한 단계 계단을 오른 셈이다. 기계를 부르고 명령을 내리던 것에서 기계를 부른 뒤에 한 마디씩 대화를 하는 방식으로 진화했고, 이제는 마치 사람을 부르듯 구글을 한 번만 부른 뒤 자연스럽게 대화를 이어가는 식이다. 훨씬 자연스러운 대화 경험으로 진화하는 과정이 이제 어느 정도 완성됐다고 볼 수 있다.
또 한 가지 흥미로운 것은 ‘프리티 플리즈(Pretty Please)’라고 부르는 것이다. 영어를 예로 들어 보면 사용자가 ‘플리즈’를 붙여 말하면 ‘친절하게 이야기해줘서 고맙다’라고 대답하는 것이다. 기능이라고 부르기도 애매하지만 이 작은 피드백으로 기계에 막말을 던지는 것을 줄일 수 있고, 그만큼 긍정적인 언어를 학습시킬 수도 있고, 사람으로서도 좋은 습관이 들 수 있다. 구글은 이미 인공지능과 사람의 행동 패턴에 대한 고민도 하고 있다는 것을 알 수 있다.
구글 어시스턴트는 단순히 음성비서에 머물지 않고 화면을 더해 더 많은 정보를 전달한다.
구글 어시스턴트는 애초 화면 대신 말로 안드로이드를 제어한다는 개념으로 시작했지만 통합 어시스턴트로 자리를 잡으면서 시각적인 부분을 포기하지 않을 수 있게 됐다. 화면이 통합된 ‘비주얼 어시스티브’로 음성과 디스플레이 정보를 함께 주는 기기도 공식화됐다. 구글 어시스턴트가 답을 제시할 때 안드로이드나 비주얼 어시스티브처럼 화면이 있는 기기에서는 검색 결과에 관련 정보를 따로 정리한 ‘스닉 픽’을 띄워주기도 하고, 네스트같은 온도 조절기를 다룰 때는 제어 버튼들도 보여준다. 스타벅스를 검색하면 화면에 메뉴를 띄워주는 등 전체적으로 음성과 화면 정보가 따라붙으면서 구글 어시스턴트는 더 생기를 띄게 됐다.
가장 놀라움을 샀던 것은 음성 챗봇의 활용이다. 구글 어시스턴트에 미용실, 음식점 예약 같은 명령을 내리면 구글이 실제로 전화를 걸어 예약을 잡아준다. 놀랍다고 한 이유는 사람이 전화를 거는 게 아니라 구글 어시스턴트가 전화를 걸기 때문이다. 단순히 예약 내용을 전달하는 것이 아니라 인사를 나누고, 참석자의 수를 알리기도 한다. 무엇보다 상대방의 목소리 내용을 인식해서 예약 가능한 시간을 조율하기도 한다. 기계가 말하는 것이지만 실제 사람이 말하는 것과 구분하기 어려울 정도로 완성도가 높다.
구글 어시스턴트가 직접 미용실이나 음식점에 전화를 걸어 예약을 잡아준다. 기계와 대화하는 것을 알아차리기 어려울 정도로 대화가 자연스럽다.
이는 흔히 컨시어지 서비스로 불리는 것인데, 사람 비서나 혹은 아주 비싼 별도의 프리미엄 서비스로 제공되는 것인데, 구글은 머신러닝과 챗봇, 그리고 말을 하는 구글 듀플렉스 기술을 조합해서 이를 만들어냈다. 이 기능은 꼭 유튜브 영상을 볼 필요가 있다. 더 놀라운 것은 이 기능이 몇 주 내로 서비스된다는 점이다. 영화 속에서만 보던 튜링 테스트를 보는 듯한 느낌이 들만큼 정교한 대화는 올해 구글 I/O에서 단연코 가장 큰 박수를 받았다.
구글 어시스턴트는 지도에도 통합된다. 운전 중에도 음악 앱으로 화면을 바꾸지 않아도 목소리로 원하는 음악을 찾아 들을 수 있다. 단순한 통합처럼 보이지만 구글 어시스턴트가 기기나 앱을 가리지 않고 어떤 환경에도 적절하게 연결될 수 있다는 점을 보여준다.
여전히 이 시장은 아마존의 알렉사가 강세지만 구글의 추격도 무시할 수 없다. 최근 구글은 구글 어시스턴트의 마케팅에도 그 어느 때보다 힘을 쏟고 있다. 하지만 단순히 제품을 알리는 것을 넘어 기술적으로도 큰 변화와 발전을 준비하고 있었다는 것이 구글I/O를 통해 공개됐다. 그 동안 기계와 말로 대화하는 것은 부가 기능이라고 생각했는데 이제는 진짜 대화할 수 있는 상대가 되고 있다는 점은 놀랍다. 올해 구글은 마치 “나 구글이야!”라고 하는 것만 같다.