(원문: 여기를 클릭하세요~)
<실리콘밸리의 인터넷 정화운동>
실리콘밸리 기업들이 수 천명의 콘텐츠 검열 직원들을 고용하고 있다. 이들은 홍수처럼 넘쳐나는 가짜 뉴스와 기괴한 뉴스, 범죄 관련 온라인 콘텐츠를 가려내고 있다. 그러나 그 정도론 충분치 않다. By Michal Lev–Ram
^대학 학위와 분석능력, 그리고 수상한 콘텐츠를 잡아낼 매의 눈을 가졌는가? 그렇다면 당신은 세계 최대 SNS회사 페이스북에서 ’뉴스 피드 데이터 진실성 전문가(News Feed integrity dataspecialist)‘로 일할 자격을 가졌다.
^업계에서 통용되는 이 멋진 이름의 직책은 페이스북의 행동강령을 위반할 소지가 있는 기사와 동영상, 다른 온라인 게시물을 검토해 가려내는 업무를 수행한다. 현재 수요가 증가하고 있는 전문 직종이다. 가짜 뉴스의 범람과 뉴스를 통한 여론몰이, 러시아 개입 정치 선전 같은 사건에 대응하기 위해 마련된 자리이다. 이 SNS 대기업은 이미 1만 명의 직원(그 중 7,500명은 ’인간 조정자(human moderators)‘로 불린다)을 고용해 안전과 보안 강화에 힘을 쏟고 있다. 그리고 연말까지 이 인원을 2만 명으로 늘릴 계획이다. 의심쩍은 동영상(폭력적이고 불쾌한 동영상은 말할 필요도 없다)이 유튜브 상에서 판을 치도록 방치한 혐의로, 알파벳Alphabet의 담당 부서는 대중의 뭇매를 맞고 있다. 그래서 콘텐츠를 가려낼 인력을 고용했으며, 올해까지 1만 명 이상의 직원을 배치할 예정이다. 트위터Twitter 또한 매크로 계정의 범람과 앱 상의 ’못된 사용자‘ 문제로 상당한 압력을 느끼고 있다. 이 회사는 현재까진 검열 직원을 얼마나 고용했는지, 또 앞으로 얼마나 영입할지 구체적으로 밝히고 있지 않다. 하지만 실제 사용자들이 ’좀 더 안전하게‘ 앱을 사용할 수 있도록 담당 직원을 활용할 것이란 사실은 발표했다.
^회사 대변인은 포춘과의 이메일 인터뷰에서 “우리는 트위터 상의 오남용을 방지하기 위해 콘텐츠 검열 인력과 머신 러닝 기술에 막대한 투자를 하고 있다”고 밝혔다.
^전문가들은 현재로선 실제 인력을 활용하는 것이 필수적이라고 말한다. 기계 알고리즘은 아직도 누군가 치킨 샌드위치를 먹는 비디오와 부적절한 행동을 취하고 있는 동영상을 구분하지 못하기 때문이란 게 그들이 설명이다(안타깝게도 실제 사례다).
^그러나 인력 고용은 지속 가능한 해결책이 될 수 없다. 페이스북이 오남용을 막기 위해 추가 고용할 1만 명과 다른 직원들은 너무나 값비싼 대안이다. 현재 직원만 해도 2만 5,105명에 달하기 때문이다. 심지어 신규 고용 직원들이 계약직이라도 마찬가지다. 이처럼 많은 수의 추가 고용은 IT회사의 비즈니스 모델에 적합하지 않다.
IT 기업들이 최근 유해 콘텐츠 퇴치 활동을 강화하고 있다.
^하지만 이미 시행되고 있는 기술적 대안이 있다. 작년 12월 유튜브 CEO 수전 워치츠키SusanWojcicki는 “회사의 검열 직원을 늘리겠다”고 발표하면서 “인공지능도 실제 업무에 활용되고 있다”고 밝힌 바 있다. 그녀는 작년 말 회사 블로그에 다음과 같은 글을 남겼다. ‘우리는 (2017년) 6월부터 폭력적이고 극단적인 콘텐츠 검토와 적발에 머신 러닝 기술을 사용했다. 그 결과 18만 명의 사람이 1주일에 40시간 동안 해야 할 일을 처리할 수 있었다.’
^역사를 통해 살펴본다면, 기술적 도구의 효율성은 좀 더 섬세한 인간의 능력을 뛰어넘을 것이다. 일례로, 야후 같은 초기 검색 포털사이트는 인간 큐레이터에 의존했다. 수 천명의 인력을 고용, 온라인 상에서 빠르게 인기를 얻는 콘텐츠를 깔끔하게 분류하고 선별해냈다. 하지만 얼마 지나지 않아 구글이 구축한 알고리즘이 훨씬 뛰어난 성능을 보였다. 그 후 상황은 모두가 잘 알 것이다(물론 야후가 포털 사이트에서 실패한 이유는 분명 여러 가지가 있다).
^페이스북은 수 천명을 신규 고용했고, CEO 마크 저커버그 Mark Zuckerberg는 러시아의 미국 대선 개입 같은 문제를 자신의 플랫폼에서 깨끗이 청소하고 싶다는 ‘매우 진중한’ 뜻을 밝힌 바 있다. 하지만 단지 그렇다고 해서 그가 ‘인간 조정자 부대’의 고용을 효율적이거나 장기적인 해결책으로 보는 것은 아니다. 오히려 그와 업계는 인력 고용을 임시방편으로 여기고 있다. 이런 움직임은 대외 이미지 관리용일 뿐 아니라, ‘기술 남용을 해결하기 위해 더욱 많은 기술을 사용한다’는 사실에 회의적인 사람들을 달래기 위한 조치에 불과하다.
^냉소적이라 생각하는가? 어쩌면 맞을 수도 있다. 하지만 이렇게 생각해보자: 이 세계 최대 SNS기업은 월별 활성사용자 21억3,000만 명을 보유하고 있다. 안전 및 보안 전문가 2만 명을 고용한다고 해도, 여전히 전문가 1명당 10만개의 계정을 맡는 셈이다. 거기에 사람이든 로봇이든 등록된 사용자가 생성한 모든 동영상과 메시지까지 더한다면, 검열해야 할 콘텐츠는 훨씬 더 많아진다.
^유명 SNS플랫폼 상에서 즉시 노출되는 잘못된 정보와 혐오 발언, 폭력적 콘텐츠(일부 사례만 든 것이다)의 확산을 막을 수 있다는 실낱 같은 희망이 있다면, 일일이 거짓 콘텐츠를 가려내느라 고생하는 불쌍한 영혼들이 그 유일한 해결책은 아니라는 뜻이다. 그보다는 소수의 인력이 아직은 개발되지 않은 기술을 활용해 이 문제를 해결할 수 있을 것이다. 하루빨리 그 날이 오길 기대해보자.
(원문: 여기를 클릭하세요~)
‘IBM왓슨’이 인간의 언어를 이해하자 생긴 일
2011년 퀴즈쇼에서 챔피언 압도하며 유명세…의료·법률·CS로 영토 넓히는 중
인공지능(AI)의 대명사가 된 ‘알파고’. 바둑으로 이세돌 9단을 이기며 센세이션을 불러 일으켰습니다. 경우의 수가 무한해 인간이 더 잘할 수밖에 없다는 분야 바둑에서 컴퓨터가 인간을 이겼기 때문이었죠. 바둑 이전에 인간이 이길 수밖에 없다고 불린 게임이 체스였습니다. 다들 아시지만 컴퓨터는 체스를 정복했습니다. 1997년, IBM의 체스 프로그램 ‘딥블루’가 카스파로프를 상대로 승리한 거죠. 이후 IBM은 어떤 노력을 했을까요?
체스를 이긴 후, IBM은 기술력을 과시할 이벤트의 필요성을 느끼고 있었습니다. IBM은 미국 정부 등 거대 고객에게 기술을 제공하고 돈을 받는 기업이기 때문이죠. 체스 이후 또 다른 ‘한 방’으로 회사를 홍보해야 할 시점이었습니다.
IBM 연구 담당 매니저인 찰스 리켈은 한 음식점에 갔다가 이상한 점을 발견했습니다. 내부가 너무 고요했습니다. 모두가 미국의 인기 퀴즈 쇼 ‘제퍼디(Jeopardy)’를 보고 있었습니다. 당시 챔피언 켄 제닝스가 무려 74연승 가도를 달리고 있었기 때문이죠. 모두가 숨을 죽이고 화면에 집중했습니다.
이거다 싶었습니다. 2004년 찰스 리켈은 제퍼디에서 인간을 이기는 프로젝트를 제안했습니다. 2005년, 임원진의 허가가 떨어졌습니다. 15명의 팀원에게 5년의 시간이 주어졌습니다. 정보를 완벽하게 저장할 수 있는 컴퓨터에게 퀴즈 프로그램은 문제가 아닙니다. 문제는 문장을 이해할 수 있느냐였습니다.
제퍼디는 다음과 같이 진행됩니다. 그날의 랜덤 퀴즈 카테고리가 여섯 개 나옵니다. 각 카테고리마다 다섯 개의 문제가 나오죠. 문제마다 난이도에 따라 상금이 달라집니다. 가장 많은 상금을 얻은 사람이 승리하지요.
제퍼디의 퀴즈는 문장으로 구성되어 있습니다. 이 문장을 컴퓨터가 이해해서, 이에 맞는 답을 줄 수 있을까요? 이 부분이 왓슨의 기술적 난관이었습니다. 처음 왓슨의 정답률은 15%에 불과했습니다. 당시에 미국 정부가 운영하던 피콴트(Piquant)라는 시스템의 정답률 또한 35%에 불과했습니다. 대답에는 수분의 시간이 걸렸지요. 몇 초 만에 정확하게 답을 맞히는 인간과는 경쟁이 불가능해 보였습니다.
2008년부터 왓슨은 제퍼디 제작진과 연락을 시작합니다. 인간 챔피언과 제퍼디 대결을 하고 싶다는 제안이었습니다. 하지만 대결은 쉽지 않았습니다. 양측 모두 ‘공정성’에 불만이 있었기 때문입니다.
우선 인간은 기계의 속도에 불만이었습니다. 기계는 인간보다 훨씬 더 빠르게 버저를 누를 수 있는 게 문제라는 거죠. 제퍼디 고수의 대결에서는 버저를 울리는 속도가 특히 중요한데, 이 부분에서 로봇은 인간보다 훨씬 빠르다는 겁니다. 왓슨은 기계적으로 버저를 누르는 장치를 달았습니다.
IBM 측에서도 불만이 있었습니다. 제퍼디 제작진이 퀴즈를 ‘인간과 기계의 대결’이라는 주제를 생각하며 만들면 컴퓨터 프로그램이 해결할 수 없는 문제를 무의식적으로 낼 수 있다는 불만입니다. 퀴즈 쇼 문제가 아니라 ‘로봇이 얼마나 인간에 가까운가?’를 테스트하는 ‘튜링 테스트’가 되어버릴 수 있다는 거지요. 이 부분은 제작진이 미리 만들었지만 공개하지 않은 퀴즈 중에서 제3자가 무작위로 선택함으로써 해결했습니다.
2011년 1월, 역대 제퍼디 최강의 챔피언이던 켄 제닝스와 브래드 러터가 왓슨과 대결했습니다. 이 대결은 비공개로 1월에 녹화된 후 2월에 공개되었습니다. 결과는 왓슨의 압승이었습니다. 제닝스가 4800달러, 러터가 1만 400달러의 상금을 획득하는 동안 왓슨은 3만 5734 달러를 얻어 1위에 올랐습니다.
왓슨은 듣거나 볼 수 없습니다. 대신 호스트가 문장을 읽어줄 때 이와 같은 속도로 텍스트를 전달 받습니다. 인간보다 기계가 인간의 문장을 더 빠르게 이해하고, 이에 맞는 답을 줄 수 있었습니다. 놀라운 충격이었습니다.
이후 왓슨은 ‘인간의 언어를 이해하는 기계’로서 성과를 내고 있습니다. 특히 눈에 띄는 분야는 헬스케어입니다. 왓슨은 환자의 데이터를 판별해 환자의 상태를 ‘진단’하는 데이터를 모읍니다. 인간의 결정을 돕기 위해서입니다. 심지어 과학자들이 해내지 못한 과학적 발견도 합니다. 7만 개의 논문을 한 달 만에 분석해 항암 유전자에 대한 새로운 발견을 해낸 거지요. 인간의 문장을 이해해서 데이터화할 수 있는 왓슨의 특기 덕분입니다.
놀라운 건 CS(커스터머 서비스)입니다. 유저의 질문에 답변해내는 능력이 놀랍습니다. 인간의 문장을 해석하는 퀴즈쇼에서 세계 챔피언이었던 왓슨이니 일상적인 CS 업무는 거뜬합니다. 조지아공대에서는 매년 이메일에 답변을 주는 조교 중 왓슨 AI 조교가 있습니다. 대학교가 사실은 ‘질’이라는 이름의 조교가 AI라는 사실을 말하기 전까지 학생 누구도 친절하게 이메일에 답변해주는 이 조교가 인공지능이라고 상상하지 못했다고 합니다.
대화가 가능한 컴퓨터는 컴퓨터의 특기를 갖되 인간이 목소리만으로 자유자재로 조종할 수 있습니다. 인간이 인간의 언어로 써놓은 기록을 기계가 믿을 수 없는 처리속도로 분석해 인간조차 몰랐던 새로운 결과를 만들기도 합니다. 인간과 기계 사이에 가교가 될 수 있는 거지요.
걱정도 있습니다. 왓슨은 CS 분야를 시작으로, 의료 법률 등의 데이터 분석까지 수많은 직업을 없앨 겁니다. 빠르고 편리하게 모든 걸 해낼 수 있게 될 테니까요. 그만큼 인간이 덜 필요해진다는 이야기도 됩니다. 그렇다고 불평만 할 수는 없겠죠. 왓슨과 싸워서 이기려 하기보다는 왓슨이 하지 못하는 무언가를 찾는 게 더 빠를지 모릅니다. 퀴즈쇼 챔피언으로 시작해 이제는 의료기술, 법률, CS 업무까지 바꾸고 있는 인공지능, 왓슨이었습니다.
아래는 2022년 2월 19일 뉴스입니다~
(원문: 여기를 클릭하세요~)
의사들은 왜 IBM 인공지능 ‘왓슨’을 외면했을까… ‘XAI’가 중요한 이유
환자가 병원 방문전에 의료 AI챗봇을 이용해 사전 문진을 진행하고 있는 장면 <자료: 인포마이닝>