실리콘밸리의 인터넷 정화운동 & ‘IBM왓슨’이 인간의 언어를 이해하자 생긴 일 & 의사들은 왜 IBM 인공지능 ‘왓슨’을 외면했을까… ‘XAI’가 중요한 이유 &&

(원문: 여기를 클릭하세요~)

<실리콘밸리의 인터넷 정화운동>

실리콘밸리 기업들이 수 천명의 콘텐츠 검열 직원들을 고용하고 있다. 이들은 홍수처럼 넘쳐나는 가짜 뉴스와 기괴한 뉴스, 범죄 관련 온라인 콘텐츠를 가려내고 있다. 그러나 그 정도론 충분치 않다. By Michal Lev–Ram

^대학 학위와 분석능력, 그리고 수상한 콘텐츠를 잡아낼 매의 눈을 가졌는가? 그렇다면 당신은 세계 최대 SNS회사 페이스북에서 ’뉴스 피드 데이터 진실성 전문가(News Feed integrity dataspecialist)‘로 일할 자격을 가졌다.

^업계에서 통용되는 이 멋진 이름의 직책은 페이스북의 행동강령을 위반할 소지가 있는 기사와 동영상, 다른 온라인 게시물을 검토해 가려내는 업무를 수행한다. 현재 수요가 증가하고 있는 전문 직종이다. 가짜 뉴스의 범람과 뉴스를 통한 여론몰이, 러시아 개입 정치 선전 같은 사건에 대응하기 위해 마련된 자리이다. 이 SNS 대기업은 이미 1만 명의 직원(그 중 7,500명은 ’인간 조정자(human moderators)‘로 불린다)을 고용해 안전과 보안 강화에 힘을 쏟고 있다. 그리고 연말까지 이 인원을 2만 명으로 늘릴 계획이다. 의심쩍은 동영상(폭력적이고 불쾌한 동영상은 말할 필요도 없다)이 유튜브 상에서 판을 치도록 방치한 혐의로, 알파벳Alphabet의 담당 부서는 대중의 뭇매를 맞고 있다. 그래서 콘텐츠를 가려낼 인력을 고용했으며, 올해까지 1만 명 이상의 직원을 배치할 예정이다. 트위터Twitter 또한 매크로 계정의 범람과 앱 상의 ’못된 사용자‘ 문제로 상당한 압력을 느끼고 있다. 이 회사는 현재까진 검열 직원을 얼마나 고용했는지, 또 앞으로 얼마나 영입할지 구체적으로 밝히고 있지 않다. 하지만 실제 사용자들이 ’좀 더 안전하게‘ 앱을 사용할 수 있도록 담당 직원을 활용할 것이란 사실은 발표했다.

^회사 대변인은 포춘과의 이메일 인터뷰에서 “우리는 트위터 상의 오남용을 방지하기 위해 콘텐츠 검열 인력과 머신 러닝 기술에 막대한 투자를 하고 있다”고 밝혔다.

^전문가들은 현재로선 실제 인력을 활용하는 것이 필수적이라고 말한다. 기계 알고리즘은 아직도 누군가 치킨 샌드위치를 먹는 비디오와 부적절한 행동을 취하고 있는 동영상을 구분하지 못하기 때문이란 게 그들이 설명이다(안타깝게도 실제 사례다).

^그러나 인력 고용은 지속 가능한 해결책이 될 수 없다. 페이스북이 오남용을 막기 위해 추가 고용할 1만 명과 다른 직원들은 너무나 값비싼 대안이다. 현재 직원만 해도 2만 5,105명에 달하기 때문이다. 심지어 신규 고용 직원들이 계약직이라도 마찬가지다. 이처럼 많은 수의 추가 고용은 IT회사의 비즈니스 모델에 적합하지 않다.

IT 기업들이 최근 유해 콘텐츠 퇴치 활동을 강화하고 있다.

^하지만 이미 시행되고 있는 기술적 대안이 있다. 작년 12월 유튜브 CEO 수전 워치츠키SusanWojcicki는 “회사의 검열 직원을 늘리겠다”고 발표하면서 “인공지능도 실제 업무에 활용되고 있다”고 밝힌 바 있다. 그녀는 작년 말 회사 블로그에 다음과 같은 글을 남겼다. ‘우리는 (2017년) 6월부터 폭력적이고 극단적인 콘텐츠 검토와 적발에 머신 러닝 기술을 사용했다. 그 결과 18만 명의 사람이 1주일에 40시간 동안 해야 할 일을 처리할 수 있었다.’

^역사를 통해 살펴본다면, 기술적 도구의 효율성은 좀 더 섬세한 인간의 능력을 뛰어넘을 것이다. 일례로, 야후 같은 초기 검색 포털사이트는 인간 큐레이터에 의존했다. 수 천명의 인력을 고용, 온라인 상에서 빠르게 인기를 얻는 콘텐츠를 깔끔하게 분류하고 선별해냈다. 하지만 얼마 지나지 않아 구글이 구축한 알고리즘이 훨씬 뛰어난 성능을 보였다. 그 후 상황은 모두가 잘 알 것이다(물론 야후가 포털 사이트에서 실패한 이유는 분명 여러 가지가 있다).

^페이스북은 수 천명을 신규 고용했고, CEO 마크 저커버그 Mark Zuckerberg는 러시아의 미국 대선 개입 같은 문제를 자신의 플랫폼에서 깨끗이 청소하고 싶다는 ‘매우 진중한’ 뜻을 밝힌 바 있다. 하지만 단지 그렇다고 해서 그가 ‘인간 조정자 부대’의 고용을 효율적이거나 장기적인 해결책으로 보는 것은 아니다. 오히려 그와 업계는 인력 고용을 임시방편으로 여기고 있다. 이런 움직임은 대외 이미지 관리용일 뿐 아니라, ‘기술 남용을 해결하기 위해 더욱 많은 기술을 사용한다’는 사실에 회의적인 사람들을 달래기 위한 조치에 불과하다.

^냉소적이라 생각하는가? 어쩌면 맞을 수도 있다. 하지만 이렇게 생각해보자: 이 세계 최대 SNS기업은 월별 활성사용자 21억3,000만 명을 보유하고 있다. 안전 및 보안 전문가 2만 명을 고용한다고 해도, 여전히 전문가 1명당 10만개의 계정을 맡는 셈이다. 거기에 사람이든 로봇이든 등록된 사용자가 생성한 모든 동영상과 메시지까지 더한다면, 검열해야 할 콘텐츠는 훨씬 더 많아진다.

^유명 SNS플랫폼 상에서 즉시 노출되는 잘못된 정보와 혐오 발언, 폭력적 콘텐츠(일부 사례만 든 것이다)의 확산을 막을 수 있다는 실낱 같은 희망이 있다면, 일일이 거짓 콘텐츠를 가려내느라 고생하는 불쌍한 영혼들이 그 유일한 해결책은 아니라는 뜻이다. 그보다는 소수의 인력이 아직은 개발되지 않은 기술을 활용해 이 문제를 해결할 수 있을 것이다. 하루빨리 그 날이 오길 기대해보자.

(원문: 여기를 클릭하세요~)

‘IBM왓슨’이 인간의 언어를 이해하자 생긴 일

2011년 퀴즈쇼에서 챔피언 압도하며 유명세…의료·법률·CS로 영토 넓히는 중

인공지능(AI)의 대명사가 된 ‘알파고’. 바둑으로 이세돌 9단을 이기며 센세이션을 불러 일으켰습니다. 경우의 수가 무한해 인간이 더 잘할 수밖에 없다는 분야 바둑에서 컴퓨터가 인간을 이겼기 때문이었죠. 바둑 이전에 인간이 이길 수밖에 없다고 불린 게임이 체스였습니다. 다들 아시지만 컴퓨터는 체스를 정복했습니다. 1997년, IBM의 체스 프로그램 ‘딥블루’가 카스파로프를 상대로 승리한 거죠. 이후 IBM은 어떤 노력을 했을까요?

IBM왓슨. 사진=IBM 홈페이지

체스를 이긴 후, IBM은 기술력을 과시할 이벤트의 필요성을 느끼고 있었습니다. IBM은 미국 정부 등 거대 고객에게 기술을 제공하고 돈을 받는 기업이기 때문이죠. 체스 이후 또 다른 ‘한 방’으로 회사를 홍보해야 할 시점이었습니다.

IBM 연구 담당 매니저인 찰스 리켈은 한 음식점에 갔다가 이상한 점을 발견했습니다. 내부가 너무 고요했습니다. 모두가 미국의 인기 퀴즈 쇼 ‘제퍼디(Jeopardy)’를 보고 있었습니다. 당시 챔피언 켄 제닝스가 무려 74연승 가도를 달리고 있었기 때문이죠. 모두가 숨을 죽이고 화면에 집중했습니다.

이거다 싶었습니다. 2004년 찰스 리켈은 제퍼디에서 인간을 이기는 프로젝트를 제안했습니다. 2005년, 임원진의 허가가 떨어졌습니다. 15명의 팀원에게 5년의 시간이 주어졌습니다. 정보를 완벽하게 저장할 수 있는 컴퓨터에게 퀴즈 프로그램은 문제가 아닙니다. 문제는 문장을 이해할 수 있느냐였습니다.

인간은 인공지능과 경쟁하기보다는 인공지능이 할 수 없는 일을 찾는 것이 나을 것이다. 사진=IBM 홈페이지

제퍼디는 다음과 같이 진행됩니다. 그날의 랜덤 퀴즈 카테고리가 여섯 개 나옵니다. 각 카테고리마다 다섯 개의 문제가 나오죠. 문제마다 난이도에 따라 상금이 달라집니다. 가장 많은 상금을 얻은 사람이 승리하지요.

제퍼디의 퀴즈는 문장으로 구성되어 있습니다. 이 문장을 컴퓨터가 이해해서, 이에 맞는 답을 줄 수 있을까요? 이 부분이 왓슨의 기술적 난관이었습니다. 처음 왓슨의 정답률은 15%에 불과했습니다. 당시에 미국 정부가 운영하던 피콴트(Piquant)라는 시스템의 정답률 또한 35%에 불과했습니다. 대답에는 수분의 시간이 걸렸지요. 몇 초 만에 정확하게 답을 맞히는 인간과는 경쟁이 불가능해 보였습니다.

2008년부터 왓슨은 제퍼디 제작진과 연락을 시작합니다. 인간 챔피언과 제퍼디 대결을 하고 싶다는 제안이었습니다. 하지만 대결은 쉽지 않았습니다. 양측 모두 ‘공정성’에 불만이 있었기 때문입니다.

우선 인간은 기계의 속도에 불만이었습니다. 기계는 인간보다 훨씬 더 빠르게 버저를 누를 수 있는 게 문제라는 거죠. 제퍼디 고수의 대결에서는 버저를 울리는 속도가 특히 중요한데, 이 부분에서 로봇은 인간보다 훨씬 빠르다는 겁니다. 왓슨은 기계적으로 버저를 누르는 장치를 달았습니다.

IBM 측에서도 불만이 있었습니다. 제퍼디 제작진이 퀴즈를 ‘인간과 기계의 대결’이라는 주제를 생각하며 만들면 컴퓨터 프로그램이 해결할 수 없는 문제를 무의식적으로 낼 수 있다는 불만입니다. 퀴즈 쇼 문제가 아니라 ‘로봇이 얼마나 인간에 가까운가?’를 테스트하는 ‘튜링 테스트’가 되어버릴 수 있다는 거지요. 이 부분은 제작진이 미리 만들었지만 공개하지 않은 퀴즈 중에서 제3자가 무작위로 선택함으로써 해결했습니다.

인간 챔피언과 왓슨의 제퍼디 대결 영상.

2011년 1월, 역대 제퍼디 최강의 챔피언이던 켄 제닝스와 브래드 러터가 왓슨과 대결했습니다. 이 대결은 비공개로 1월에 녹화된 후 2월에 공개되었습니다. 결과는 왓슨의 압승이었습니다. 제닝스가 4800달러, 러터가 1만 400달러의 상금을 획득하는 동안 왓슨은 3만 5734 달러를 얻어 1위에 올랐습니다.

왓슨은 듣거나 볼 수 없습니다. 대신 호스트가 문장을 읽어줄 때 이와 같은 속도로 텍스트를 전달 받습니다. 인간보다 기계가 인간의 문장을 더 빠르게 이해하고, 이에 맞는 답을 줄 수 있었습니다. 놀라운 충격이었습니다.

이후 왓슨은 ‘인간의 언어를 이해하는 기계’로서 성과를 내고 있습니다. 특히 눈에 띄는 분야는 헬스케어입니다. 왓슨은 환자의 데이터를 판별해 환자의 상태를 ‘진단’하는 데이터를 모읍니다. 인간의 결정을 돕기 위해서입니다. 심지어 과학자들이 해내지 못한 과학적 발견도 합니다. 7만 개의 논문을 한 달 만에 분석해 항암 유전자에 대한 새로운 발견을 해낸 거지요. 인간의 문장을 이해해서 데이터화할 수 있는 왓슨의 특기 덕분입니다.

놀라운 건 CS(커스터머 서비스)입니다. 유저의 질문에 답변해내는 능력이 놀랍습니다. 인간의 문장을 해석하는 퀴즈쇼에서 세계 챔피언이었던 왓슨이니 일상적인 CS 업무는 거뜬합니다. 조지아공대에서는 매년 이메일에 답변을 주는 조교 중 왓슨 AI 조교가 있습니다. 대학교가 사실은 ‘질’이라는 이름의 조교가 AI라는 사실을 말하기 전까지 학생 누구도 친절하게 이메일에 답변해주는 이 조교가 인공지능이라고 상상하지 못했다고 합니다.

IBM왓슨 소개영상.

대화가 가능한 컴퓨터는 컴퓨터의 특기를 갖되 인간이 목소리만으로 자유자재로 조종할 수 있습니다. 인간이 인간의 언어로 써놓은 기록을 기계가 믿을 수 없는 처리속도로 분석해 인간조차 몰랐던 새로운 결과를 만들기도 합니다. 인간과 기계 사이에 가교가 될 수 있는 거지요.

걱정도 있습니다. 왓슨은 CS 분야를 시작으로, 의료 법률 등의 데이터 분석까지 수많은 직업을 없앨 겁니다. 빠르고 편리하게 모든 걸 해낼 수 있게 될 테니까요. 그만큼 인간이 덜 필요해진다는 이야기도 됩니다. 그렇다고 불평만 할 수는 없겠죠. 왓슨과 싸워서 이기려 하기보다는 왓슨이 하지 못하는 무언가를 찾는 게 더 빠를지 모릅니다. 퀴즈쇼 챔피언으로 시작해 이제는 의료기술, 법률, CS 업무까지 바꾸고 있는 인공지능, 왓슨이었습니다.

아래는 2022년 2월 19일 뉴스입니다~

(원문: 여기를 클릭하세요~)

의사들은 왜 IBM 인공지능 ‘왓슨’을 외면했을까… ‘XAI’가 중요한 이유

코로나19로 인해 지금 국내에선 과거엔 상상할 수 없었던 장면이 나타나고 있습니다.

늘어나는 코로나19 확진자의 재택치료 효율적으로 돕기위해 불가피하게 의료진들이 비대면 ‘원격 진료’를 하는 장면이 그것입니다.

현행 의료법상 이같은 원격 진료는 허용되지 않습니다. 어디까지나 ‘한시적’ 조치입니다.

그러나 이같은 원격 진료의 현실적 제약을 수용하면서 동시에 인공지능(AI)기반의 환자 데이터 분석을 통해 치료효과를 극대화시키는 ‘AI기반의 헬스케어 플랫폼 서비스’가 다양한 형태로 속속 제시되고 있습니다.

‘AI기반의 헬스케어 플랫폼 서비스’는 온라인으로 진행하는 원격 진료가 아닙니다.

환자는 내원하기전에 충분히 자신의 데이터를 병원에 제공하고, 또 병원은 보다 정확한 환자 데이터를 사전문진을 통해 분석함으로써 실제 진찰에서 오진율 줄이고, 치료효과를 높이도록 도와주는 새로운 형태의 ‘통합 의료 플랫폼’입니다.

부득이한 경우를 제외하고는 환자는 최종적으로 의사를 직접 만나야 합니다. 이 과정에 앞서 보다 효과적으로 분석 데이터를 지원함으로써 환자-병원 모두 윈윈할 수 있도록 지원하는 것이 AI기반의 헬스케어 플랫폼 서비스의 본질입니다.

<디지털데일리>는 AI가 앞으로 헬스케어, 의료산업계 전반에 어떻게 효과적으로 활용될 수 있는지, 기술적 이해를 돕기위해 헬스케어분야 벤처기업인 인포마이닝(Infomining)과 함께 5회에 걸쳐 짚어 보고자 합니다. <편집자>

올해 1월, IBM이 의료 인공지능(AI)사업인 ‘왓슨(Watson Health)’사업을 사모펀드인 프란시스코 파트너스(Francisco Partners)에 매각했다고 발표해 관련업계에 큰 주목을 끌었다.

‘의료 AI’라는 블루오션을 기대하고, 초대 회장인 토마스 왓슨의 이름까지 걸고 뛰어들었던 IBM이 불과 10억 달러의 헐값(?)에 매각해 버렸기 때문이다.

IBM이 지난 2015년 ‘왓슨’을 첫 출시한 이후 그동안 40억 달러를 쏟아부었기 때문에, 매각액을 고려하면 결과적으로 IBM 스스로 투자의 실패를 인정한 셈이다.

그렇다면 시장에선 왜 IBM의 ‘왓슨’에 대해 혹평을 내렸을까.

특히 ‘왓슨’을 직접 활용하는 의료계의 불신은 간과할 수 없는 부분이었다. 이런 가운데 의료산업계가 지적하고 있는 ‘왓슨’의 치명적인 문제는 ‘설명가능한 인공지능’(Explainable AI 또는 XAI)와는 거리가 멀다는 것.

참고로, 의료계에서 인공지능(AI)을 수식하는 ‘설명가능한’(Explainable)이란 말은 매우 중요하다.

즉, 의료 AI가 데이터분석 또는 딥러닝을 통해 어떤 의료적 결정을 내리든, 가장 중요한 것은 그 결론을 내린 근거를 분명하게 설명할 수 있어야 한다는 것이다. 특히 사람의 생명을 다루는 의료계에서 ‘설명가능한 AI’ 즉, EXI는 0.1%도 양보할 수 없는 절대적 가치다.

그런데 ‘왓슨’은 영상 데이터를 분석해 암의 여부를 진단했지만 정작 그 판단의 근거를 정확하게 제시할 수 있는 구조가 아니었다는 것. 이런 경우는 분석의 정확도가 높다하더라도 의학적으로 채택이 불가능한 ‘블랙박스’일 뿐이다.

이같은 ‘의료 EXI’에 대해 의료AI 플랫폼 전문기업 인포마이닝의 이재용 대표는 “의료라는 행위는 근거 중심의 의학이기 때문에 어떤 경우라도 근거가 뒷받침돼야한다”고 설명했다. ‘설명할 수 없는’ 딥러닝은 이러한 추론도 불가능하기 때문에 진단의 자료로 채택할 수 없다는 것.

또한 이 대표는 “그동안 시장에서 제시된 AI 딥러닝은 본인이 학습한 것에 기반하는 것인데, 이 논리 구조가 의료에는 적합하지 않은 측면이 있다”고 말했다.

즉, AI가 환자를 진단할때 ‘몇퍼센트의 확률로 이것에 가깝다’라고 생각해 볼 수 있는데, 이는 사람마다 고유한 체질과 신체적 특징을 가지고 있는 점을 고려하면 매우 위험한 접근이라는 것이다.

또한 시대가 지날수록 검사의 방법이 다양해지고 병리학이 발전하는 이유는 이 때문이다. 그만큼 사람에 따라, 그리고 그 상황에 따라 맞춰진 진료를 해야한다.

이 대표는 “의료진에게 진료는 ‘아 이런 증상에는 이런 이런 질병이 있지, 그런데 검사 결과가 이렇네. 그럼 이거는 아니겠다. 그럼 이거일 가능성이 제일 높다’ 라는 식의 추론을 해 나아가는 과정”이라며 “그렇기에 의료진들에게 AI가 결론을 내린 근거를 제시하는 것은 굉장히 중요하다”고 강조했다.

이 때문에 의료AI 기반의 헬스케어플랫폼을 제시하고 있는 인포마이닝도 이처럼 ‘설명가능한 의료 AI’ 성능에 초점을 맞추고 있다. 이 대표는 “의료계가 원하는 AI는 단순히 딥러닝의 기법만 이용하는 것이 아닌 논리와 추론이 섞인 딥러닝이 필요한 것”이라고 소개했다.

◆‘설명가능한 AI’ 구현은 어떻게?

의료진에게 결과가 나온 것에 대한 충분한 근거를 제공하고, 해외에서도 이를 뛰어넘는 공감 가능한 AI 기법을 개발 중에 있다.

물론 이러한 순도높은 ‘설명가능한 AI’를 만들기 위해서는 가급적 풍부한 의료 데이터의 집적(集積)와 함께 정확한 빅데이터 분석 기술이 결합돼야 한다.

인포마이닝의 경우, 전국 각 지자체 보건소 검사 및 진단데이터, 주요 병원의 질병 진단 데이터, 건강보험 공단의 건강검진데이터 등 수십억개의 데이터를 활용하고 있다. 국내외 의료AI 기반의 서비스 플랫폼 회사들의 경우, 비즈니스 모델을 조금씩 다르겠지만 기본적으로 데이터 분석을 위한 AI 성능 향상에 대한 투자는 공통의 관심사다.

환자가 병원 방문전에 의료 AI챗봇을 이용해 사전 문진을 진행하고 있는 장면 <자료: 인포마이닝>

이러한 빅데이터 분석을 기반으로 ‘AI기반 헬스케어솔루션’을 제시하고 있다. 이 솔루션은 생체신호를 측정하는 측정기기와 통합의료지원 모니터링 서비스 플랫폼으로 구성됐다. AI기반 생체신호를 측정, 분석해 질병을 예측해주는 방식으로 진료절차를 정밀하고 간소화함으로써 통합의료지원 모니터링 플랫폼의 역할을 한다.

일반적으로 AI기반 헬스케어시스템의 기능중 하나로 환자의 사전 정보취합과 관련해 AI 챗봇을 활용하는 방식이 많이 활용되고 있다. ‘사전문진서비스’, ‘진료과 추천서비스’ 등과 같은 서비스가 AI챗봇을 통해 활용되고 있다.

‘사전문지서비스’는 원격진료 또는 방문진료 이전에 진행하는 사전문진을 AI가 대신하도록 하는 서비스다. AI 챗봇을 통해 환자는 기본적인 정보 및 증상, 가족력, 과거력 등을 의사의 대면 진료전에 충분히 제공한다. 이런 과정을 통해 짧은 ‘3분 진료’와 같은 진료 시간의 한계를 극복하고, 의사는 오진율을 크게 줄일 수 있다.

또한 ‘진료과 추천 서비스’는 AI챗봇을 통해 문장으로 해당 증상을 표현하면 진료과를 알려주는 서비스다. 이 서비스가 활성화되면 환자는 병원 콜센터, 원무 상담시간 등을 크게 절약할 수 있다.

실리콘밸리의 인터넷 정화운동 & ‘IBM왓슨’이 인간의 언어를 이해하자 생긴 일 & 의사들은 왜 IBM 인공지능 ‘왓슨’을 외면했을까… ‘XAI’가 중요한 이유 &&

<실리콘밸리의 인터넷 정화운동>

실리콘밸리 기업들이 수 천명의 콘텐츠 검열 직원들을 고용하고 있다. 이들은 홍수처럼 넘쳐나는 가짜 뉴스와 기괴한 뉴스, 범죄 관련 온라인 콘텐츠를 가려내고 있다. 그러나 그 정도론 충분치 않다. By Michal Lev–Ram

‘IBM왓슨’이 인간의 언어를 이해하자 생긴 일

의사들은 왜 IBM 인공지능 ‘왓슨’을 외면했을까… ‘XAI’가 중요한 이유

Related

Leave a Reply Cancel reply