인공지능을 이용한 화학반응 예측과 유기 분자 설계, 그리고 물질 구조 분석에 관한 내용입니다.
(원문)
화학반응 예측에 인공지능 도입한 과학자들
[요약]미국 캘리포니아공과대학 연구진이 머신러닝을 이용해 화학반응을 예측할 수 있는 알고리즘을 개발했다. 연구진에 따르면 이번 툴은 기존의 예측 기술과 비교했을 때 더욱 빠르고 정확한 것으로 나타났다.(2018.09)
화학이 발전하고 화학반응이 더욱 복잡해짐에 따라 과학자들이 실험실에 앉아 직접 화학물질을 섞어가며 어떤 현상이 일어날지 눈으로 지켜보는 일은 더 이상 실용적이지 않다. 미국 캘리포니아공과대학(칼텍) 화학과 교수인 톰 밀러와 레스닉 지속가능연구소의 박사후연구원인 매트 웰본, 그리고 칼텍 화학공학과 대학원생인 리쉬 쳉은 시약이 시험관이 닿아 화학반응을 일으키기 전에 ‘머신러닝’ 툴을 이용해 화학반응을 예측할 수 있는 기술을 개발했다.
컴퓨터를 이용해 화학반응을 예측하는 기술을 개발한 것은 이들이 처음이 아니다. 하지만 이들은 기존의 툴을 개선하는데 성공했으며 이같은 예측 기술은 현장에서 큰 영향을 미칠 수 있다. 밀러는 “이 툴은 우리가 거시 세계에서 신경쓰는 것들과 미시세계의 특성들을 연결해준다”며 “이같은 예측은 어떤 촉매가 다른 촉매보다 더 나은 능력을 갖고 있는지 알려줄 수 있고 신약 후보물질 선별에도 활용될 수 있다”고 말했다. 이것은 또한 많은 컴퓨터 작업이 요구된다. 밀러는 지구에 있는 슈퍼컴퓨터의 많은 부분이 화학반응 예측에 사용되기 때문에 효율을 높이는 것은 과학자들이 많은 비용과 시간을 아낄 수 있다고 지적한다. 칼텍 연구자들의 연구는 본질적으로 예측 소프트웨어를 위한 초점의 변화를 제공한다. 이전의 툴은 ‘밀도함수이론(density functional theory·DFT)’과 ‘짝지어진 클러스터 이론(coupled cluster theory·CC)’, ‘뮐레르 플레셋 섭동이론(Møller-Plesset perturbation theory·MP2)’로 알려진 세가지 계산 모델링 방법을 기반으로 한다. 이 이론들은 양자역학이 큰 역할을 하는 복잡한 시스템을 묘사하는 슈뢰딩거 방정식에 접근하는 서로 다른 세가지 방법이다.
각각의 이론들은 장단점을 갖고 있다. DFT는 빠르고 간편하다. 과학자들이 답을 훨씬 빠르게 찾을 수 있지만 정확도는 떨어진다. CC와 MP2는 훨씬 더 정확하지만 계산이 오래 걸리고 더 많은 컴퓨터 전력이 필요하다. 밀러와 쳉, 그리고 웰본의 툴은 DFT로 만든 것보다 더 정확할 뿐 아니라 CC나 MP2보다 적은 시간에 화학반응을 예측할 수 있도록 도와준다. 이것이 가능한 이유는 연구진이 머신러닝 알고리즘을 분자 오비탈의(분자 주변의 전자 구름) 특성에 초점을 맞췄기 때문이다. 이와 대조적으로 이미 존재하는 툴은 분자를 구성하고 있는 원자나 원자들이 서로 결합되어 있는 각도에 초점을 맞춘다.
지금까지 이들의 접근법은 비록 단지 상대적으로 간단한 시스템의 예측에 사용되고 있지만 많은 가능성을 보여주고 있다. 밀러는 “진짜 테스트는 더 복잡한 화학 문제에 어떻게 반응하는지 알아보는 것”이라고 말했다. 여전히 그는 예비 결과를 근거로 이를 낙관적으로 보고 있다. 그는 “만약 우리가 이를 가능케 한다면 컴퓨터가 화학문제를 해결하는데 큰 도움이 될 것”이라며 “우리는 매우 흥분하고 있다”고 덧붙였다. 이번 결과는 ‘분자 오비탈을 통한 전자구조의 머신러닝 이동 가능성’이라는 제목으로 학술지 ‘화학 이론과 계산’에 게재됐다.
(원문)
(원문)
AI로 기능성 유기 분자 설계
[요약]이화학연구소 혁신지능통합연구센터 분자정보연구팀의 스미타 마사토 박사, 물질·재료 연구기구 국제나노아키구조론연구소 이시하라 신스케 박사 등으로 이뤄진 공동연구팀이 AI(인공지능)와 빅데이터, 시뮬레이션 기법 등을 이용해 연구자가 원하는 특성을 지닌 합성 유기분자 선별하거나 만드는 데 성공했다. 이번 연구성과는 향후 유기 일렉트로닉스 분야에서 기능성 분자를 디자인하는 데 기여할 것으로 보인다(2018.08)
이화학연구소 스미타 마사토 박사를 주축으로 한 공동연구팀이 AI의 딥러닝(심화학습) 기술과 양자역학에 근거한 분자 시뮬레이션 기술 등을 적용, 구조가 안정적이면서 원하는 특성을 지닌 유기 분자를 자동 선별하는 데 성공했다고 밝혔다. 또 이 방법으로 선별한 수십개의 분자 중 몇 개의 분자를 실제로 합성, 목적한 특성이 나타남을 확인해 AI가 분자 설계에 유용함을 입증했다. 이번 연구성과는 화학분야 세계적 권위지인 ‘ACS 센트럴사이언스(ACS Central Science)’지 2018년 8월 20일자에 게재됐다.
화학계에선 원하는 특성을 가진 유기분자를 계산기로 설계하는 기술이 예전부터 주목을 끌어왔다. 하지만 이는 유기 분자를 구성하는 화학법칙을 미리 사람이 모두 입력해야만 하는 거대 작업이었다. 모든 법칙을 일일이 사람이 적용하는 건 사실상 무리였다. 하지만 딥러닝이 가능한 AI 기술이 보편화되면서 상황은 완전히 달라졌다. 매우 복잡한 유기 분자 구성 법칙을 자동으로 계산기에 학습시킬 수 있게 된 것이다.
실제로 AI을 통해 기능성 분자를 설계하는 기술은 발전에 발전을 이뤄, 다수의 새로운 분자가 설계됐다. 그러나 이렇게 설계한 유기 분자가 실제로 합성할 수 있는지에 대해서는 지금까지 검증된 바가 없다. 아울러 양자역학에 기반한 분자 시뮬레이션 기술도 크게 발전하여 각종 유기 분자의 성질 및 안정성을 어느 정도 정밀하게 예측할 수 있게 됐다.
연구진은 원하는 특성을 가지고 안정된 유기 분자를 선별 및 설계하기 위해 AI 기술과 분자 시뮬레이션 기술 등을 적용했다.
유기 분자의 양자역학적 성질을 가장 잘 반영한 특성으로 ‘빛 흡수’를 꼽는다. 연구진은 “분자가 흡수하는 빛의 파장·힘은 분자에 따라 다르다”며 “유기EL(OLED), 유기태양전지 제작에서 분자가 흡수하는 빛의 세기·파장을 조정할 필요가 있어, 분자의 흡수하는 빛을 자유자재로 제어하는 것이 ‘유기 일렉트로닉스 기기’ 개발에선 중요하다”고 설명했다.
연구진은 원하는 파장의 빛을 흡수하는 유기 분자를 설계하고, 이것이 실제로 합성 가능한지 여부를 검증했다. 우선 흡수파장은 자외선에서 가시광 영역의 200나노미터(nm, 1nm는 10억분의 1미터), 300nm, 400nm, 500nm, 600nm의 5개로 정했다.
설계 방법으로는 우선 데이터베이스(DB)에 있는 수소(H), 탄소(C)질소(N)산소(O)원자에서 구성되는 분자량 400정도의 1만3000개의 유기 분자에 관한 정보(구조식)을 입력하고, 딥러닝 기반의 인공신경망 기술인 Recurrent Neural Network(RNN)을 통해 모든 유기분자의 법칙을 학습시켰다.
이어 5개의 사로 다른 흡수파장을 가진 분자에 경우의 수를 줄이는 방법인 ‘몬테카를로 탐색기법(Monte Carlo Tree Search, MCTS)’ 알고리즘을 적용했다. 또 MCTS로 탐색한 분자의 성질과 안정성을 밀도함수이론(Density Functional Theory, DFT)으로 계산했다.
이런 과정을 거쳐 원하는 흡수파장을 가진 유기 분자 후보를 자동으로 계산해 알아보게 됐다. 연구진은 “1개의 흡수파장을 가진 분자 설계는 2일, 5개 파장에 대해선 총 10일 간의 계산이 이뤄졌다”며 “그 결과 RNN과 MCTS에 의한 생성된 분자는 3200개로 이 중 86개가 DFT에 의해 예측된 안정적이고 원하는 흡수 파장을 가진 분자였다”고 밝혔다. 또 가시광선과 바로 연결되는 자외선 스펙트럼을 측정한 결과 6개 중 5개가 원하는 흡수파장을 나타냈다.
스미타 마사토 박사는 “지금까지 화학 분야 연구자들은 자연계에서 발견됐거나 우연히 합성된 유기 분자의 성질을 최적화하는 방법으로 기능성 분자를 합성해 왔다”며 “이번에 개발한 AI 기술은 지금까지 발견하지 못한 분자를 찾아낼 가능성을 높였다”고 말했다.
www.jst.go.jp
AI를 이용한 물질 구조 예측 방법에 관한 최근 논문에 대한 설명입니다~
(원문)
AI로 물질 구조 빠르게 해석
[요약]물질의 구조를 알아보는 스펙트럼분석법을 AI(인공지능)을 통해 수 초안에 끝낼 수 있는 새로운 방법을 도쿄대 연구진이 개발했다.(2018.09)
도쿄대 생산기술연구소 미조구치 텔야스 교수팀이 물질 분석에 널리 이용되는 스펙트럼분석법을 인공지능(AI)으로 해석·예측하는 새로운 방법을 개발했다고 밝혔다.
스펙트럼분석법은 어떤 외부에너지의 자극을 받고 나온 빛의 스펙트럼을 분해해 거기에 존재하는 파장으로부터 광물에 존재하는 원소(분자)를 측정하는 방법을 말한다.
물질 개발엔 다양한 분광법으로 스펙트럼을 측정한다. 전자분광법이 대표적이다. 이는 원자·분자 또는 고체 표면 등의 물질에 전자파, 광자 또는 전자, 이온과 같은 전하입자, 들뜬 원자 등을 닿게 해 전자를 발생시키고 그 전자의 에너지 분포, 각 분포 등을 전기장 혹은 자기장 등을 사용한 분석기에 의해 측정해 물질의 상태 또는 물질과 입사 입자 등의 상호작용을 조사하는 실험법이다.
투과형 전자현미경을 이용해 측정하는 이 전자분광법은 원자 분해 능력에서 원자 배열과 전자 구조를 파악할 수 있다.
또 싱크로톤을 이용해 측정하는 전자분광법은 피코초 차원의 시간 분해능으로 반응을 추적할 수 있다.
싱크로트론은 사이클로트론의 문제점을 해결하기 위해 설계된 것으로, 시간에 따라 자기장과 전기진동기의 진동수가 변해 원운동을 하는 대전 입자의 반지름을 일정하게 유지하게 하는 입자 가속기를 뜻한다. 전자선 및 X선을 이용한 진동분광법은 지금까지 반도체 설계, 전지 개발, 촉매 해석 등에 널리 이용돼 왔다.
최근에는 측정 기술이 발달해 공간·시간 분해가 가능한 스펙트럼의 측정을 쉽게 실시할 수 있으며, 한 번 측정에서 수천·수만의 실험 스펙트럼을 취득할 수 있다.
하지만 이 스펙트럼을 해석해 원자 배열이나 전자 구조 정보를 얻기 위해선 연구자가 전문 지식과 고도의 계산법, 그리고 많은 시간이 요구된다. 다시 말해 방대한 양을 모두 해석하는 것이 현실적으로 불가능하다.
연구진은 이런 한계를 뛰어넘기 위해 인공지능의 머신러닝(기계학습) 기법을 이용한 데이터 구동형 스펙트럼 해석·예측법을 개발하는데 성공했다.
이번에 개발한 방법은 ‘물질 정보의 나무 모양도’와 ‘스펙트럼의 나무 모양도’라는 2개의 나무 모양도를 사용한 것이다.
상관된 2개의 나무모양도를 이용한 기법은 복잡한 알고리즘으로 설계됐다.
연구진은 “이는 물질의 구조 정보를 입력하는 것만으로도 분광 형상을 단 몇 초만에 스펙트럼을 정확하게 분석·예측할 수 있다”고 설명했다.
이번 연구성과는 국제학술지 사이언스 리포트 2018년 9월 6일 온라인판에 게재됐다.