세상에 존재하지 않는 신약을 만드는 일은 수십만개 이상의 화합물을 합성하고 치료 효과를 찾는 확률 게임이다. 종가(宗家)에서 장 담그는 비법을 집안 며느리에게도 함부로 전수하지 않는 것처럼 제약사들은 화합물의 집합을 잠재적 신약의 보물창고로 여긴다.

화합물은 2개 이상의 다른 원소가 일정한 비율로 구성된 것이다. 어떻게 합성하냐에 따라 새로운 구조의 화학식이 탄생하기도 한다. 기본적인 화합물은 해외에서 사 오지만 화합물끼리 합성도 가능하기 때문에 신규 화합물의 양은 제약회사의 연구 역량으로 인정받는다.

 

영하 6도의 저온으로 유지되는 한국화합물은행에 보관 중인 화합물. /조선DB

 

 

화합물들의 집합은 다양한 종류의 책이 여러 권 소장된 도서관과 같다. 그래서 화합물 집합을 ‘라이브러리’라고 부른다. 여러 화학구조식이 백과사전처럼 집대성된 디지털 데이터베이스인 셈이다.

글로벌 제약회사들은 화합물 라이브러리를 지적재산으로 여기므로 사업부간 흡수합병 시 필수적으로 화합물 라이브러리를 공유한다. 한 회사의 연구소에서 활용도를 찾지 못했던 화합물이 다른 회사의 화합물과 만나 예기치 못했던 신약으로 탄생할 수도 있다.

신약을 만들 때는 화합물 라이브러리에 존재하는 구조대로 화합물을 만들어 실험을 시작한다. 필요할 때마다 손가락 하나 정도 길이의 유리병에 화합물을 담아 저온 환경에 보관하고 꺼내서 쓰는 개념이다.

정부출연 연구기관인 한국화학연구원은 이런 화합물을 영하 6도의 저온 환경에서 보관하는 한국화합물은행을 운영하고 있다. 화합물 보관량은 약 61만종에 달하며 국내에서 신약개발을 원하는 연구자에게 화합물을 무료로 제공한다.

1990년대 초반까지만 해도 신약 1개를 개발하려면 연구원이 직접 수만개의 새로운 화합물을 시험해야 했다. 사람이 일일히 확인하기 때문에 많은 인력과 시간이 필요했다. 최근에는 신약 개발 효율을 높이고자 화합물 라이브러리에 인공지능(AI)을 접목한 방법이 대세다.

AI는 각 화합물이 사용된 치료제 기록과 특성을 기억하고 있다가 어떤 질환에 맞는 치료제를 개발하려고 할때 적합한 화합물을 제시한다. 이를 위해 각 화합물은 바코드처럼 고유번호를 갖는다.

AI를 활용한 신약 예측 시스템을 사용하면 화합물을 직접 합성하지 않고도 각 화합물의 질병 치료 효과를 알 수 있다. 하나의 신약이 나오기까지 평균 10년, 수조원의 비용이 필요하다는 점을 고려하면 화합물 검색·예측은 연구개발 비용과 시간 단축을 위해 필수적이다.

국내에서는 SK바이오팜과 JW중외제약 등이 AI 신약 개발 플랫폼과 라이브러리 검색 시스템을 갖추고 있다. 뇌전증 신약물질 ‘세노바메이트’를 발굴한 SK바이오팜의 경우, 중추신경계통과 관련된 저분자 화합물을 40만개 보유하고 있다. 이 가운데 2만5000여개는 SK바이오팜이 직접 합성한 결과물이다.

한국화학연구원도 국내·외 화합물 정보를 통합한 웹검색 기반 데이터베이스를 구축, 국내 연구자들에게 서비스를 제공할 예정이다. 국내 연구자들은 화합물 정보를 통해 새로운 약물 데이터를 만들어 낸다. 이렇게 만들어진 정보는 다시 한국화학연구원의 데이터베이스에 모여 빅데이터를 이룬다.

이선경 한국화학연구원 한국화합물은행 센터장은 “국내 화합물 관련 데이터가 증가하고 활용도가 높아질수록 가치 있는 화합물을 확보할 수 있다”며 “라이브러리, 한국화합물은행 등 빅데이터가 국산 신약 연구의 토대”라고 말했다.

 

 

(원문: 여기를 클릭하세요~)

 

 

 

아래는 2019년 7월 28일 뉴스입니다~

(원문: 여기를 클릭하세요~)

 

‘알파폴드’ 쇼크로 치열해지는 단백질 구조 분석 경쟁

알파폴드가 지난해 말 열린 CASP에서 제출한 답안. 파란색이 알파폴드의 예측 모델이다. 구글 딥마인드 제공

지난해 12월 초 멕시코 칸쿤에서 열린 ‘단백질 구조 예측 학술대회(CASP)’에서 구글 지주회사 알파벳의 인공지능(AI) 부문 자회사 ‘딥마인드’는 3차원(3D) 단백질 아미노산 결합구조 예측 알고리즘 ‘알파폴드(AlphaFold)’를 공개했다. 이미 3차원 구조가 밝혀진 90종 단백질의 선형 아미노산 시퀀스만 제시하고 어떤 구조로 아미노산이 접혀 새로운 단백질을 생성했는지 예측하는 역량을 겨루는 대회인 CASP(Critical Assessment of protein Structure Prediction)에서 알파폴드는 경쟁자들을 멀찌감치 따돌리고 우승을 차지했다.

생물학자들은 단백질의 기본 단위인 아미노산이 어떻게 입체적으로 배열되고 접혀 3차원 구조의 단백질을 형성하는지 연구한다. 인류의 난제로도 불리는 3차원 단백질 구조 예측이 가능해지면 질병이 생기는 메커니즘을 더 잘 이해할 수 있다. 새로운 개념의 치료제를 설계하는 데도 도움을 준다.

알파폴드가 생물학계에 충격을 준 뒤 3D 단백질 구조 예측 연구는 더욱 활기를 띠고 있다. 국제 학술지 네이처는 최근 알파폴드의 강력한 대항마가 될 수 있는 AI 알고리즘이 등장한 사실을 집중 조명했다. 이 알고리즘을 활용하면 주어진 아미노산 사슬 배열로 만들어질 수 있는 3D 단백질 구조를 밀리초(millisecond, 1000분의 1초)라는 순식간에 예측할 수 있다. 수 시간이나 몇 일이 소요되는 알파폴드에 비교도 안될 정도로 빠른 속도다.

주인공은 미국 하버드대 의대 생물학자인 모하메드 알쿠래시 박사다. 올해 4월 국제학술지 ‘셀 시스템즈(Cell Systems)’에 논문으로 발표한 알쿠래시 박사의 AI 알고리즘은 딥마인드의 알파폴드보다 100만배 가량 빠른 속도로 단백질 구조를 예측할 수 있는 것으로 분석됐다.

CASP에서 압도적으로 두각을 드러낸 알파폴드는 2단계에 걸쳐 작동한다. 먼저 특정 단백질의 아미노산 시퀀스를 기존 아미노산 시퀀스 데이터베이스에 있는 다른 유사한 시퀀스와 비교해 단백질 사슬에서 서로 이웃하지 않지만 나란히 나타나는 것처럼 보이는 아미노산 쌍을 찾아낸다. 쌍으로 이뤄진 이들 아미노산은 3차원으로 접히는 단백질 구조에서 서로 인접한다. 딥마인드는 이 아미노산 쌍을 찾아내는 작업을 AI를 구현하는 기본 메커니즘인 신경망(Neural Network)에 학습시킨다. 그런 뒤 쌍으로 인접한 아미노산 사이의 거리를 예측한다.

딥마인드는 또 단백질이 3차원 구조로 접혀 생성되는 메커니즘을 예측할 수 있도록 신경망을 훈련시킨다. 또다른 신경망은 연속되는 아미노산 쌍들이 3차원으로 접히는 구조에서 나타나는 각도를 예측할 수 있도록 학습한다.

특정 단백질의 3차원 구조 예시. 선형 아미노산 시퀀스가 여러 방식으로 접히며 3차원 단백질이 생성된다. 어떤 아미노산이 어떤 형태로 단백질 구조를 이루는지 알아내는 것은 생물학계의 오랜 난제였다. 위키미디어 제공.

그러나 이런 과정을 통해 단백질 구조 자체를 예측하긴 불가능하다. 신경망을 통해 학습한 AI 알고리즘이 예측한 정확한 아미노산 쌍 조합과 거리, 결합각도가 실제 물리적으로 가능하지 않을 수 있기 때문이다. 이 때문에 딥마인드는 두 번째 단계로 물리적으로 가능하면서도 무작위적인 단백질 접힘 배열을 만들었다. 이 때 신경망 대신 별도로 개발한 ‘최적화 알고리즘’을 적용, 첫 번째 단계에서 신경망이 예측한 구조를 반복적·무작위적으로 시도해보며 물리적으로 가능한 3차원 단백질 구조에 가장 가까운 구조를 만들어내 예측하는 것이다.

알쿠래시 박사가 고안한 방식은 알파폴드와는 조금 다르다. 첫 번째 단계에서 신경망을 활용하는 게 아니라 단백질 구조를 계산하는 데 수학적 함수를 사용한다. 수학적 함수 기반으로 계산된 단백질 구조를 기반으로 진보된 인공지능 기법인 ‘딥러닝’을 결합하는 방식이다.

알쿠래시 박사의 알고리즘 시스템의 핵심도 물론 신경망이다. 이 신경망은 아미노산 시퀀스가 어떻게 단백질 구조에 매핑되는지 이미 알려진 데이터를 얻은 뒤 이를 신경망에 학습시켜 잘 알려지지 않은 서열로부터 새로운 3차원 단백질 구조를 예측하는 방식을 학습한다.

알쿠래시 박사는 그의 접근법에 ‘반복적 기하학적 네트워크’라는 이름을 붙였다. 아미노산이 배열되는 앞뒤의 정보를 기반으로 단백질의 일부분 구조를 예측하는 방식이다. 사람들이 문장 전체를 이해할 때 해당 문장에서 주변 단어에 영향을 받을 수 있는 단어를 해석하는 것과 유사하다. 알쿠래시 박사는 자신이 개발한 알고리즘 소스코드를 공개해 이 분야 다른 연구자들이 연구를 확장할 수 있도록 했다.

알파폴드가 압도한 단백질 구조 예측 연구에서 많은 연구자들이 AI를 활용한 연구에 나서고 있다. AI 프로그램을 이용한 단백질 구조 예측이 당장 신약 연구에 활용될 수 있는 수준은 아니다. 그러나 이같은 기술의 경쟁 속도를 고려하면 적어도 조만간 단백질 변이가 질병에 어떤 영향을 미치는지, 항체 단백질은 어떻게 만들어지는 등을 알아내는 데 획기적인 도움을 줄 것으로 기대된다.

CASP 대회를 설립한 미국 메릴랜드대학 생물학자인 존 몰트 교수는 네이처와의 인터뷰에서 “3차원 단백질 구조 예측에 인공지능 기술이 결합하면서 이 분야 연구가 어떤 양상으로 전개될지 예측하기 어려울 정도로 흥미진진하다”며 인류의 난제를 해결할 가능성을 보여주고 있다고 설명했다.

 

 

 

 

아래는 2020년 2월 1일 뉴스입니다~

(원문: 여기를 클릭하세요~)

 

인공지능이 개발한 신약, 사상 첫 임상시험

영국 신생기업, 일본서 임상 1단계 실시
능동학습 통해 강박장애 치료물질 개발
4.5년 걸리던 작업, 12개월도 안돼 마쳐

인공지능이 개발한 신약물질이 사상 처음으로 임상시험에 들어간다. 엑사이언티아 웹사이트

인공지능이 개발한 신약 후보 물질이 인간을 대상으로 한 임상 1단계 시험에 들어간다. 사상 처음 있는 일로, 인공지능의 새로운 영역을 개척한 것으로 평가된다.

영국의 스타트업인 엑사이언티아(Exscientia)와 일본 제약업체 다이닛폰스미토모제약의 합작품인 이 약물은 강박장애(OCD) 치료제다.

엑사이언티아는 보통 신약물질 개발에서 임상시험까지는 4.5년이 걸리지만, 이번에 인공지능이 개발한 약물은 12개월이 채 걸리지 않았다고 30일 밝혔다. 이는 수십억달러에 이르는 개발비용도 크게 줄여주는 효과도 있다.

엑스사이언티아 대표인 앤드루 홉킨스는 <비비시> 인터뷰에서 “우리는 그동안 환자를 진단하고 데이터를 분석하는 인공지능을 보아왔지만 이번엔 인공지능이 직접 신약을 만들어냈다”며 약물 발견에서 새로운 초석을 쌓았다고 평가했다.

인공지능 덕분에 일반적인 신약물질 후보군을 5분의1로 줄여 테스트할 수 있었다. 엑사이언티아

엑사이언티아는 기본 데이터가 적은 신약 분야의 특성을 고려해, 적은 데이터량으로 효율적인 학습을 할 수 있는 능동학습(Active Learning) 알고리즘을 개발했다. 능동학습 알고리즘이 만들어낸 신약 물질 최종 후보는 ‘DSP-1181’이다. 인공지능이 수천만개의 가상 분자를 생성한 뒤 다양한 변수가 들어 있는 데이터베이스에 넣어 약효를 점검하고 걸러내는 과정을 거쳐 선택된 물질이다. 홉킨스는 “올바른 분자를 찾아내려면 수십억번의 판단 작업이 이뤄져야 한다”며 “인공지능 덕분에 일반적인 신약 화합물 후보군의 5분의 1인 350개 화합물만 직접 제조해서 테스트할 수 있었다”고 밝혔다. 그는 “이는 기록적인 생산성”이라고 강조했다.

첫번째 임상시험은 일본에서 진행된다. 이것이 성공하면 다른 나라에서도 임상시험을 할 예정이라고 한다.

홉킨스 대표는 “인공지능이 설계한 신약이 탄생하는 건 올해가 처음이지만 10년 후에는 인공지능이 모든 신약을 만들어낼 수도 있을 것”이라고 말했다.

 

 

 

아래는 2023년 6월 26일 뉴스입니다~

(원문: 여기를 클릭하세요~)

 

이세돌 꺾었던 알파고 후손, 생명공학계 핵인싸 됐다

딥마인드 개발한 ‘알파폴드’
단백질 구조 2억개 모두 예측
인간은 1개 예측에 수년 걸려
세계적 석학 “노벨상감” 극찬
2016년 3월 15일 대국을 마친 이세돌 9단이 데미스 허사비스 구글 딥마인드 최고경영자(CEO)에게 바둑판을 선물하고 있다. 매경DB

 

2016년 3월 한국에서 치러진 이세돌 9단과 구글 딥마인드의 인공지능(AI) ‘알파고’의 대국. 모두의 예상을 깨고 알파고가 4대1로 완승하면서 전 세계에는 AI 바람이 불었다. 단연 이세돌 9단을 이긴 딥마인드의 알파고에 관심이 쏠렸다. 알파고는 지금 무엇을 하고 있을까.

딥마인드는 확률상 불가능할 것이라 여겼던 바둑에서 인간을 제압한 뒤 기후변화에 도전했다. 알파고의 학습 능력을 기반으로 전력 효율화에 나선다는 계획이었다. 실제 딥마인드는 2016년 구글 데이터센터에 알파고를 투입해 냉각장치에 쓰이는 에너지의 40%, 데이터센터 전체 전력 소비량의 15%를 줄이는 데 성공했다고 밝히기도 했다. 자신감을 얻은 딥마인드는 영국 정부와 함께 영국의 전력 사용량을 10%가량 줄이는 프로젝트에 나섰지만 2020년 팀은 해체됐다. 당시 알파고가 바둑과 같은 통제된 환경에서는 높은 기량을 보여줬지만 현실 세계의 복잡성에 제대로 대응하지 못한다는 비판도 나왔다.

알파고 후손 중 명맥을 이어가고 있는 AI는 ‘알파폴드’를 꼽을 수 있다. 2020년 ‘이기적 유전자’의 저자이자 저명한 생명과학자 리처드 도킨스는 자신의 트위터에 “컴퓨터 프로그램에 노벨상을 수여한다면”이라는 글을 남기고 알파폴드에 관한 기사를 링크했다. 알파폴드가 노벨상을 받을 만큼 업적을 내고 있다는 얘기다.

딥마인드가 개발한 알파폴드는 지금까지 인간이 쌓아온 지식을 기반으로 단백질 구조를 예측하는 AI다. 일반인이 쓸 일은 전혀 없지만 생명공학 분야에서, 특히 신약을 개발하고 있는 연구자에게는 반드시 필요한 도구다. 단백질은 생명체를 이루는 세포의 주요 성분인 만큼 구조를 알면 질병 치료에 요긴하게 활용할 수 있다.

인류가 확인한 단백질 종류는 약 2억개, 2020년까지 구조를 확인한 것은 17만개 정도에 불과하다. 지금까지 과학자들은 단백질에 X선을 쏴 구조를 파악했는데 한 개의 단백질 구조를 알아내는 데 짧으면 수개월에서 길면 수년이 걸렸다. 알파폴드는 이 분야에서 이미 인간을 제쳤다. 2018년 멕시코에서 개최된 단백질 구조를 맞히는 국제대회에서 알파고는 문제로 주어진 43개 중 25개 구조 예측에 성공했다. 실험실에서는 확인됐지만 아직 과학기술계에 공개되지 않은 단백질 구조를 예측하는 대회였다. 2위인 미국 미시간대 연구진은 단 3개를 맞히는 데 그쳤다. 2021년 7월 알파폴드2는 36만5000개의 단백질 3차원 구조를 예측하는 데 성공했다고 밝히며 이 데이터베이스를 발표했다. 이어 지난해에는 2억개에 달하는, 거의 모든 단백질 구조를 예측했다면서 데이터를 공개했다.

 

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *