생물 유전체(게놈)의 DNA 내에서 유전정보가 없는 부분을 ‘정크 DNA’ 또는 ‘불용 DNA’라고 한다.
인간 유전체에는 약 32조 개의 염기쌍(chemical pairs)이 있는데 이중 대략 98%가 정크 DNA로 추정된다. 고등생물일수록 정크 DNA가 많지만, 지금까진 왜 존재하는지조차 베일에 싸여 있었다.
그런데 이런 DNA에 ‘정크(쓰레기)’라는 표현은 이제 쓰기 어렵게 됐다. 유전자 발현 시 그 위치와 타이밍 등을 이들 DNA가 제어한다는 게 밝혀졌기 때문이다.
미국 프린스턴대 과학자들이 정크 DNA의 염기서열을 분석하는 인공지능(AI) 알고리즘을 개발해, 정크 DNA의 돌연변이가 자폐증을 유발한다는 걸 처음 입증했다.
이 대학의 올가 트로얀스카야 컴퓨터 생명공학 교수팀은 최근 이런 내용의 연구보고서를 저널 ‘네이처 제네틱스(Nature Genetics)’에 발표했다. 이 연구엔 록펠러대의 로버트 다넬 분자 신경종양학 교수팀도 참여했다.
프린스턴대 측이 30일(현지시간) 온라인( 바로가기 )에 공개한 보도자료에 따르면 이번에 개발된 AI 알고리즘엔 스스로 학습하는 ‘딥러닝’ 기술이 적용됐다.
이 알고리즘은 전체 유전체의 염기쌍 하나하나를, 주변의 1천개 염기쌍과 묶어서 연관 분석하는 작업을, 모든 돌연변이를 찾아낼 때까지 계속한다.
그렇게 돌연변이 염기쌍별로 인체에 미칠 영향을 예측한 다음 최종적으론, 유전자를 올바로 제어할 염기서열과 유전자 제어를 방해할 돌연변이의 우선순위 목록을 각각 생성한다.
프린스턴대 산하 ‘루이스-시글러 통합 유전체학 연구소’의 객원 연구원이자 보고서의 제1 저자인 크리스토퍼 박 박사는 “모든 가능성을 따져 우선순위를 매긴다는 건, 가장 가능성이 큰 지점에서 실험을 계속할 수 있다는 점에서 매우 유용하다”고 설명했다.
연구팀은 이 알고리즘을 이용해, 가족 병력이 없는 자폐증 환자 1천790명의 유전체를 부모·형제와 함께 분석했다.
그 결과 정크 DNA에서 생긴 돌연변이의 영향으로, 자폐증 환자의 뇌에서 유전자가 제대로 발현하지 않았다는 걸 확인했다. 이들 환자 가운데 종전의 방법으로 유전적 요인이 확인된 경우는 30% 미만이라고 연구팀은 말한다.
트로얀스카야 교수는 “유전정보가 없고, 유전되지도 않는 DNA 돌연변이가 복잡한 질병을 유발한다는 게 명백히 입증된 건 이번이 처음”이라면서 “지금까지 방치해 온 98%의 유전자를 갖고 앞으로 무엇을 연구해야 할지 생각하는 계기가 됐으면 한다”라고 과학 전문매체 ‘퓨처리즘(futurism.com)’에 말했다.
연구팀이 개발한 AI 알고리즘은 앞으로 다른 질병과 정크 DNA 돌연변이의 연관성을 분석하는 데도 널리 활용될 것으로 보인다.
트로얀스카야 교수는 “다른 질환에 동일한 AI 분석법을 쓸 수 있는 뼈대가 우리 보고서에 담겨 있다”고 말했다. 지금까지 유전적 요인을 찾지 못했던 암, 심장병, 뇌 신경질환 등에 특히 도움이 될 것으로 연구팀은 기대한다.
(원문: 여기를 클릭하세요~)