UPDATED. 2020-10-28 17:00 (수)
4차 산업혁명 시대! AI로 결핵 신약후보 찾았다?
4차 산업혁명 시대! AI로 결핵 신약후보 찾았다?
  • 신용수 기자
  • 승인 2020.10.16 06:00
  • 댓글 0
이 기사를 공유합니다

기계학습 AI에 불확실성 더해 72개 데이터로 1만1000개 분석 성공
새로운 치료 표적 PknB와 표적 대상 억제제 동시에 찾아내
사진. 게티이미지
사진. 게티이미지

인공지능(AI)이 생물학의 연구 영역으로도 점차 스며들고 있다. 국내 연구팀이 코로나19 치료 후보물질로 아타자나비르를 예견한 데 이어, 이번에는 미국 연구팀이 AI를 통해 새로운 결핵 치료제 후보물질을 찾아냈다. 4차 산업혁명 시대 속에서 AI가 앞으로 제약 분야의 연구 도구로서 맹활약할 것을 예고하는 신호탄인 셈이다.

미국 매사추세츠공대(MIT) 연구팀은 기계학습 알고리즘을 이용해 결핵균 내 필수단백질을 표적으로 삼는 화합물들을 식별하는 데 성공했다. 이 연구에 관한 논문은 국제학술지 ‘셀 리포트(Cell Reports)’ 10월 15일자에 게재됐다.

기계학습(machine running)이란 통계적 접근법을 이용해, 기계가 인간의 학습방식을 모방하도록 설계·제작하는 AI를 말한다. 최근 수년 동안 생물학계 일각에서는 신약후보물질 탐색에 기계학습 AI를 사용하기 시작했다. 수많은 화합물이 등록된 방대한 데이터베이스 속에서 특정 표적과 상호작용하는 잠재적인 후보물질을 찾으려면 AI의 도움이 필요했다.

하지만 기계학습도 약점은 있었다. 분석 중인 물질이 기존 데이터베이스에 등록된 물질과 유사하다면 알고리즘이 잘 수행되지만, 기존에 등록된 물질과 큰 차이를 보이는 경우 분석에 오류를 겪을 가능성이 크다는 것.

연구팀은 ‘가우시안 프로세스’라는 기술을 이용해 이 문제를 해결했다. 가우시안 프로세스는 훈련된 데이터에 처음부터 불확실성을 부여하는 방법을 말한다.

예를 들어 특정 분자가 표적 단백질에 얼마나 강력하게 결합하는지를 분석할 경우, 분석에 들어간 특정 물질의 데이터가 기존 데이터베이스로 훈련된 데이터와 큰 차이를 보인다면 AI는 이 물질에 관한 분석결과에 불확실성 값을 크게 부여한다. 연구팀은 이 데이터를 해석해 어떤 분자를 실제 실험을 통해 확인할지 선별한다.

이 접근법의 또다른 장점은 훈련 데이터의 수를 줄일 수 있다는 것이다. 기계학습 AI는 특성상 훈련용 데이터가 필요하다. 단백질 결합 여부를 분석한다면, 결합을 잘하는 분자와 잘하지 못하는 분자들에 대한 데이터베이스를 AI가 학습할 수 있도록 해야 한다. 따라서 AI로 원하는 물질의 데이터를 확인하기까지는 일정 시간이 필요한데, 이 시간을 줄일 수 있다는 뜻이다.
 
연구팀은 이 방법을 통해 분자 72종의 데이터와 단백질 키네이스(인산화효소) 400여 종의 데이터만으로도 거의 1만1000개에 달하는 분자의 단백질 상호작용 여부를 분석할 수 있었다. 연구팀이 분석한 1만1000개의 분자 대부분은 훈련용 분자 72종과는 매우 달랐다.

연구팀은 특히 단백질 키네이스 중에서도 인간의 단백질 키네이스 3종과 결핵균의 단백질 키네이스 1종을 집중 조명했다. 연구팀이 집중 조명한 결핵균 단백질 키네이스는 PknB(피케이엔비)로 결핵균 생존에 필수적이지만, 기존 결핵균용 항생제들이 표적으로 삼는 단백질은 아니었다.

연구팀은 이를 통해 1만1000개 데이터 중에서 PknB에 대한 결합력이 큰 분자들을 선별했다. PknB에 결합해 활성을 방해할 억제제 후보를 찾아낸 것. 이후 실험을 통해 AI가 약 90%의 정확도로 결합력을 예측하는 데 성공했다는 점을 확인했다. 이는 기존 AI의 정확도 30~40%와 비교했을 때 훨씬 높은 수치다.

연구팀은 이후 AI가 예측한 PknB 억제제 중 일부를 배지에 배양한 결핵균에 투여해 해당 물질이 결핵균 억제에 실제로 효과가 있다는 사실을 검증했다. 이들 억제제는 결핵균에 감염된 인간 면역세포에서도 정상적으로 작용했다.

연구를 주도한 브라이언 브리슨 MIT 생물공학과 교수는 “이번 연구를 통해 결핵균을 공격할 새로운 표적과 그 표적에 알맞은 후보물질을 찾아내는 데 성공했다”며 “추가 실험을 통해 새로운 데이터를 AI에 학습시켜 정확도를 높일 것”이라고 말했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.