개인정보를 보호하면서 다수 기관 간의 유전체 협력연구를 촉진할 수 있는 알고리즘이 국내 연구팀을 통해 개발됐다.인간의 유전자(DNA) 정보는 질병의 원인을 찾거나 역사 속 인류의 인구 이동을 파악하는 등 다양한 분야의 연구에 활용되고 있다. 이러한 유전체 연구에서 중요한 것은 많은 수의 연구 참여자, 즉 '표본'을 확보하는 것이다. 때로는 하나의 기관에서 충분한 수의 표본을 확보할 수도 있겠지만, 이것이 불가능할 때가 있다. 이 때 좋은 방법은 다수 기관 간의 협력연구와 정보공유를 통해 표본 수를 늘리는 것이다.
하지만 유전자 정보는 개인정보이기 때문에 기관 간에 해당 정보를 공유하는 것은 개인정보 침해의 문제를 일으킬 수 있다. 예를 들어 DNA 정보를 기반으로 특정인이 어떤 질병에 취약한지를 알 수 있다. 더욱이 최근 관련 학계에서는 유전자 정보에 부가적인 정보까지 더해질 경우 특정인의 신원이나 거주지를 유추할 수 있어 유전자 정보가 악용될 수 있음을 보고하고 있다. 즉, 연구를 활성화하기 위해서는 유전자 정보를 공유해야 하지만, 개인정보를 보호하기 위해서는 유전자 정보 공유를 금지해야 하는 딜레마에 직면해 있다.
서울의대 한범 교수팀은 울산의대·카이스트 연구진과 함께 이 딜레마를 풀었다고 30일 밝혔다. 개인의 유전 정보를 보호하면서도 다기관 유전체 협력연구를 촉진할 수 있는 '유전자 네비게이션'을 개발한 것. 유전자 정보를 특수한 방식으로 암호화하여 유전정보를 보호하는 동시에 연구에 필요한 정보만이 드러나도록 했다.
이러한 특수한 암호화를 위하여 연구팀은 자동차나 항공 네비게이션에서 일반적으로 사용되는 '다변측정'이라는 기술을 사용했다. 네비게이션이 위치 특정 시 특정 지점과 인공위성 간 거리를 측정하듯이, 사람 간 유전적 거리를 측정하여 거리 정보를 암호화를 하고 이 암호화된 정보만을 공유함으로써 다기관 유전체 연구에 활용할 수 있도록 한 것이다. 이에, 알고리즘 이름을 '유전자 네비게이션(Genomic GPS)'이라 명명하였다.
연구팀은 이 알고리즘을 실제 유전체 데이터에 적용하는 실험을 진행한 결과, 정보를 암호화한 상태로 기관 간에 공유했을 때 다양한 유전체 연구가 실제로 가능하다는 것을 증명했다. 가까운 친척을 찾아내거나, 혼혈인의 조상을 유추하거나, 유럽인들의 유전자 지도를 만드는 등의 여러 유전체 연구에서 암호화된 정보는 비암호화된 정보와 거의 비슷한 정확도를 보였다.
또한, 연구진은 수학적 증명을 통하여 암호화된 정보가 유전정보를 안전하게 보호한다는 점을 확인했다. 유전자 정보가 암호화된 후에는 연구자 간 정보가 공유되어도 문제가 생기지 않음을 증명한 것이다. 이 수학적 증명을 주도한 카이스트 수리과학과 백형렬 교수는 “유전 거리로 치환된 정보를 해커가 훔쳐 내더라도, 유전자 개인정보의 원본을 재구성할 가능성은 실질적으로 0%에 수렴한다”라고 말했다.
한범 교수는 "개인정보 보호 이슈로 인해 다기관 연구자들의 공동연구가 어려워지고 있는 현 시점에, 이 알고리즘이 국가 간·기관 간 유전체 협력연구를 활발히 하는 데 사용될 수 있기를 기대한다"라고 말했다.
이번 연구는 한국연구재단의 원천기술개발사업과 중견연구자지원사업의 지원을 받아 진행되었으며, 최근 '게놈 바이올로지(Genome Biology)' 학술지에 게재됐다.