|
정재승 카이스트 바이오및뇌공학과 교수
|
과학자 혼자 절대 못 할 대용량
데이터 분석을 자원자들과 함께
수행하게 될 ‘백인천 프로젝트’
1960년대 과학논문의 평균 저자 수는 1.3명. 그러나 90년대 들어 3.1명으로 늘더니 최근에는 4명을 넘어섰다. 다시 말해 과학연구 하나를 완수하는 데 4명 이상의 기여가 필요하다는 얘기다. 최근 들어 과학연구는 여러 분야의 지식과 기술을 융합해야만 해결할 수 있는 복잡한 주제를 주로 다루다 보니, 여러 연구자들이 참여하는 경우가 늘었고 공동연구도 많아졌다.
그런 가운데 21세기 웹2.0 시대가 도래하면서 ‘집단지성’으로 과학연구를 수행하는 것이 가능한지 알아보는 시도가 여럿 생겨났다. 그 대표적인 예가 ‘세티앳홈’(SETI@home·외계생명체탐사를 집에서) 프로젝트다. ‘세티’(외계생명체탐사 프로젝트)란 지적인 생명체가 존재한다면 사용했을 성간신호 분석을 통해 외계생명체의 존재를 확인하는 천문연구다. 천문학자 칼 세이건의 소설 <콘택트>를 통해 널리 알려졌으며, 그 전신인 오즈마 계획이 60년대부터 시작되었지만 지난 50년간 아무런 외계 지성의 흔적을 찾지 못하고 있다.
그로 인해 90년대 말 미국 의회는 세티 계획에 국가 예산을 더이상 지원하지 않기로 결정했고, 연구자들이 프로젝트를 지속하기 위해 대용량 슈퍼컴퓨터만 사용하지 않고 전세계에서 집집마다 쉬고 있는 개인컴퓨터를 활용해 분석하는 ‘분산 컴퓨팅’ 프로젝트를 시도한 것이 바로 ‘세티엣홈’이다.
미국 버클리 캘리포니아대학이 1999년 5월17일 웹에 공개한 프로그램을 내려받으면, 개인컴퓨터가 쉬는 동안 자동으로 외계에서 온 전파망원경 신호자료를 분석해 버클리로 보낸다. 이런 연구는 일반인들에게 ‘외계생명체 탐사 연구에 나도 기여하고 있다’는 자긍심과 함께, 과학연구가 어떻게 수행되는지 경험하게 해준다.
그렇다면 과연 에스엔에스(SNS) 시대에는 어떤 형태로 집단지성을 활용해 과학연구를 할 수 있을까? 과학자는 평소 과학 얘기를 주고받던 팔로어들과 어떤 공동연구를 수행할 수 있을까?
이 질문에 답을 하기 위해 이른바 ‘백인천 프로젝트’를 시작하게 됐다. ‘프로야구에서 4할 타자는 왜 사라졌는가’라는 질문에, 지난 30년간 한국 프로야구의 데이터를 모두 분석해 답해보려는 야심 찬 연구다. 미국과 마찬가지로 우리나라도 프로야구 출범 첫해 백인천 선수가 4할1푼2리로 4할을 넘긴 이래 4할 타자가 사라졌다. 투수의 기량이 점점 출중해져서일까? 야구의 규정이 투수에게 유리하게 바뀌어서? 아니면 타자들이 점점 나태해져서?
진화생물학자 스티븐 제이 굴드는 그의 저서 <풀 하우스>에서 시스템이 성숙할수록 평균을 중심으로 개체 간의 분산이 줄어들듯, 야구선수들의 기량도 점점 평준화되어, 평균 타율을 중심으로 타율이 지나치게 높은 선수도, 지나치게 낮은 선수도 점점 사라지는 것이 보편적인 특징이라고 주장했다. 그렇다면 과연 한국 프로야구에서도 지난 30년간 선수들 간의 타율 격차, 방어율 격차는 점점 줄어들고 있을까?
12월18일 ‘백인천 프로젝트’를 시작하겠다며 동참을 호소한 트위터 글에 100여명의 자원자가 기꺼이 참여하겠노라고 답을 주셨다. 대용량 야구데이터 분석, 문헌조사, 과학논문 쓰기 등에 참여하겠다고 의견도 달았다. 집단지성으로 야구학(Sabermetrics) 연구를 수행할 수 있게 된 것이다.
순수한 과학적 호기심과 열정만으로 모인 개인들이 과학자 혼자서는 절대 할 수 없는 대용량 데이터 분석연구를 수행하게 됐다. 트위터로 소통하고, 과학자들을 위한 저널논문과 일반인들도 즐길 수 있는 우리말 보고서를 함께 만들어볼 생각이다. 2012년 겨울 스토브 리그를 ‘집단 열정’으로 뜨겁게 달굴 계획이다. 정재승 카이스트 바이오및뇌공학과 교수
기사공유하기