본문 바로가기

내가 좋아하는 책들

인포메이션 #11 생명의 고유 코드

 

제 10 장 생명의 고유 코드

유기체의 완전한 설명서는 이미 알에 적혀 있습니다.

 

 

모든 살아 있는 것들의 근원에 있는 것은
불도, 따뜻한 숨도, '생명의 불꽃'도 아니다.
근원에는 정보, 단어, 지시문이 있다. 
리처드 도킨스(1986)

 

 

과학자들은 자기들의 기본 입자를 사랑한다. 형질이 한 세대에서 다음 세대로 전해지려면 어떤 근원적인 형태를 취하거나 매개체가 있어야 한다. 물리학자가 원자와 분자를 가져야만 한다면 생물학자는 생리학적 단위, 즉 형성 분자 혹은 '형성자'를 가져야만 한다.

 

'형성자'는 인기가 없었고, 의식적으로 '유전자'라는 단어를 만들어 낸 것이다. 널리 알려진 미신은 "개별적 특성"이 부모에게서 자식으로 전달된다는 미신이었다. 요한센은 이것이 "유전에 대한 가장 순진하고 오래된 관념"이라고 말했다. 하지만 이는 틀린 생각이었다. 요한센은 이렇게 말한다. "모든 유기체의 '개별적 특성'은 자손의 특성을 전혀 유발하지 않으며, 조상과 후손의 특성은 모두 발생의 기원인 생식체 같은 '성물질'의 속성에 의해 거의 같은 방식으로 결정된다." 유전되는 것은 더 추상적이고 더 잠재적인 성질을 가지고 있다.

 

멘델의 발견으로 색상을 비롯한 다른 특성들은 온도와 토질 같은 많은 요소들에 따라 달라진다. 하지만 '어떤 것'은 온전히 보존되는데, 혼합되거나 분산되지 않으며, 틀림없이 정량화된다. 멘델은 유전자를 발견한 것이다.

 

유전자에 대해 생각하던 슈뢰딩거는 난관에 부딪힌다. 어떻게 그토록 "작은 알갱이"에 유기체의 정교한 발생을 결정하는 복잡한 전체 암호문을 담을 수 있을까? 난관을 해결하기 위한 단서를 전신에서 찾았다. 바로 모스 코드였다. 슈뢰딩거는 점과 선이라는 두 개의 기호를 질서 정연하게 조합하면 모든 인간의 언어를 생성할 수 있다는 것에 주목했다. 유전자도 코드를 활용하는 것이 분명하다는 얘기였다. "축소 코드는 고도로 복잡하고 구체적인 발달의 설계도와 정확하게 일치하며, 어떤 방식이든 실행에 옮길 수단을 포함하고 있어야 한다."

 

신생 분자생물학은 정보 저장과 전송을 연구하기 시작했다. 생물학자들은 "비트"를 기준으로 계산을 했다. 생물학으로 눈을 돌린 몇몇 물리학자들은 복잡성과 질서, 조직화와 특이성처럼 생물학적 특성을 논의하고 측정하는 데 필요한 개념으로 정보를 이야기했다. 헨리 콰슬러는 정보이론을 생물학과 심리학에 적용했다. 과슬러는 아미노산은 단어 하나, 단백질 분자는 단락 하나에 해당하는 정보량을 가졌다고 추정했다. 동료였던 댄코프는 1950년 콰슬러에게 염색사는 "정보의 코드화된 선형 테이프"라고 말했다.

 

전체 염색사는 "메시지"를 구성합니다. 이 메시지는 "단락" 혹은 "단어" 등으로 부를 수 있는 하부 단위로 나눌 수 있습니다. 가장 작은 메시지 단위는 아마도 예-아니요의 결정을 내릴 수 있는 일종의 플립플롭 회로일 것입니다.

 

1952년 콰슬러는 생물학에서 정보이론이 어떻게 쓰이는지를 다룬 학회를 주최했다. 학회는 세포 구조에서부터 효소의 촉매작용, 그리고 대규모 "생물계"에 이르는 분야에 엔트로피, 잡음, 메시지, 분화 같은 새로운 개념들을 활용하는 것에 초점을 맞췄다. 

 

박테리아의 성장은 박테리아가 우주에서 차지하는 부분의 엔트로피 감소로 분석할 수 있었다. 콰슬러 자신은 정보량 측면에서 고등 유기체를 측정하고 싶어 했다. 다시 말해 원자가 아니라 "유기체를 구축하기 위한 가상의 지시문"이라는 관점에서 측정하는 것이다. 당연히 유전자로 갈 수밖에 없었다.

 

하지만 이런 투박한 시도들은 곧 물거품이 되었다. 섀넌의 정보이론은 생물학에 완전히 접목될 수 없었다. 문제될 건 거의 없었다. 에너지에 대한 사고에서 정보에 대한 사고로 옮겨가는 중대한 변화는 이미 진행되고 있었다.

 

 

과학자들은 박테리아의 유전적 재조합을 "전환", "유도", "형질 도입", 심지어 "감염"으로 묘사하는 것을 보았다. 이들은 문제를 단순하게 할 것을 제안했다.

 

이 혼란스러운 상황을 타개하기 위해 위의 용어들을 "박테리아 간 정보"로 대체할 것을 제안합니다. 이 개념은 반드시 물리적 실체의 전달을 의미하는 것은 아니며, 박테리아의 입장에서 향후 인공두뇌학이 갖는 중요성을 인정하고 있습니다.

 

어떤 유전자든 간에, 또 어떤 기능을 하든 간에 유전자는 단백질일 것이라는 데 의견이 모아졌다. 유전자는 아미노산의 긴 사슬로 구성된 거대한 유기분자라는 것이다.  각 뉴클레오타이드는 "염기"를 지녔으며, A, C, G, T로 표기되는 단 네 개의 염기가 있었다. 염기의 비율은 정확하게 예측할 수 있었다. 코드 문자가 틀림없었다.

 

DNA는 서로 꼬인 채 상보관계를 이루는 두 개의 긴 염기배열로 구성되며, 네 글자로 작성된 암호와 비슷하다. 꼬인 것을 풀어 나온 가닥들을 복제에 필요한 틀 역할을 한다. (이것이 슈뢰딩거가 말한 "비주기적 결정체"일까? 물리적 구조의 측면에서 액스선 회절은 DNA가 완전히 규칙적임을 보여줬다. 비주기성은 언어의 추상적 수준, 즉 "글자들"의 배열에 놓여 있다.)

 

우리가 가정했던 특정한 한 쌍이 곧 유전물질을 복제하는 메커니즘으로 가능하다는 것을 시사한다는 사실을 인지하게 되었다.

 

"긴 분자 안에서는 수많은 순열이 가능하다는 결론이 나온다." 순열이 많다는 것은 가능한 메시지가 많다는 이야기이다. "따라서 정확한 염기배열은 유전 정보를 담은 코드인 것으로 보인다." 이 발언은 대서양 양쪽을 뒤흔들었다. 이들이 말한 '코드'와 '정보'는 더 이상 비유가 아니었다.

 

 

유기체의 거대 분자는 복잡한 구조 속에 정보를 구현한다. 우주의 역사 속에서 수소, 산소, 탄소, 철 원자가 무작위적으로 섞일 수 있었지만 이런 식으로 헤모글로빈을 형성할 확률은 침팬지가 셰익스피어의 작품을 타자기로 칠 확률보다 높지 않다. 헤모글로빈 생성에는 에너지가 필요하다. 또한 더 단순하고 덜 패턴화된 요소로부터 만들어지며, 엔트로피 법칙이 적용된다. 지구의 생명체가 얻는 에너지는 태양의 광자로부터 온다. 정보는 진화를 통해 온다.

 

DNA 분자는 특별하다. DNA의 유일한 기능은 정보를 담는 것이다. 이 점을 깨달은 미생물학자들은 코드를 해독하는 일에 나섰다. 가모프가 보낸 편지를 보자.

 

왓슨 씨와 크릭 씨에게,

저는 생물학자가 아니라 물리학자입니다. ... 그러나 두 분이 5월 30일자 <네이처>에 실은 논문을 보고 흥분을 금치 못했습니다. 저는 이 논문으로 인해 생물학이 '정밀' 과학으로 들어갔다고 생각합니다.  .... 두 분의 관점이 정확하다면 각 유기체는 다른 염기를 대표하는 숫자 1, 2, 3, 4의 4중(?) 시스템으로 작성된 긴 수로 표현될 것입니다.  ... 이로 인해 조합론과 정수론에 기초한 매우 흥미로운 이론적 연구의 가능성이 열릴 것입니다! ... 저는 이것이 가능하다고 생각하는데, 두 분 생각은 어떠신지요?

 

가모프는 이면의 화학은 전혀 중요하지 않다고 잘라 말했다. 가모브와 그의 추종자들은 이를 수학적 문제, 즉 다른 문자로 작성된 메시지들 사이의 사상으로 이해했다. 이것이 코드화의 문제라면 조합론과 정보이론에서 필요한 도구를 구할 수 있었다.

 

가모프는 DNA를 구성하는 네 개의 염기서열에서 단백질을 구성하는 20개의 아미노산에 이르는 것이 문제라고 보았다. 말하자면 네 개의 글자와 20개의 단어로 된 하나의 코드였던 것이다. 얼마 지나지 않아 가모브는 <네이처>에 상세한 해('다이아몬드 코드')를 발표했다. 몇 달 후 크릭은 그 해가 완전히 틀렸음을 증명했다. 단백질 순열에 대한 실험 데이터는 다이아몬드 코드를 배제했다. 그래도 가모브는 포기하지 않았다. 트리플릿은 꽤나 매력적인 아이디어였다. 예상치 못한 과학자들이 사냥에 동참했다. 물리학자 출신의 생물학자 막스 델브뤼크, 양자이론가 리처드 파이먼, 유명한 폭탄 제조자인 에드워드 텔러, 수학자인 니컬러스 메트로폴리스, 그리고 크릭의 연구소 동료인 시드니 브레너 였다.

 

이들 모두는 코드화에 대해 다른 생각들을 갖고 있었다. 이 문제를 수학적으로 다루는 것은 가모브조차도 버거워 보였다. "이 일은 아주 힘들며 성공은 대개 운에 좌우됩니다." 이 연구는 물론 출발점이 틀렸고, 엉뚱한 추론이 나왔으며, 그리하여 진퇴양난의 상황에 빠졌다. 기존 생화학계도 언제나 협조적인 것만은 아니었다.

 

시간이 흐른 후 크릭은 이렇게 말했다. "사람들이 꼭 코드를 '믿은' 것은 아니었습니다. 대다수 생화학자들은 절대 이런 방식으로 생각하지 않았습니다. 완전히 새로운 견해인 데다 생화학자들은 코드가 지나치게 단순화됐다고 생각하는 경향이 있었습니다." 생화학자들은 단백질을 이해하는 방법은 효소계와 펩타이드 단위의 결합을 연구하는 것이라고 생각했다. 충분히 그럴듯했다.

 

생화학자들은 단백질 합성을 한 대상에서 다른 대상으로 코드화하는 단순한 문제로 볼 수 없다고 생각했습니다. 너무 '물리학자'가 만들어낸 것 같다는 얘기였습니다.  ... 세 개의 뉴클레오타이드가 만들어낸 것 같다는 얘기였습니다.  ... 세 개의 뉴클레오타이드가 하나의 아미노산을 코드화한다는 간단한 아이디어에 대해 어떤 거부감이 있었던 겁니다. 사람들은 오히려 사기에 가깝다고 생각했습니다.

 

이들과는 완전히 달랐던 가모브는 충격적일 만큼 단순한 아이디어, 즉 모든 살아 있는 유기체는 "네 자리 체계로 적힌 긴 수"로 결정된다는 견해를 내세우기 위해 생화학적 세부 내용들을 무시했다. 

 

'코드'라는 단어가 널리 회자되었기 때문에 사람들은 화학에서 분자를 다룰 때 추상적 기호가 임의의 다른 추상적 기호를 나타내는 일이 얼마나 이상한 것인지 거의 인식하지 못했다. 유전 코드는 괴델이 철학적 의도를 가지고 만든 메타수학적 코드와 놀라울 정도로 비슷한 기능을 수행했다. 괴델의 코드가 수식과 연산을 보통의 정수로 대체하는 것처럼 유전 코드는 뉴클레오타이드 트리플릿을 이용해 아미노산을 나타낸다. 

 

더글러스 호프스태터는 1980년대에 최초로 이 연관성을 확실하게 밝힌 사람이었다. "DNA 분자가 자기 복제를 할 수 있게 하는 살아 있는 세포의 복잡한 장치와, 공식이 자신을 표현할 수 있게 하는 수학적 체계의 영리한 장치" 사이의 연관성을 보여준 것이다. 두 경우 모두에서 호프스태더는 꼬여 있는 피드백 고리를 보았다. "누구도 한 집합의 화학물질이 다른 집합의 화학물질을 위한 '코드'가 될 수 있다고 전혀 생각하지 못했다."

 

사실 이런 생각은 다소 당황스럽다. 만약 코드가 존재한다면 누가 고안했는가? 어떤 메시지가 거기에 적히는가? 누가 쓰는가? 누가 읽는가?

 

넥타이 클럽은 정보의 저장만이 아니라 전송도 문제라는 사실을 깨달았다. DNA는 두 가지 다른 기능을 수행한다. 첫째, 정보를 보존한다. 세대에서 세대로 자신을 복사함으로써 정보를 보존한다. 둘째, DNA는 또한 유기체의 형성 과정에서 활용하기 위해 그 정보를 밖으로 내보내야 한다. 정보 전달은 핵산에서 단백질로 전해지는 메시지를 통해 이뤄진다. 

 

따라서 DNA는 자기를 복제할 뿐만 아니라 이와 별개로 완전히 다른 대상의 제조도 지시한다. 그 자체로 엄청나게 복잡한 이 단백질들은 회반죽과 벽돌 같은 몸의 구성요소일 뿐만 아니라 제어시스템이고, 배관과 배선 그리고 화학적 신호로 성장을 제어한다.

 

DNA 복제는 정보를 복사하는 것이다. 단백질 제조는 정보를 전송하는 것이다. 다시 말해 메시지를 보내는 것이다. 생물학자들은 이제 '메시지'가 무엇인지 잘 정의할 수 있을 뿐만 아니라 어떤 특정한 실체로부터 나온 것이기 때문에 이 사실을 분명하게 볼 수 있었다. 메시지가 음파나 전파를 통해 전달된다면 화학적 과정을 통하지 못할 이유가 무엇일까?

 

가모브는 이 문제를 이렇게 표현했다. "살아 있는 세포의 핵은 정보의 창고이다." 또한 정보의 전달체이다. 모든 생명의 지속성은 이 "정보 시스템"에서 나온다. 유전학의 적절한 연구 대상은 "세포의 언어"이다.

 

자신의 다이아몬드 코드가 틀린 것으로 판명되자 카모브는 "삼각 코드"를, 그리고 다양하게 변형한 코드를 만들었지만 역시 실패하고 말았다. 트리플릿 코드들이 여전히 핵심적이었고, 아주 가까운 곳에 답이 있는 것으로 보였지만 속에 잡히지는 않았다. 문제는 연속된 것으로 보이는 DNA와 RNA 가닥에 자연이 어떻게 구두점을 찍는가였다.

 

이 문제에 이끌린 수학자들 중에는 제트추진연구소에서 우주항공을 연구하는 그룹이 있었다. 이들은 이 문제가 섀넌의 코딩이론에 있는 전형적인 문제라고 보았다. "뉴클레오타이드 배열은 구두점 없이 작성한 무한한 메시지로, 여기에 적절하게 구두점을 넣어 어떤 유한한 부분이라도 아미노산 서열로 해독할 수 있어야 한다." 이들은 코드의 '사전'을 만들었다. 아울러 '오식'의 문제를 검토했다.

 

1960년대 초 풀린 유전 코드는 잉여성이 가득한 것으로 밝혀졌다. 뉴클레오타이드에서 아미노산까지 사상의 대부분은 임의적인 것으로 보였으며, 가모브가 추정했던 것들과 달리 깔끔한 패턴을 지니지 않았다. 일부 아미노산은 코돈 하나에만 해당했고, 다른 것들은 두 개나 네 개 혹은 여섯 개의 코돈에 해당했다. 리보솜이라는 입자는 RNA 가닥에 맞물려서 한 번에 세 개의 염기씩 번역했다.

 

코돈 중에는 잉여적인 것도 있고, 사실상 시작 신호와 정지 신호의 기능을 하는 것도 있다. 잉여성은 정확히 정보이론가들이 예상한 기능을 수행한다. 즉, 오류에 대한 허용오차를 제공하는 것이다. 잡음은 다른 모든 메시지와 같이 생물학적 메시지에도 영향을 미친다. DNA의 오류, 즉 오식은 돌연변이를 초래한다.

 

정확한 해답에 채 도달하기도 전에 크릭은 자신이 중심원리라고 부른 진술을 통해 근본 원칙들을 확립했다. 중심원리는 진화의 방향과 생명의 기원에 대한 가설이다. 또 이는 (유전 코드를 만드는) 화학적 알파벳 안의 섀넌 엔트로피를 통해 증명할 수 있다.

 

일단 단백질 안으로 전달된 '정보'는 '다시 나올 수 없다'. 구체적으로 설명하면 핵산에서 핵산으로 혹은 핵산에서 단백질로 정보를 전달할 수 있지만, 단백질에서 단백질로 혹은 단백질에서 핵산으로 전달하는 것은 불가능하다. 여기서 정보는 서열을 '정확하게' 지정하는 것을 의미한다.

 

유전적 메시지는 독립적이며 뚫고 들어갈 수 없다. 외부 사건으로부터 온 어떤 정보도 유전적 메시지를 바꿀 수 없다는 말이다.

 

 

1990년대 전 세계의 과학자들은 대략 2만 개의 유전자와 30억 개의 염기쌍으로 구성된 인간 게놈의 전체 지도를 그리는 일에 착수한다. 가장 근본적인 변화는 무엇이었을까? 바로 에너지와 물질에서 정보로의 프레임 전환이었다.

 

브레너의 말을 들어보자. "1950년대까지 생화학의 모든 것은 세포의 기능에 필요한 에너지와 물질을 어디서 얻는지에 관한 것이었습니다. 생화학자들은 에너지와 물질의 흐름만 생각했습니다. 분자생물학자들이 정보의 흐름을 이야기하기 시작했습니다. 돌이켜보면 이중나선 구조 덕분에 에너지나 물질과 똑같이 생물계의 정보를 연구할 수 있다는 깨달음을 얻었음을 알 수 있습니다.

 

사례를 들어보면, 20년 저쯤 생물학자에게 가서 어떻게 단백질을 만드느냐고 질문한다고 합시다. 그러면 생물학자는 '지긋지긋한 문제군요. 저도 모릅니다. ... 하지만 펩타이드 결합에 필요한 에너지를 어디서 얻는가 하는 것이 중요한 문제입니다.' 반면 분자생물학자는 이렇게 말할 겁니다. '그게 문제가 아니에요. 아미노산 서열을 조합하는 데 필요한 지시문을 어디서 얻느냐가 중요하지 에너지는 상관없어요. 에너지는 자기가 알아서 할 겁니다.'"

 

브레너는 앞으로 컴퓨터공학에도 관심이 쏠릴 것으로 내다봤다. 또한 카오스와 복잡계 과학도 생각하고 있었다. "향후 25년 동안 우리는 생물학자들에게 또 다른 언어를 가르쳐야 할 것입니다. 그게 뭔지는 아직은 모르겠습니다. 아무도 모릅니다. 하지만 정교한 시스템에 대한 이론의 근본문제를 다루는 것이 하나의 목표가 될 것이라 생각합니다." "다시 말해 물리학 같은 학문은 법칙을 토대로 돌아가고, 분자생물학 같은 학문은 지금까지 메커니즘에 대해 다루었지만, 이제부터는 알고리즘, 처리법, 절차에 대해 생각해야 할지도 모르겠습니다."

 

쥐가 무엇인지 알고 싶다면 어떻게 쥐를 만들 수 있는지 물으면 된다는 얘기였다. 쥐는 어떻게 자신을 만들까? 쥐의 유전자는 서로를 켜고 끄면서 단계적으로 연산을 실행한다. "저는 이 새로운 분자생물학이 고도의 논리적 컴퓨터, 프로그램, 발생의 알고리즘을 연구하는 방향으로 나아가야 한다고 생각합니다. .. 다른 학문이라고 생각하지 말고 분자적 수준의 하드웨어와 이 모두를 조직하는 방식인 '논리적' 소프트웨어를 융합하기를, 이 둘 사이를 넘나들기를 기대합니다."

 

 

당시에도(특히 당시에는) 유전자는 생각하는 바와 달랐다. 식물학자의 예감과 대수적 편의성에 의해 시작된 유전자는 염색체까지 추적되면서 꼬인 가닥을 가진 분자라는 것이 밝혀졌다. 학자들은 유전자를 해독하고, 하나하나 나열했으며, 목록을 작성했다. 그러다가 분자생물학이 절정에 이르면서 유전자에 대한 견해는 다시 한 번 사슬에서 풀려났다.

 

유전자는 알면 알수록 더 정의하기 어려웠다. 유전자는 DNA 그 이상도 그 이하도 아닌 것일까? DNA로 '구성'되는 것일까, 아니면 DNA로 '전달'되는 것일까? 물질적 대상으로 정확하게 파악할 수 있기나 한 것일까?

 

벤저는 1957년 고전적 유전자는 죽었다고 주장한 바 있었다. 유전자는 재조합의 단위, 변이의 단위, 기능의 단위, 이 세 가지를 한꺼번에 뒷받침하는 개념이었다. 하지만 이미 이 세 가지가 양립할 수 없다고 의심할 만한 확실한 이유가 있었다. DNA 가닥은 줄에 꿴 구슬이나 문장을 구성하는 글자처럼 많은 염기쌍을 담는다. 따라서 물리적 대상으로서 유전자는 기본 단위로 불릴 수 없었다.

 

벤저는 이렇게 말한다. "어떤 수준의 기능을 뜻하느냐에 달려 있다." 단지 아미노산의 세부적인 사양일 수도 있고 "'하나의' 특정한 생리적 말단 효과로 이어지는" 전체 단계들의 총체일 수도 있다. '유전자'라는 단어는 사라지지 않을 테지만 이는 짧은 단어 하나가 지기에는 큰 부담이었다.

 

이후 벌어진 일들 중 하나는 분자생물학과 진화생물학의 충돌이었다. 이 논쟁의 불꽃을 일으킨 장본인은 리처드 도킨스였다. 도킨스는 대다수의 동료 학자들이 생명을 잘못된 관점에서 바라보고 있다고 생각했다. 

 

분자생물학이 DNA의 세부사항을 완벽하게 파악하게 되고, 분자계의 신동인 DNA를 다루는 기술이 발전하면서 사람들은 자연스럽게 생명에 대한 거대한 질문, 즉 '유기체는 어떻게 자신을 재생산하는가'에 대한 답이 DNA에 있다고 보았다. 우리는 폐로 숨 쉬고 눈으로 보듯이 DNA를 이용한다. 우리가 DNA를 '이용'하는 것이다.

 

하지만 도킨스는 이렇게 말한다. "이런 사고방식은 아주 심각한 오류이며, 진실을 완전히 거꾸로 뒤집은 것이다." DNA가 수십억 년 먼저 등장했으며, 제대로 된 관점에서 생명을 바라보면 지금도 DNA가 먼저라는 주장이었다. 이에 따르면 유전자가 중심이고, 필수조건이며, 주연이다. 도킨스는 <이기적 유전자>에서 "우리는 생존 기계, 즉 유전자로 알려진 이기적 분자를 보존하도록 맹목적으로 프로그래밍 된 로봇 이동수단"이라고 주장함으로 논쟁을 촉발시켰다. 유기체가 아니라 유전자가 자연선택의 진정한 단위이다. 자신을 복제하는 흔치 않은 속성을 가진 유전자는 원시 수프에서 우연히 형성된 분자인 "자기 복제자replicator"로 시작했다.

 

도킨스의 책은 명민하고 획기적이었다. 책은 유전자에 대한 새롭고 다층적인 이해를 확립했다. 1995년 대니얼 데닛은 이렇게 말했다. "학자는 도서관이 다른 도서관을 만들어내는 수단일 뿐이다."

 

1878년 인간 중심의 생명관을 풍자한 것은 버틀러의 혜안이었다. 하지만 다윈을 읽은 후 모든 피조물이 '호모 사피엔스'를 위해 설계된 것은 아니라는 점을 알게 된다. "인간중심주의는 지성의 발전을 가로막는 해악이다."

 

자연선택은 집단적 수준에서는 거의 일어나지 않는다. 하지만 개체들이 특정한 종류의 유전자를 미래로 퍼트리려고 노력한다고 생각하면 많은 설명들이 깔끔하게 들어맞는다. 종은 대부분의 유전자를 공유하며, 혈족은 더 많은 유전자를 공유한다. 물론 개체는 유전자에 대해 모른다. 개체는 그런 일을 하기 위해 의식적으로 '노력'하지 않는다. 

 

누구도 두뇌가 없는 아주 작은 독립체인 유전자 자체에 의도가 있다고 생각하지 않는다. 그러나 도킨스가 보여준 것처럼 관점을 바꾸어 유전자가 자신의 복제를 최대화하기 위해 움직인다고 말하면 꽤나 잘 들어맞는다.

 

생명의 역사는 구성요소가 될 만큼 충분히 복잡한 분자, 즉 복제자가 우연히 등장하면서 시작됐다. 복제자는 정보 전달자로서 자신을 복제함으로써 생존하고 확산된다. 복제는 일관되고 안정적이어야 하지만 완벽할 필요는 없다. 오히려 진화가 진행되려면 오류가 나타나야 한다. 

 

생존기계는 먼저 세포에서 시작하여 막, 조직, 사지, 장기, 기술의 가짓수를 늘리면서 계속 몸집을 불려간다. 유전자의 복잡한 매개체인 생존 기계는 다른 매개체와 경주를 벌이고, 에너지를 전환하며, 심지어 정보를 처리한다. 생존 게임에서 일부 매개체는 다른 매개체를 패배시키고, 따돌리며, 더 많이 번식한다.

 

다소 시간이 걸리기는 했지만 유전자 중심, 정보 기반의 관점은 생명의 역사를 추적하는 새로운 종류의 조사연구로 이어졌다. 고생물학자들은 화석 기록을 통해 날개와 꼬리의 골격상의 전구체를 살펴보지만, 분자생물학자와 생물물리학자들은 헤모글로빈과 종양 유전자 그리고 나머지 모든 단백질과 효소의 자료실에서 DNA의 숨길 수 없는 유물을 찾는다. "분자고고학이 형성되고 있다."

 

생명의 역사는 네거티브 엔트로피의 관점에서 기록된다. "실제로 진화하는 것은 그 모든 형태 혹은 변형 안에 있는 정보이다. 내 생각에 생명체에 대한 지침서 같은 것이 존재한다면 첫 줄에 하나의 계명처럼 '너의 정보를 더 키워라'라고 적혀 있을 것이다.

 

 

하나의 유전자가 유기체를 형성하는 일은 없다. 곤충과 식물 그리고 동물은 수많은 유전자들의 집단이자 공동 매개체들이며 협력적인 집합으로, 수많은 유전자들은 유기체의 발달 과정에서 각자 맡은 역할을 한다. 또한 시간과 공간을 넘어 확장되는 영향의 위계 안에서 각 유전자가 수많은 다른 유전자들과 상호작용 하는 복잡한 총체이다. 

 

몸은 유전자의 식민지이다. 물론 몸은 하나의 단위처럼 행동하고 움직이고 번식한다. 나아가 적어도 하나의 종으로 말하면 스스로를 하나의 단위가 확실하다고 느낀다. 유전자 중심 관점으로 인해 생물학자들은 인간 게놈을 형성하는 유전자는 어떤 한 개인이 전달하는 유전자들의 일부에 불과하다는 사실을 인식하게 되었다. 인간은(다른 종들처럼) 특히 피부에서 소화계에 걸쳐 존재하는 박테리아를 비롯한 미생물들의 전체 생태계를 부양하기 때문이다. 

 

우리의 "미생물 군집"은 소화를 돕고 질병과 싸우는 동시에 자신의 이익을 위해 빠르고 유연하게 진화한다. 이 모든 유전자들은 서로서로 경쟁하고, 자연의 방대한 유전자 풀에 있는 대체 가능한 대립 유전자들과 경쟁하지만 더 이상 자기들끼리는 경쟁하지 않는 상호 공진화의 장대한 과정에 참여한다. 이들의 성패는 상호작용에서 나온다. 도킨스의 말을 들어보자. "선택은 '다른 유전자들이 있는 곳에서 성공하고, 결국 그들이 있는 곳에서' 성공하는 유전자를 선호한다.

 

어느 한 유전자의 효과는 전체와의 상호작용, 환경의 영향 그리고 알 수 없는 우연에 좌우된다. 실제로 유전자의 '효과'를 말하는 것만도 복잡한 일이 된다. 유전자의 효과를 유전자가 합성하는 단백질이라고 말하는 것으로는 충분하지 않다. 이는 털과 깃털에 검은 색소를 만드는 단백질을 생성하는 유전자일 수 있다. 하지만 양과 까마귀 그리고 다른 모든 생물들은 다양한 환경에서 다양한 정도로 검은색을 나타낸다. 이처럼 단순해 보이는 속성조차 생물학적 점멸 스위치를 갖는 경우는 드물다.

 

한층 더 멀리까지 영향을 주는 유전자로, 유기체가 검은 색소의 형성에 필요한 햇빛을 찾도록 만드는 유전자를 생각해보자. 이런 유전자는 단순한 공모자의 역할을 하지만 그 역할은 필수적일 수 있다. 하지만 이를 검은색을 '위한' 유전자라고 부르기는 어렵다. 비만, 공격성, 둥지 짓기, 똑똑함, 동성애 같은 더 복잡한 속성들에 대한 유전자를 구체적으로 명시하기는 더욱 어렵다.

 

이런 것들을 위한 유전자가 있을까? 그렇지 않다. 엄밀하게 따지자면 심지어 눈의 색깔을 비롯하여 거의 모든 것을 위한 유전자가 따로 있다고 말할 수 없다. 대신 유전자 사이의 차이가 표현형(실현된 유기체)의 차이를 낳는 경향이 있다고 말해야 한다.

 

긴 다리를 위한 유전자는 없다. 아예 다리를 위한 유전자가 없다. 다리가 형성되려면 수많은 유전자가 필요하다. 각각의 유전자는 단백질의 형태로 지시를 내린다. 개중에는 재료를 만드는 것도 있고, 타이머와 점멸 스위치를 만드는 것도 있다. 또한 일부 유전자는 분명히 다리를 더 길게 하는 데 영향을 주며, 이들을 간단히 긴 다리를 '위한' 유전자라고 부를 수 있다. 다만 긴 다리가 직접적으로 표현되거나 유전자에 직접적으로 인코딩된 것은 아니라는 점을 기억해야 한다.

 

어떤 특질(눈의 색깔이나 비만)에 유전적 변이가 있다면, 이 특질을 위한 유전자 혹은 유전자들이 있어야 한다. 이런 특질의 실제 발현이 환경적이거나 심지어 우연적일 수도 있어야 헤아릴 수 없는 다른 요소들에 좌우된다는 것은 문제되지 않는다. 이를 설명하기 위해 도킨스는 의도적으로 극단적인 사례를 든다. 바로 읽기 유전자이다.

 

읽기 유전자라는 개념은 여러 이유로 불합리해 보인다. 읽기는 학습되는 행동이다. 책을 읽는 능력을 타고나는 사람은 없다. 교육 같은 환경적 요소에 좌우되는 가장 대표적인 기술이 읽기이다. 수천 년 전까지 읽기는 존재하지 않았기 때문에 자연선택을 따를 수도 없었다. 하지만 도킨스는 흔들리지 않았다. 그는 결국 유전자의 핵심은 '차이'에 있다고 지적했다. 도킨스는 간단한 대조부터 시작했다. 난독증 유전자가 있지 않을까?

 

읽기 유전자가 있음을 규명하려면 읽지 못하는 유전자, 말하자면 특정한 난독증을 일으키도록 두뇌 손상을 유발하는 유전자를 발견하기만 하면 된다. 이 난독증을 가진 사람은 읽지 못한다는 점을 제외하면 모든 면에서 정상이며 똑똑할 수도 있다. 이런 유형의 난독증이 멘델주의적 유전처럼 고정된 특질이 된다 해서 크게 놀라는 유전학자는 없을 것이다. 명백히 이 경우에 난독증 유전자는 정상적인 교육이 이뤄지는 환경에서만 효과를 발현할 것이다. 다시 말해 선사시대 환경이라면 눈에 띄는 효과가 없거나, 다른 효과를 내서 동굴에 사는 유전학자들이 동물 발자국을 못 알아보는 유전자로 부를지도 모른다. ....

 

똑같은 자리에 있는 야생형 유전자, 그리고 인구의 나머지가 갑절은 가진 유전자를 정확히 "읽기" 유전자라고 하는 것은 통상적인 유전학 용어의 관습에 따른 것이다. 거기에 반대한다면 멘델의 완두콩에서 키가 큰 유전자를 언급하는 것에도 반대해야 한다. .... 두 경우 모두 중요한 형질은 '차이'이며, 두 경우 모두 차이는 구체적인 환경에서만 자신을 드러낸다. 하나의 유전자 차이처럼 단순한것이 그토록 복잡한 효과를 낼 수 있는 이유는 .... 기본적으로 다음과 같다. 세상의 주어진 상태가 제아무리 복잡해도 그 상태와 다른 일부 상태 사이의 '차이'는 아주 단순한 것에서 초래될 수 있다.

 

이타주의 유전자가 있을까? 도킨스의 대답은 '그렇다'이다. 다만 이타주의 유전자가 "이타적으로 행동하도록 신경계의 발달에 영향을 미치는 모든 유전자"를 뜻한다면, 이런 유전자, 복제자, 생존자는 이타주의는 물론이거니와 읽기에 대해서 아무것도 모른다. 그게 뭐든, 어디에 있든 간에 그 표현형 효과는 유전자가 번식하는 데 도움이 되는 한에서만 의미를 지닌다.

 

도킨스는 말한다. "나는 유전자의 잠재적 준불멸성을 강조한 것이다. 이는 복제의 형태로 나타나며, 유전자의 결정적 속성이다." 이점에서 생명은 물질적 구속으로부터 벗어난다. 유전자는 정보를 전달하는 거대 분자가 아니다. 유전자는 정보이다. 1949년 물리학자 막스 델브뤼크는 이렇게 썼다. "요즘은 '유전자는 그저 분자 혹은 유전 입자일 뿐'이라고 말하면서 추상적인 관념들을 제거하는 추세이다." 이제 추상적인 관념들이 돌아왔다. 

 

그렇다면 어떤 특정한 유전자, 이를테면 사람의 긴 다리를 위한 유전자는 어디에 있을까? 이 질문은 베토벤의 피아노 소나타 E단조가 어디에 있는지 묻는 것과 약간 비슷하다. 손으로 쓴 원래의 악보 속에 있을까? 혹은 인쇄된 미래의 연주, 그리고 실제와 상상의 모든 연주를 합친 것 속에 있을까?

 

종이에 잉크로 그려진 8분 음표와 4분 음표는 음악이 아니다. 음악은 공기를 통해 울려 퍼지는 일련의 압력파도, 음반이나 CD에 새겨진 홈도, 청중의 두뇌에서 발생한 뉴런의 심포니도 아니다. 음악은 정보이다. 마찬가지로 DNA의 염기쌍은 유전자가 아니다. DNA 염기쌍은 유전자를 인코딩한다. 유전자 자신은 비트로 구성된다.(유전자도 정보이다)