基因、语法、和思维*
安博
基因是大家都知道,但未必都完全知道的一个词。首先,基因是指控制一个生物性状的遗传单位,这个性状是由蛋白质或功能RNA来体现的,所以早期有“一个基因一个蛋白质”的说法,尽管现在对这个说法有些修正,但对非专业人士来说它就足够了,我们仍然可以说,一个基因是控制一个蛋白质(或功能RNA)的遗传(DNA)单位。通过对基因组的序列测定,我们甚至准确地知道最简单的自主生活的生物(一种细菌)只有482个基因,等等。
但当我们问一个人有多少基因的时候,科学家只能给一个估计值(大约三四万),尽管人的基因组测序工作早就完成了。造成基因数不确定的一个原因是人的基因组结构比细菌的复杂得多,另一个原因是一个真核生物基因的DNA单元并不简单地对应一个蛋白质(或功能RNA)。三十年前科学家在真核生物(除细菌之外的所有其它生物)中发现了内含子,一个内含子是指在基因DNA单元中一段无意义的DNA片段,也就是说一个基因被内含子分割成了几个片段,一个基因需要剪切掉其中的内含子才能成为一个成熟的基因。这是非常有意义的发现,当时我读到这个发现时兴奋得无法入眠,因为我立即意识到内含子存在意味着基因有语法(Syntax)。
从信息的角度讲,一个蛋白质就象是一个句子,它表达了一个完整的意思(一个功能)。内含子的存在说明遗传基因这个句子是由更基本的单元(词)所组成的,生物学上把这个更小的单元叫外显子,一个外显子对应一个词或词组,一个成熟的基因句子就是有若干个外显子这样的词组成的,把这些外显子拼接成一个基因的过程(也就是剪切掉内含子的过程)就是造句的过程,它所遵从的法则就是语法。
先按下基因的语法不表,一个基因由数个外显子拼接而成意味着一段DNA可以编码多个不同的蛋白质,就像一组词可以生成不同的句子一样。这就极大地丰富了一个生物体内的蛋白质(功能)数量,这也就是为什么真核生物能比细菌复杂丰富得多的根本原因。
由基因拼接而形成的蛋白质多样性在人的免疫系统中得到了完美的体现。人的免疫球蛋白的功能是识别入侵的病菌,一个免疫球蛋白链包括恒定区(C),变化区(V),多样区(D),和连接区(J),每一个区域由一个外显子编码,其中每一种外显子的数量从从一个(恒定区C)到上千个(变化区V)不等。这些外显子就象语言中的词一样,同一类型的外显子相当于同类的词,如名词,动词,形容词等。这些词连在一起就生成了一个句子(免疫球蛋白链)。同类词的替换,即不同V(D)J(C)的组合可产生了高达3 x 1011种不同的免疫球蛋白质,这为人体抵抗各种不同的病菌侵扰提供了基础。
在这3 x 1011种组合中,同一类词,如V,D, 或J,可以替换,但V,D,J之间不能互换,而且,V(D)J(C)的次序也不能调换。 显然在这个免疫球蛋白的句子里,词序是严格的。但这里有些词有时可以被省略,如多样区D和衡定区C可以在轻链中被省略,只留VJ两个区域,象是一个词组或短语。
面对这样精美的语法结构只能感叹造物主的神奇,对于人类的自然语言,现在基本上一致认为其语法是人脑思维的产物和功能,那么基因的语法又是谁的产物和功能?哪个产生基因语法的“谁”是否也具有思维?
现在知道,在生物体内形成和维系基因语法的是一类RNA剪切酶(酶是生物催化剂),这种酶的核心是小段RNA(snRNA),用于识别剪切的准确位点。在简单的生物体中,RNA剪切酶就是一个RNA分子,比如前文中提到内含子自我剪切时,内含子本身就是一个RNA 剪切酶,由此,我们可以说基因语法是RNA的产物和功能。
那么接下来的问题是:RNA有思维吗?
让我们再回到免疫系统,如果我们把这3 x 1011种免疫球蛋白质看作一个整体,就会发现它们构成了一副外面世界的“底片”或“像“, 外界的一种病菌能够被某一种或几种免疫球蛋白质所识别,从而在免疫系统生成一个“像点”,免疫系统通过这种方法“认识“外部世界。实际上免疫系统也能“认识”自己,通过发育过程中的灭话机制,这个系统不对自身发生反应,这就使得免疫系统能区别内外。所以,免疫系统不仅对能“认识”外部世界,也能“认识”内部世界。
免疫系统的这个性质和人对世界的认知过程何其类似,在这里先验论和实践论哲学流派都可以找到各自的影子。当人类思想的大哲们知道了这些哲学思想的背后其实是简单的基因语法,是不是应该把产生基因语法的RNA当神一样膜拜?如果RNA至少在功能上是最早的生物分子,那它有这样的“神“性就是理所应当的,也是必须的,因为没有这样的”神“性就不能算是真正的生命。从这个意义上说,生命从诞生的那一天起就会”思维“了。
思维的本质是信息处理,人会,RNA也会,没啥神的。