- 生命的成形
- (英)杰米·A.戴维斯
- 7583字
- 2024-02-04 16:15:37
1 遇见奇怪的科技
一个人出生前九个月的历史,可能比之后的七十年更有趣。
——塞缪尔·泰勒·柯尔律治(Samuel Taylor Coleridge)
英国哲学家、诗人柯尔律治写下以上这句话时,用的是成人的考究语言,表达的却是每个孩子都曾有的好奇。他们问父母:我从哪里来?由于这很可能涉及两性和应该在什么时候给孩子讲解到什么程度的问题,很多父母会变得局促不安。提问的孩子对父母的心思一无所知,对他们来说,问题更单纯,也更复杂:他们只想知道,一个全新的人,是如何从无到有出现的。
孩子从未得到全面而正确的答案,因为从来也没人知道得足够多。在柯尔律治写作的年代,人们已经部分了解到,一个全新的人在子宫内生长的过程中,会经历一系列解剖结构上的变化。但这些变化是怎样的,又为何发生,在那时还完全是一个谜。过去的两个世纪里,一代代科学家费尽心思,想要知道一个受精卵如何变成一个孩子。过去十年间的科学飞速发展,随着错综复杂的人体机制展露在人们面前,神秘感稍稍退去,人类的敬畏之心却越发强烈。研究人员正在发掘的这些故事足以震惊世人,但至今为止几乎只出现在学术期刊上干巴巴的文字中。这是关于我们每个人的经历的故事,理应属于每一个人。写作本书是一次尝试,是一个恰好在该领域工作的科学家的尝试。他汇集了近年来相关的重大研究进展,来解释这个复杂的、带着孩子气的提问:我从何而来?
我们现在对人类胚胎发育的理解绝非来自某一特定研究,而是综合了从各个学科得到的信息。与发育直接相关的是胚胎学和新生儿科学,这些学科研究提供了与之相关的解剖和功能信息。遗传学和毒理学为发育生物学带来了更广阔的视野,对甄别造成先天异常的原因有极大的价值。这非常重要,因为了解导致畸形的原因能够帮助研究发育的科学家找到那些正常发育所必需的分子通路。生物化学和分子生物学会帮助研究这些通路的作用细节,甚至可以追溯到空间尺度上小到生物分子的原子之间的相互作用。细胞生物学致力于说明分子通路如何联合起来控制每个细胞的行为。以更大的维度来论,生理学、免疫学和神经生物学揭示了众多细胞之间交流与合作的种种细节。
以上提及的学科都从属于生物或者医药科学,也是胚胎研究的传统领域。近年来,还有一些学科初看上去和胚胎毫无关联,但也给人类发育研究带来了启迪,例如数学、物理、计算机科学,甚至还有哲学领域的研究。这些研究并不提供哪个细胞什么时候做了什么的细节,而是关心有更深远意义的抽象问题,比如:简单的东西如何变得复杂?这些很容易出错的机制是怎么完成精确的构造过程的?人类发育是否太过复杂,甚至超出了发育完全的人能够完全理解的范畴?对于最后一个问题,人们从未达成定论,而何谓发育“完全”恰恰是争论的焦点。关于前两个问题,研究人员已经取得了重大的进展,他们找到的答案都与“涌现”(emergence)和“适应性自组织”(adaptive self-organization)这两个概念有关。这两个名词分别位于更高层和更低层,是同一个问题必不可少的两方面。那些关注高级行为的人喜欢用“涌现”:由简单的组成和规则发展出复杂的结构与行为。“适应性自组织”是一种基于单个组分、由下而上的描述:简单的组分遵循某些简单的规则,就可以共同形成大规模的、巧妙或精致的东西。①“适应性自组织”的思想会贯穿本书,因为它是发育的核心:它让非生命的分子产生了活细胞,让作为个体能力十分有限的细胞形成强大的多细胞生物。它甚至超越生物本身。有一些值得一读的书探讨了有关这个问题的深远意义,你可以在延伸阅读中找到它们。
我们对发育日益增进了解,其中有一点毋庸置疑:身体的自我构建与我们在建筑和工程中熟悉的构建方法截然不同。这凸显了这样一个事实,我们完全不了解自己身体的构造方法。这个事实有多讽刺,它本身就有多重要。让我们来比较和对比一下生物系统和人类的建筑技术,这可能十分有助于理解胚胎的发育过程。
几乎所有的工程项目,比如组装机车、建造房子都有一个共同特点,那就是首先会有一个明确的计划,通常是一张图纸或者其他类型的计划书,其中会包括明确的预期目标。计划书会详细描绘出项目完成时的构造,但计划本身并不是实体成果的一部分。每个项目都必须有人统筹全局,一个总工程师或建筑师,他利用有着一定等级结构的指挥系统,把指令传达给负责切割、砌砖、焊接和粉刷的工匠。而由工匠完成的各个部分不能自主组合,只能依赖工人胶合、拴住或焊接。不过这些工人也不是最终建筑结构的一部分。工人和总工程师引入了大量的“外在”信息,例如焊接或浇筑拱门等,但这类知识细节并不会直接呈现在建筑上。大多数结构要等整个工程全部完工以后才会开始发挥预期的功能。
如果你在生物结构中寻找这类特征,就会深深意识到生物与传统机械和土木工程之间的巨大差别。和工程项目不同,生命的构造过程并不涉及计划书,没有包含任何对最终结构的阐述。受精卵内(基因、分子结构、特定化学分子在不同位置的浓度差异)必定包含信息,但这些信息与最终的身体构成没有简单的对应关系。我们已经知道,这些信息可能续发之后的一系列事件(我们之所以知道,是因为我们改变信息之后,比如让基因突变或者改变相关化学物质的位置,就会改变后续的发育步骤,导致发育出现异常)。
在工程项目中,特别是应用到数学的,建筑施工人员可以根据一系列指令把最终结构创造出来。告诉一个人,把一根木桩打入麦田的中央,在上面系一条绳子,抓住另一头向远处走,把绳子拉直,然后向右转,保持绳子紧绷的同时继续行走,这就是一个简单的指导制作麦田圈的指令。对于有些结构,使用指示来说明,比画满细节的图纸直截了当得多。如果你碰巧手边有笔和纸张,尝试跟随下面的指令,画一个被称为谢尔宾斯基镂垫(Sierpinski Gasket)的几何图案:
1. 画一个底边水平的等边三角形,画得尽可能大。把这个作为基底三角形。
2. 取各边的中点,用线段连接每条边的中点和相邻边的中点,一共画三条线段。这三条线段会组成倒置的、占基底三角形四分之一面积的三角形。
3. 把这个倒置的三角涂黑。
4. 此时,基底三角形内有三个未涂黑的正置的三角形。把它们作为基底三角形,重复以上两步。
(觉得无聊了就停下来;如果铅笔够用,就可以无限重复这个过程。)
把那些涂黑的部分想象成镂空状态,你得到的图案就像某种镂垫,这是分形,也可以说是自相似性(即任意放大后形态相似的结构)。另一个例子是康托尔集(Cantor Dust),这是一种在容易擦除痕迹的材料上很轻松地画出来的结构。例如在黑板上画一条线,擦掉中间的三分之一,创造出两条相对较短的线。然后再擦掉短线中间的三分之一,制造出更短的线……一直重复这个步骤。不消一会儿,你就会得到带有特别间隔的一系列粉笔短线。而这些间隔与大量自然现象有着相同的统计特征,例如沙丘倾塌的大小分布、漏水的水龙头滴水的间隔,还有大地震、传染病和大灭绝的发生间隔等。
即使在数学之外,与绘制出一张展示最终样式的详细图纸相比,给出一系列规则而制造出一种特定的构造是一种更普遍的做法。美食教程如此,纺织说明也如此:简单的有“一针正针,一针反针”这样的图案说明,也有复杂如雅卡尔(Jacquard)1801年发明的织布机上复杂的打孔卡——那可以说是世界上第一台可编程的制造设备。音乐也采用类似的说明方式,五线谱上的音符告诉乐手何时开始演奏,也会指示演奏的音高和时长。
长久以来,在我们的文化中,人们通常会通过一种简单的方法,即给出说明书来详述如何得到某种预期的结果。这让我们很容易就接受一种想法:生物信息也通过类似的方式构建了我们自己。然而,这种想法很危险。其实二者之间存在一个关键区别:人类构建一个对象总是依赖一系列说明,并且由一个外在的智能中间人,理解并遵循这一系列指令后组建完这个对象。即使有些东西初看上去像例外的产物,比如针织机或是能自动演奏的钢琴,但这些机器本身还是由那些中间人理解指令后完成的,所以它们并不是真正的例外。简而言之,羊毛开衫、交响乐、小汽车和教堂都不能创造它们自己。指令、操作知识(比如针织、烹饪、焊接和砌石头等)和对材料的物理操作都来自外部,而非构建中的结构本身。而胚胎中的信息与此相反,不需要任何外来的熟练工添砖加瓦或深思熟虑,只由胚胎本身接收信息与表达发育。不像大多数的技术构建需要某个人做总指挥,你很快就会明白,生物的构建由其中所有的元素共同参与。构建一个人的过程中,控制不是少数的、部分的特权,而是由系统作为一个整体来实现的。
要理解这种构建过程,我们首先要理解构建材料的特性。我的实验室在爱丁堡大学,那附近有三座著名的桥:托马斯·特尔福德(Thomas Telford)主持修建的典雅院长桥位于市内,本杰明·贝克(Benjamin Baker)标志性的福斯铁路桥横跨海湾,一旁还坐落着福斯公路桥。特尔福德的那座桥由石块砌成:这些材料又大又重,只有在受到重压后才会稳固。他据此采用了传统的建筑方法:首先建造桥墩,然后造了一个用来撑住桥拱的木制支架,接着往这个架子上堆积形状适宜的石材,直到石材的重量足以稳固支撑桥拱,再拆除木架。贝克用的是当时极其新颖的材料——钢材来建造他的铁路桥。这种材料既可以承受拉力,也经受得住压力,因此他得以从桥墩处直接向外延伸钢材,形成一种悬臂式结构;他们用起重机吊起那些长长的、相对较轻的型钢,然后放到合适的位置,再用铆钉把它们固定在一起。福斯公路桥是三座桥中建成时间最短的。这座悬索桥由紧绷的钢索支撑,这些钢索从两侧的吊塔上伸出,一直延伸到位于海湾另一侧海岸的吊塔上。因此,造这座桥时首先要造吊塔,然后在吊塔后面为吊索建造牢固的锚碇,再一根根增加钢索并拉紧,直到可以悬起整片路面。在以上各个例子中,材料的天然特性决定了建造桥梁的整体策略,每座桥梁都必须因材施工。生物界的建造策略也是如此,都取决于参与成分的特性。所以是时候介绍一下构成生物的三种重要成分了,我将在本书中一次次提到它们:蛋白质、mRNA和DNA。
目前,生物结构中已知最重要的分子是蛋白质。它们构成了最重要的物理结构,赋予细胞特有的形状;控制物质出入细胞的通道和离子泵也由它们构建;另外,驱动和控制生命活动中化学反应的酶还由它们组成。这些生化反应包括合成DNA、生成脂肪和糖类的代谢途径,这些物质也是身体的组成成分。蛋白质的相对重要性在红细胞中体现得最为淋漓尽致。红细胞在成熟过程中会丢弃细胞核,其中包含着细胞的所有基因。成熟的红细胞可以持续生活120天左右。但如果一个细胞失去了蛋白质功能,仅仅保留基因,那它们活不过几秒钟。
蛋白质是由一个个氨基酸组成的长链。人体内有20种氨基酸,它们形状不同,化学性质各异。这些氨基酸之间能够产生相互作用,氨基酸链也因此倾向于折叠成复杂的形状:有时候是自主折叠,有时候还会借助临时的“帮手”。折叠过程极其错综复杂,以至于人们目前还没有能力在已知氨基酸序列的情况下,精确推断出蛋白质的最终结构。(虽然人们已经开发出了预测蛋白质结构的电脑程序,但编程过程中涉及的计算和概率推理过程,都以已知的蛋白质结构与序列关系为基础,这些都是通过氨基酸序列和X射线晶体学得到的结果。预测蛋白结构有点像预报天气,就是稍微准确一点。)
不同的蛋白质,其氨基酸序列不同。一个又一个的氨基酸根据另一种生物分子信使RNA(也称mRNA,请见图1)指定的顺序添加到不断增长的蛋白质链中。mRNA分子也由多个单元链接成的长链构成,它们的构成单元是四种碱基:A(腺嘌呤)、C(胞嘧啶)、G(鸟嘌呤)和U(尿嘧啶)。这些组成单元十分相似,相对于氨基酸来说,它们在化学活性上相对简单。细胞中的mRNA除了指导生长中的蛋白质添加氨基酸的顺序,就没什么其他用处了。蛋白质上的氨基酸序列由mRNA上的碱基决定,三个碱基排列成一组,共同决定一个氨基酸。
图1 核糖体把mRNA翻译成蛋白质,它会根据mRNA的碱基序列向蛋白质链中添加氨基酸。
mRNA的碱基序列直接由DNA的碱基序列决定,DNA是由A、C、G和T四种碱基串联而成的长链分子。这些碱基可能按照任何顺序排列。参与构成我们人体46条染色体核心的每个DNA分子都有数亿个碱基。这里面就包含了组成基因的一个个片段。一个基因被读取后,DNA上的遗传信息会被复制到RNA上:根据DNA碱基A、C、G、T的顺序,转化为RNA的A、C、G、U的语言。因此,RNA实际上是一种复制了遗传信息的不同媒介,或称为“转录本”(transcript)。正式读取基因编码的任务由蛋白质执行。它们首先会结合ATAAT、TCACGCTTGA这类碱基短序列,这些序列常见于基因的起始处附近。不同的基因,其附近的短序列也各不相同,而不同的序列又会结合不同的蛋白质——因此,读取不同基因的蛋白质组合各不相同。
不同的基因会由相应的DNA结合蛋白结合并启动,这点十分重要,因为身体上的不同细胞需要制造出各自所需的蛋白质。例如肠道中的细胞会制造消化食物的蛋白质,卵巢中的细胞能制造产生性激素的蛋白质,白细胞能制造对抗感染的蛋白质。尽管这些细胞都含有基因组上的所有基因,包括永远都用不到的那些,可是只有细胞需要的那些基因会被读取出来,因为细胞中只有针对那些基因的DNA结合蛋白。
写到这里,我们不得不接受这样的事实:在细胞或胚胎中,并没有什么“总负责人”。简言之:生命体合成出蛋白质,仅仅是因为活跃的基因(通过mRNA)指定了这个制造过程。而这些基因之所以活跃,只是因为已经存在启动它们的蛋白质。这是一个循环逻辑:哪里都不受控制,因为哪里都有控制(请见图2)。
图2 生物逻辑的循环特性。蛋白质决定哪些基因被读取,这些基因又去指定制造出哪些蛋白质,其中就包括决定基因读取的蛋白质……以此类推。
图2中的循环为我们带来了有趣的启示。一个状态稳定的细胞,其中所有活跃表达的基因中肯定包含了特定的基因,它们转录翻译出能够结合在这些基因附近的识别序列,同时一定不包括用来激活当前不活跃表达基因的蛋白质。如果满足不了这样的条件,通过基因转录翻译出的蛋白质不能维持这些基因的表达,那么就会开启或者关闭某些基因,继而合成新的蛋白质,以此类推。这些变化会持续发生下去,直到达成能够自我维持的状态。这就是在我们的发育过程中,细胞会分化成不同类型的原理。这是一种尤其会受到外部影响(即触发“信号”)驱动的改变,这些信号会改变特定蛋白质激活基因的能力:打破细胞当前的稳定状态,使其转向新的稳定状态。在本书的后面,我们会讲述很多关于这类信号的例子。
分散的、循环式的控制绝非生物体构建过程中唯一的古怪特性。另一个从传统工程师的惯常认知看来非常奇怪的特征是,生物分子能够进行自我组装,自发地形成更大规模的结构,这是砖块和螺栓单靠自身不可能做到的。这个对生命的存在而言有基础重要性的过程,有点类似于晶体的形成过程。以小朋友们用化学仪器鼓捣出的那种常规晶体为例,这些晶体之所以能形成,是因为它们的组成分子能够一个个紧密地连接在一起,这些连接主要由那些小小的局部电荷互相吸引而构建起来。蛋白质也有固有的电荷模式,会在蛋白主体上形成极其复杂的裂隙和凸起等。无论是蛋白质的形状,还是其电荷模式,都是衍生自氨基酸序列的特征。有时蛋白质只在前端有一种类型的裂隙,而尾端有能够匹配这个裂隙的凸起,很像乐高积木。在这种状态下,同一种蛋白质分子会首尾相连,形成长长的细丝结构,具体长度不定(请见图3)。而更常见的状况是,每个蛋白质只能识别其他蛋白质或其他分子上而不是自身的结合位点,这意味着它们不能形成无限延伸的、类似于晶体的线状结构,取而代之的是与其他确定数目的蛋白质结合在一起,形成具有确定结构的多成分复合物。这类复合物对细胞十分重要,因为它们就如某种小型机械装置,可以运行某些复杂的化学反应,或是参与装配某些因为过于庞大而不能自主形成的结构。上文提及的那些读取基因的蛋白复合体就是一例。
图3 蛋白质通常有一定的电荷模式。当电荷模式或形状互补,不同蛋白质上的裂隙和凸起就可以非常牢固地结合在一起。如果某种蛋白质的一端可以结合同种蛋白质的另一端,就会形成蛋白质细丝,其中每个分子就是其中相对独立的一环。如果一种蛋白质只能与其他蛋白质结合,就会形成有确定大小和形状的蛋白复合体。转录和翻译基因的蛋白质就是这种类型。
蛋白复合体所代表的这种组织层次把我们带入了新的领域。蛋白质装配成复合体所依赖的信息就储存在蛋白质中(在这个例子中,“信息”本质上和结构是同一样东西)。因此,这就进入化学领域了,而且结果总是一样:可靠、可复制,但缺少灵活性。生物结构在更大尺度上有着更多变化,而这些变化是对环境的适应。比如说细胞的整体形状就必须契合它所在的组织。同样,这个细胞与相邻细胞建立起的一系列联系,必须与它相邻细胞的位置相匹配。因此,这种更大尺度上的生物结构并不仅仅由它们分子的化学结构所包含的信息决定,还需要额外的信息。从之前仅由内部的信息决定结构,到外来的信息也参与调节,这种转换带我们跨越界限,从纯粹的化学范畴进入生物学范畴。在生物系统中,多层级的调控加入化学上的自我装配过程,形成了能够组织结构来适应环境和生命所需的系统。而我们之前提过的适应性自组织,在这里就变得尤为重要了。适应性自组织是解释这个现象的关键:人体中的几千个基因和蛋白质,无论哪一个都不可能描述出人体结构和功能的概念(无论以哪种语言),却能制造出人类机体。这就和工程项目形成了鲜明的对比:建造工程时总需要用到来自外部的工作人员或机器人,按照正确的方式把各部分拼装到一起。接下来的章节会详述,适应性自组织为何对人类发育的各个层级都极为关键:从单个细胞里分子的自组织,一直到大尺度上复杂组织的构建。
生物结构最后一个特别之处来自生命受到的重大限制:生命的运转不能停下来,不能为某种需求从头开始构造。人类主导的工程可不是这样的,例如在制作电脑和飞机时,人们只希望完工之后这些东西能够发挥功能,并不指望结构还未完工的时候能有什么用。发育中的胚胎所受到的约束是,无论发育到哪个阶段,都要兼顾维持自身的生存。管道工人如果想把新的分管道连接到建筑主管道上,首先可以断开主管道切断水流,然后接入三通管,再重新通入水流,这就算完工了。但如果人类在生长过程中也采用这种方法给有需求的大动脉增加分支,那不等完工,人体就会因失血过多而亡。对人体内的其他基本系统来说都是如此。在发育过程中要维持生存的绝对前提,极大地限制了人体的构建过程。这也是人体的构建过程看起来如此奇异的另一个原因。而我们把这个构建过程与普通的工程项目相比较时,有时又觉得它们太复杂了。
我们致力于理解自身的起点时,必须准备好超越那些基于人类工程的平凡类比,学会从胚胎自身逐渐发育的角度来看待它。这将是一场踏入陌生领域的旅程,需要摒弃那些有关工程的比喻,采用新的思考方式。毕竟不是我们建造了胚胎,而是它们造就了我们。
①适应性自组织的同义词,子类型还包括“群体智慧”“蜂巢思维”等。这些词汇被用于人群和社会性昆虫的研究,但用这样的词似乎太感性了,不太适合用在分子或细胞上。因此我在本书和以前写作的书中都选择了“适应性自组织”这个词,在数学和物理领域,人们更常使用这个词。