千脑理论
理查德-道金斯的序言
不要在睡前读这本书。不是说它很吓人。它不会给你带来恶梦。但它是如此令人振奋,如此刺激,它会把你的头脑变成一个令人兴奋的挑衅性想法的漩涡–你会想冲出去告诉别人而不是去睡觉。撰写前言的正是这个漩涡的受害者,我希望它能显示出来。
查尔斯-达尔文在科学家中是不寻常的,他有能力在大学之外工作,没有政府的研究资助。杰夫-霍金斯可能不喜欢被称为相当于硅谷的绅士科学家,但是–好吧,你明白了。达尔文的强大思想在作为一篇简短的文章表达时太过革命性而难以流行,1858年达尔文和华莱士的联合论文几乎被忽略。正如达尔文自己所说,这个想法需要以书的形式来表达。果然,一年之后,他的这本大书就撼动了维多利亚时代的基础。杰夫-霍金斯的千脑理论也需要长篇大论。还有他的参考框架概念–“思考的行为本身就是一种运动形式”–牛眼!这两个想法都足够深刻。这两个观点都很深刻,足以写满一本书。但这还不是全部。
T.赫胥黎在结束*《物种起源*》时曾说过一句著名的话:“我没有想到这一点,真是太愚蠢了。“我并不是说大脑科学家在结束这本书时一定会说同样的话。这是一本由许多令人兴奋的想法组成的书,而不是像达尔文那样的一个巨大的想法。
我怀疑不仅是T.H.赫胥黎,他的三个聪明的孙子都会喜欢它。安德鲁是因为他发现了神经冲动的工作原理(霍奇金和赫胥黎是神经系统的沃森和克里克);奥尔德斯是因为他对心灵最远处的远见和诗意的航行;朱利安是因为他写了这首诗,赞美大脑构建现实模型的能力,是宇宙的一个缩影。
事物的世界进入你幼小的心灵
为了充实那个水晶柜。
在它的墙内,最奇怪的伙伴相遇了。
而事情转念一想,确实是繁殖了他们的同类。
因为,一旦进入,肉体的事实可以找到
一种精神。事实与你互为因果
在那里建立了你的小微观世界–然而
它被分配了最庞大的任务给它的小伙伴。
死人可以住在那里,并与星星对话。
赤道与极地对话,黑夜与白天对话。
精神化解了世界的物质障碍
一百万次的孤立被烧掉了。
宇宙可以生活、工作和计划。
最后在人的思想中造就了上帝。
大脑坐在黑暗中,只通过安德鲁-赫胥黎的神经冲动的冰雹来认识外部世界。来自眼睛的神经脉冲与来自耳朵或大脚趾的神经脉冲没有什么不同。它们在大脑中的最终位置才是它们的归宿。Jeff霍金斯不是第一个提出我们所感知的现实是一个构建的现实,一个模型,由来自感官的公告更新和告知。但我认为,霍金斯是第一个雄辩地提出这样的观点:这样的模型不是一个,而是成千上万个,在构成大脑皮层的许多整齐堆放的柱子中,每个都有一个。这些柱子大约有15万个,它们是本书第一部分的主角,还有他所说的 “参考框架”。霍金斯关于这两方面的论述是具有挑衅性的,看看其他脑科学家是如何接受它的:嗯,我怀疑。在他的观点中,最吸引人的是皮质柱在其世界建模活动中是半自动地工作。我们 “所感知到的是一种来自它们之间的民主共识。
大脑中的民主?共识,甚至争议?多么惊人的想法。这是这本书的一个主要主题。我们人类哺乳动物是一个经常性争端的受害者:旧的爬行动物大脑和哺乳动物新皮质之间的角力,后者无意识地运行着生存机器,而哺乳动物新皮质则坐在它上面的一种驾驶座上。这个新的哺乳动物大脑–大脑皮层–会思考。它是意识的所在地。它意识到过去、现在和未来,并向旧的大脑发送指令,由它来执行这些指令。
当糖稀少且对生存有价值时,经过数百万年的自然选择教育的旧大脑说,“蛋糕。想要蛋糕。嗯,蛋糕。给我。“新的大脑,在仅仅数十载的时间里被书籍和医生所教育,当糖过度丰富时,它说:“不,不。不能吃蛋糕。不可以。请不要吃那个蛋糕。“旧的大脑说:“疼痛,疼痛,可怕的疼痛,立即停止疼痛。“新的大脑说:“不,不,忍受折磨,不要背叛国家,向它投降。对国家和战友的忠诚甚至高于你自己的生命。”
旧的爬行动物和新的哺乳动物大脑之间的冲突为 “为什么疼痛必须是如此该死的疼痛 “这样的谜题提供了答案。毕竟,疼痛是为了什么?疼痛是死亡的一个代理。它是对大脑的警告:“不要再这样做了:不要挑逗蛇,不要捡起热的琥珀,不要从高处跳下。这一次只是受伤,下一次可能会杀了你”。但现在一个设计工程师可能会说,我们在这里需要的是相当于大脑中的无痛旗。当旗子升起时,不要重复你刚才所做的一切。但是,我们实际上得到的不是工程师的轻松和无痛的旗帜,而是痛苦–通常是令人痛苦的、难以忍受的痛苦。为什么?理智的旗帜有什么问题?
答案可能在于大脑决策过程的争议性:旧脑和新脑之间的角力。由于新的大脑太容易推翻旧的大脑的投票,无痛的旗帜系统就不会起作用。酷刑也不行。
新的大脑可以自由地无视我假设的旗帜,忍受任何数量的蜜蜂蜇伤或扭伤的脚踝或拷问者的拇指螺丝,如果出于某种原因,它 “想这样做”。真正 “关心 “生存以传承基因的老大脑可能会徒劳地 “抗议”。也许自然选择,为了生存的利益,已经确保了旧大脑的 “胜利”,使痛苦变得如此该死,以至于新大脑无法推翻它。再举个例子,如果旧大脑 “意识到 “对性的达尔文目的的背叛,那么戴安全套的行为将是无法忍受的痛苦。
霍金斯站在大多数有见识的科学家和哲学家一边,他们对二元论不屑一顾:机器里没有鬼魂,没有诡异的灵魂,以至于它在硬件的死亡中幸存下来,没有笛卡尔剧院(丹-丹尼特的术语),一个彩色屏幕向观看的自我显示世界的电影。相反,霍金斯提出了世界的多种模型,构建的微观世界,被从感官涌入的神经冲动雨所告知和调整。顺便说一下,霍金斯并没有完全排除未来通过将你的大脑上传到电脑中来逃避死亡的长期可能性,但他认为这不会有什么乐趣。
在大脑的模型中,更重要的是身体本身的模型,因为它们必须应对身体本身的运动如何改变我们对头骨监狱墙外世界的看法。而这与本书中间部分的主要关注点有关,即机器的智能。杰夫-霍金斯和我一样,非常尊重那些聪明的人,他和我的朋友,他们担心超级智能机器会取代我们,征服我们,甚至是完全抛弃我们。但霍金斯并不害怕它们,部分原因是使人掌握国际象棋或围棋的能力并不是那些能够应对现实世界的复杂性的能力。不会下棋的孩子 “知道液体如何溢出,球如何滚动,狗如何吠叫。他们知道如何使用铅笔、记号笔、纸张和胶水。他们知道如何打开书本,也知道纸会被撕开”。他们有一个自我形象,一个身体形象,将他们置于物理现实的世界中,使他们能够毫不费力地在其中穿行。
这并不是说霍金斯低估了人工智能和未来机器人的力量。恰恰相反。但他认为当今的大多数研究都走错了路。在他看来,正确的方法是了解大脑是如何工作的,并借用它的方式,但大大加快它们。
而且没有理由(事实上,请不要)借用旧大脑的方式,它的欲望和饥渴、渴望和愤怒、感觉和恐惧,这些都会驱使我们沿着被新大脑视为有害的道路前进。至少从霍金斯和我,以及几乎可以肯定的是你,所珍视的角度来看,是有害的。因为他非常清楚,我们开明的价值观必须,而且确实与我们自私的基因的主要和原始的价值观–不惜一切代价繁殖的原始需要–有很大的分歧。在他看来,如果没有一个古老的大脑(我怀疑这可能是有争议的),就没有理由期望人工智能对我们怀有恶意的感情。同样的道理,也可能是有争议的,他不认为关掉一个有意识的人工智能会是谋杀。没有一个古老的大脑,它为什么会感到恐惧或悲伤?它为什么想要生存?
在 “基因与知识 “一章中,我们对旧脑(为自私的基因服务)和新脑(知识)的目标之间的差距没有任何疑问。人类大脑皮层的荣耀在于,它在所有动物中是独一无二的,在所有地质时期都是前所未有的,它有能力违抗自私基因的指令。我们可以在没有生育的情况下享受性生活。我们可以把我们的生命投入到哲学、数学、诗歌、天体物理学、音乐、地质学或人类爱情的温暖中去,无视旧大脑的基因敦促,即这些都是对时间的浪费,这些时间 “应该 “用来与对手作战和追求多个性伙伴。“在我看来,我们有一个深刻的选择要做。这是一个选择,是偏爱旧的大脑还是偏爱新的大脑。更具体地说,我们是否希望我们的未来被那些让我们走到今天的过程所驱动,即自然选择、竞争和自私基因的驱动?或者,我们是否希望我们的未来由智力及其对理解世界的渴望所驱动?”
我一开始就引用了赫胥黎(T. H. Huxley)在结束达尔文的《*起源》*时所说的令人喜爱的谦虚的话。我将以杰夫-霍金斯许多迷人的想法中的一个来结束,他在短短的几页中就把它包了起来,这让我想起了赫胥黎。霍金斯觉得需要一块宇宙墓碑,让银河系知道我们曾经在这里,并且能够宣布这一事实,他指出,所有的文明都是短暂的。在宇宙时间的尺度上,一个文明从发明电磁通讯到消亡的时间间隔就像萤火虫的闪光。任何一次闪光与另一次闪光重合的机会都很不幸地很小。那么,我们所需要的–为什么我称它为墓碑–是一个信息,不是说 “我们在这里”,而是 “我们曾经在这里”。墓碑必须有宇宙级的持续时间:它不仅必须在几十秒外可见,而且必须持续几百万甚至几十亿年,以便在我们灭亡后很久,当其他智慧的闪光拦截它时,它仍然在宣扬它的信息。广播素数或π的数字是不行的。反正不是作为无线电信号或脉冲激光束。它们当然宣告了生物智能,这就是为什么它们是SETI(寻找外星智能)和科幻小说的素材,但它们太短暂了,太在当下。那么,什么信号可以持续足够长的时间,并且可以从任何方向的非常远的距离检测到?这就是霍金斯激起我内心的赫胥黎的地方。
这在今天是无法实现的,但在未来,在我们的萤火虫闪光耗尽之前,我们可以将一系列卫星送入围绕太阳的轨道,“这些卫星以一种不会自然发生的模式阻挡太阳的一点光线。这些轨道上的太阳阻挡器将继续围绕太阳运行数百万年,在我们离开后很久,它们可以从很远的地方被探测到。“即使这些脑卫星的间距不是一连串的素数,也可以使信息变得明确无误。“智能生命在这里”。
我发现相当令人高兴的是–我把这个小插曲提供给杰夫-霍金斯,以感谢他的杰出著作给我带来的快乐–那就是,以尖峰(或在他的案例中是反尖峰,因为他的卫星使太阳变暗)之间的间隔模式的形式编码的宇宙信息将使用与神经元相同的代码。
这是一本关于大脑如何工作的书。它以一种完全令人振奋的方式使大脑工作。
第一部分
对大脑的新认识
你脑中的细胞正在阅读这些文字。想想这有多了不起。细胞是简单的。单个细胞不能阅读,也不能思考,更不能做很多事情。然而,如果我们把足够多的细胞放在一起组成一个大脑,它们不仅能看书,还能写书。他们设计建筑,发明技术,并破译宇宙的奥秘。一个由简单细胞组成的大脑是如何创造出智慧的,这是一个深刻有趣的问题,而且它仍然是一个谜。
了解大脑如何工作被认为是人类的重大挑战之一。这一探索已经催生了数十项国家和国际倡议,如欧洲的人脑项目和国际大脑倡议。数以万计的神经科学家在几十个专业领域工作,几乎在世界每个国家都在努力了解大脑。尽管神经科学家研究不同动物的大脑并提出不同的问题,但神经科学的最终目标是了解人脑如何产生人类智慧。
你可能会对我说的人脑仍然是个谜感到惊讶。每年都有新的与大脑有关的发现被宣布,新的大脑书籍被出版,人工智能等相关领域的研究人员声称他们的创造物,接近老鼠或猫等的智力。由此很容易得出结论,科学家对大脑的工作原理有了相当好的了解。但如果你问神经科学家,几乎所有的人都会承认,我们仍然处于黑暗之中。我们已经学到了大量关于大脑的知识和事实,但我们对整个事物的运作方式了解甚少。
1979年,因研究DNA而闻名的弗朗西斯-克里克(Francis Crick)写了一篇关于脑科学状况的文章,题为 “思考大脑”。他描述了科学家们收集到的关于大脑的大量事实,然而,他总结说,“尽管详细的知识在不断积累,但人脑如何工作仍然具有深刻的神秘性。他接着说:“明显缺乏的是一个广泛的思想框架,在其中解释这些结果”。
克里克观察到,科学家几十年来一直在收集关于大脑的数据。他们知道大量的事实。但没有人想出如何将这些事实组合成有意义的东西。大脑就像一个巨大的拼图,有成千上万的碎片。拼图的碎片就在我们面前,但我们无法理解它们的意义。没有人知道解决方案应该是什么样子的。根据克里克的说法,大脑是一个谜,不是因为我们没有收集足够的数据,而是因为我们不知道如何安排我们已经拥有的碎片。在克里克写下这篇文章后的四十年里,有许多关于大脑的重大发现,其中有几个我将在后面谈及,但总的来说,他的观察仍然是真实的。智能是如何从你的大脑中的细胞产生的,这仍然是一个深刻的谜。随着每年收集到更多的拼图碎片,有时感觉我们离了解大脑越来越远,而不是越来越近。
我在年轻时读过克里克的文章,它激励了我。我觉得我们可以在我有生之年解开大脑之谜,从那时起我就一直在追求这个目标。在过去的15年里,我在硅谷领导一个研究团队,研究大脑的一个部分,即新皮质。新皮层约占人脑体积的70%,它负责我们与智力有关的一切,从我们的视觉、触觉和听觉,到各种形式的语言,到数学和哲学等抽象思维。我们研究的目标是充分了解新皮层的工作原理,以便我们能够解释大脑的生物学,并建造在同样原理上工作的智能机器。
在2016年初,我们的研究进展发生了巨大的变化。我们的理解有了突破性进展。我们意识到,我们和其他科学家错过了一个关键因素。有了这个新的见解,我们看到了拼图的各个部分是如何组合在一起的。换句话说,我相信我们发现了克里克所写的框架,这个框架不仅解释了新皮层如何工作的基本原理,而且还产生了一种思考智力的新方法。我们还没有一个完整的大脑理论–远非如此。科学领域通常从一个理论框架开始,后来才会有细节的研究。也许最著名的例子是达尔文的进化论。达尔文提出了一个关于物种起源的大胆的新思维方式,但细节,如基因和DNA如何工作,直到许多年后才知道。
为了变得聪明,大脑必须学习关于世界的许多东西。我指的不仅仅是我们在学校学到的东西,而是指基本的东西,比如日常物品的外观、声音和感觉是什么。我们必须学习物体的行为方式,从门如何打开和关闭,到我们触摸屏幕时智能手机上的应用程序做什么。我们需要学习世界上所有东西的位置,从你把个人财产放在家里到图书馆和邮局在你镇上的位置。当然,我们还要学习更高层次的概念,如 “同情心 “和 “政府 “的含义。在这一切之上,我们每个人都学习了数以万计的词汇的含义。我们每个人都拥有关于这个世界的大量知识。我们的一些基本技能是由我们的基因决定的,例如如何,或如何从痛苦中退缩。但我们对世界的大部分了解都是学来的。
科学家们说,大脑学习的是世界的模型。模型 “这个词意味着我们所知道的不仅仅是作为一堆事实储存起来,而是以一种反映世界结构和它所包含的一切的方式组织起来。例如,要知道什么是自行车,我们不会记住一串关于自行车的事实。相反,我们的大脑创建了一个自行车的模型,其中包括不同的部件,这些部件是如何相对排列的,以及不同的部件是如何移动和一起工作的。为了认识某样东西,我们首先需要学习它的外观和感觉,为了实现目标,我们需要学习世界上的事物在我们与它们互动时的典型表现。智力与大脑的世界模型密切相关;因此,要了解大脑如何创造智力,我们必须弄清楚由简单细胞组成的大脑如何学习世界和世界上一切事物的模型。
我们2016年的发现解释了大脑如何学习这个模型。我们推断,新皮层储存了我们知道的一切,我们所有的知识,使用一种叫做参考框架的东西。我稍后会更全面地解释这一点,但现在,请考虑用一张纸质地图作为比喻。地图是一种模型:一个城镇的地图是这个城镇的模型,而网格线,如经纬线,是一种参考框架。一张地图的网格线,它的参考框架,提供了地图的结构。参考框架告诉你事物相对于彼此的位置,它可以告诉你如何实现目标,例如如何从一个地方到另一个地方。我们意识到,大脑的世界模型是用地图般的参考框架建立的。不是一个参考框架,而是数十万个。事实上,我们现在了解到,你的新皮层中的大部分细胞都致力于创造和操纵参考框架,大脑利用这些参考框架进行计划和思考。
有了这种新的洞察力,一些神经科学最大问题的答案开始进入人们的视野。这些问题包括:,我们不同的感官输入是如何被整合成一个单一的经验的?当我们思考时发生了什么?两个人怎么能从相同的观察中得出不同的信念?以及为什么我们有自我意识?
这本书讲述了这些发现的故事以及它们对我们未来的影响。大部分材料已经在科学杂志上发表。我在书的末尾提供了这些论文的链接。然而,科学论文并不适合解释大规模的理论,尤其是以非专业人士能够理解的方式。
我把这本书分为三个部分。在第一部分中,我描述了我们的参考框架理论,我们称之为千脑理论。该理论部分是基于逻辑推理,因此我将带你了解我们得出结论的步骤。我还会给你一点历史背景,帮助你了解该理论与大脑思考历史的关系。在本书第一部分结束时,我希望你能理解当你在世界范围内思考和行动时,你的大脑中发生了什么,以及智能意味着什么。
这本书的第二部分是关于机器智能。二十一世纪将被智能机器所改变,就像二十世纪被计算机所改变一样。千脑理论》解释了为什么今天的人工智能还不智能,以及我们需要做什么来制造真正的智能机器。我描述了未来的智能机器将是什么样子,以及我们可能如何使用它们。我解释了为什么有些机器会有意识,如果有的话,我们应该怎么做。最后,许多人担心,智能机器是一种生存风险,我们即将创造一种会毁灭人类的技术。我不同意。我们的发现说明了为什么机器智能,就其本身而言,是良性的。但是,作为一项强大的技术,其风险在于人类可能使用它的方式。
在本书的第三部分,我从大脑和智力的角度来看待人类状况。大脑对世界的,包括对我们自我的模型。这导致了一个奇怪的事实:你和我所感知到的,每时每刻都是一个模拟的世界,而不是真实的世界。千脑理论的一个后果是,我们对世界的信念可能是错误的。我解释了这种情况是如何发生的,为什么错误的信念会难以消除,以及错误的信念与我们更原始的情绪相结合,是对我们长期生存的威胁。
最后几章讨论了我认为是我们作为一个物种将面临的最重要的选择。有两种方式可以思考我们自己。一种是作为生物有机体,进化和自然选择的产物。从这个角度来看,人类是由我们的基因定义的,而生命的目的就是复制它们。但是,我们现在正从我们纯粹的生物学的过去中走出来。我们已经成为一个智能物种。我们是地球上第一个知道宇宙的大小和年龄的物种。我们是第一个知道地球如何演化以及我们如何形成的物种。我们是第一个开发出工具的物种,使我们能够探索宇宙并了解其秘密。从这个角度来看,人类是由我们的智慧和知识定义的,而不是由我们的基因定义的。当我们思考未来时,我们面临的选择是,我们应该继续被我们的生物学的过去所驱动,还是选择拥抱我们新出现的智能?
我们可能无法做到这两点。我们正在创造强大的技术,可以从根本上改变我们的星球,操纵生物学,并很快创造出比我们更聪明的机器。但我们仍然拥有让我们走到这一步的原始行为。这种组合是我们必须解决的真正的生存风险。如果我们愿意接受智慧和知识作为定义我们的东西,而不是我们的基因,那么也许我们可以创造一个更持久、更有崇高目标的未来。
导致 “千脑理论 “的旅程是漫长而曲折的。我在大学学习电子工程,刚开始在英特尔的第一份工作时,我读到了弗朗西斯-克里克的文章。它对我产生了如此深刻的影响,以至于我决定转换职业,并将我的生命献给研究大脑。在试图在英特尔获得一个研究大脑的职位未果后,我申请成为麻省理工学院人工智能实验室的研究生。(我觉得制造智能机器的最好方法是首先研究大脑)。在与麻省理工学院教师的面试中,我提出的以大脑理论为基础创造智能机器的建议被拒绝。我被告知,大脑只是一个混乱的计算机,研究它没有任何意义。我很沮丧,但并不气馁,接下来我报名参加了加州大学伯克利分校的神经科学博士课程。我于1986年1月开始学习。
到达伯克利后,我向神经生物学研究生组的主席弗兰克-韦伯林博士征求意见。他让我写一篇论文,描述我想为我的博士论文所做的研究。在论文中,我解释说,我想研究新皮层的一个理论。我知道,我想通过研究新皮层如何进行预测来解决这个问题。Werblin教授让几位教员阅读了我的论文,并得到了好评。他告诉我,我的雄心壮志令人钦佩,我的方法很好,我想研究的问题是科学中最重要的问题之一,但是–我没有看到这一点–他不知道我当时如何能够追求我的梦想。作为一个神经科学的研究生,我必须为一个教授工作,做与教授已经在做的工作类似的工作。而在伯克利,或者他所知道的其他地方,没有人在做与我想做的事情相近的事情。
试图发展大脑功能的整体理论被认为过于雄心勃勃,因此风险太大。如果一个学生在这方面工作了五年而没有取得进展,他们可能无法毕业。对教授来说,这也有同样的风险;他们可能无法获得终身职位。为研究提供资金的机构也认为这太冒险了。专注于理论的研究提案经常被拒绝。
我本来可以在一个实验实验室工作,但在面试了几个实验室后,我知道这并不适合我。我的大部分时间都会花在训练动物、建造实验设备和收集数据上,。我开发的任何理论都将局限于该实验室研究的大脑部分。
在接下来的两年里,我整天泡在大学的图书馆里,阅读一篇又一篇神经科学的论文。我读了几百篇,包括过去50年里发表的所有最重要的论文。我还读了心理学家、语言学家、数学家和哲学家对大脑和智力的看法。我得到了一流的教育,尽管是非常规的教育。经过两年的自学,我需要做出改变。我想出了一个计划。我将再次在工业界工作四年,然后重新评估我在学术界的机会。于是,我又回到了硅谷的个人电脑上工作。
我作为一个企业家开始有了成功。从1988年到1992年,我创造了第一批平板电脑之一,GridPad。然后在1992年,我成立了Palm Computing公司,开始了十年的时间,我设计了一些最早的掌上电脑和智能手机,如PalmPilot和Treo。在Palm工作的每个人都知道,我的心在神经科学方面,我认为我在移动计算方面的工作是暂时的。设计一些最早的掌上电脑和智能手机是令人兴奋的工作。我知道数十亿人最终会依赖这些设备,但我觉得了解大脑更为重要。我相信大脑理论将对人类的未来产生比计算机更大的积极影响。因此,我需要回到大脑研究中去。
没有方便的时间离开,所以我选了一个日期,离开了我帮助创建的企业。在一些神经科学家朋友的协助和推动下,(特别是加州大学伯克利分校的鲍勃-奈特、加州大学戴维斯分校的布鲁诺-奥尔豪森和美国国家航空航天局艾姆斯研究中心的史蒂夫-佐内策),我在2002年创建了红木神经科学研究所(RNI)。RNI专门专注于新皮层理论,有10位全职科学家。我们都对大脑的大规模理论感兴趣,而RNI是世界上唯一一个不仅容忍而且期待这种关注的地方,。在我管理RNI的三年时间里,我们有一百多名访问学者,其中一些人在这里呆了几天或几周。我们每周都有讲座,对公众开放,通常会变成几个小时的讨论和辩论。
在RNI工作的每个人,包括我在内,都认为这很好。我认识了许多世界顶级的神经科学家,并与他们相处了一段时间。它使我能够在神经科学的多个领域获得知识,这在一般的学术职位上是难以做到的。问题是,我想知道一系列具体问题的答案,而我没有看到团队在这些问题上达成共识。各个科学家都满足于做他们自己的事情。因此,在管理一个研究所三年后,我决定实现我的目标的最佳方式是领导我自己的研究团队。
RNI在其他方面都做得很好,所以我们决定把它搬到加州大学伯克利分校。是的,那个告诉我不能研究大脑理论的地方在19年后决定,一个大脑理论中心正是他们所需要的。今天,RNI继续作为红木理论神经科学中心。
随着RNI搬到加州大学伯克利分校,我和几个同事创办了Numenta。Numenta是一家独立的研究公司。我们的主要目标是开发一个关于新皮质如何工作的理论。我们的次要目标是将我们学到的关于大脑的知识应用于机器学习和机器智能。Numenta类似于大学的典型研究实验室,但有更多的灵活性。它允许我指导一个团队,确保我们都专注于同一任务,并根据需要经常尝试新的想法。
在我写这篇文章的时候,Numenta已经有超过15年的历史了,然而在某些方面,我们仍然像一个初创公司。试图弄清新皮层的工作原理是极具挑战性的。为了取得进展,我们需要创业环境的灵活性和专注。我们还需要大量的耐心,这在初创企业中并不常见。我们的第一个重大发现–神经元如何进行预测–发生在2010年,即我们开始工作的五年后。新皮层中地图状参考框架的发现发生在六年后的2016年。
2019年,我们开始着手进行第二项任务,将大脑原理应用于机器学习。那一年也是我开始写这本书的时候,来分享我们所学到的东西。
我发现,宇宙中唯一知道宇宙存在的东西是漂浮在我们脑海中的三磅重的细胞团,这很令人惊讶。这让我想起了一个古老的谜题:如果一棵树在森林中倒下,而没有人在那里听到它,它有没有发出声音?同样,我们可以问:如果宇宙的出现和消失,没有大脑知道,宇宙真的存在吗?谁会知道呢?悬浮在你头骨中的几十亿个细胞不仅知道宇宙的存在,而且知道它是巨大而古老的。这些细胞已经学会了一个世界模型,据我们所知,这些知识在其他任何地方都不存在。我一生都在努力了解大脑是如何做到这一点的,我对我们所学到的东西感到兴奋。我希望你也会感到兴奋。让我们开始吧。
第一章
旧脑-新脑
要了解大脑如何创造智力,首先需要知道一些基本知识。
在查尔斯-达尔文发表了他的进化论之后不久,生物学家们意识到,人类的大脑本身也是随着时间的推移而进化的,其进化历史仅从外观上就可以看出。与经常随着新物种的出现而消失的物种不同,大脑的进化是在旧的部分基础上增加新的部分。例如,一些最古老和最简单的神经系统是沿着小蠕虫的背部运行的一组神经元。这些神经元使蠕虫能够进行简单的运动,它们是我们脊髓的前身,同样负责我们的许多基本运动。接下来出现的是位于身体一端的一坨神经元,控制着消化和呼吸等功能。这一坨是我们脑干的前身,它同样控制着我们的消化和呼吸。脑干扩展了已经存在的东西,但它并没有取代它。随着时间的推移,大脑通过在旧部分的基础上进化出新的部分,逐渐具备了越来越复杂的行为能力。这种通过增加来增长的方法适用于大多数复杂动物的大脑。很容易看出为什么旧的大脑部分还在那里。无论我们多么聪明和复杂,呼吸、饮食、性和反射反应对我们的生存仍然至关重要。
我们大脑的最新部分是新皮层,意思是 “新外层”。所有哺乳动物,而且只有哺乳动物才有新皮质。人类的新皮层特别大,占据了我们大脑体积的大约70%。如果你能把新皮层从你的头上取下并熨平,它大约有一张大餐巾的大小,厚度是两倍(约2.5毫米)。它包裹着大脑的旧部分,所以当你看一个人的大脑时,你看到的大部分是新皮质(有其特有的褶皱),而旧的大脑和脊髓的碎片则从底部伸出来。
一个人的大脑
新皮层是智力的器官。几乎所有我们认为是智力的能力,如视觉、语言、音乐、数学、科学和工程,都是由新皮质创造的。当我们思考问题时,主要是新皮层在进行思考。你的新皮层正在阅读或听这本书,而我的新皮层正在写这本书。如果我们想了解智力,那么我们就必须了解新皮层做什么以及它是如何做的。
动物不需要新皮质就能过上复杂的生活。鳄鱼的大脑大致相当于我们的大脑,但没有一个适当的新皮质。鳄鱼有复杂的行为,照顾它的孩子,并知道如何引导它的环境。大多数,人们会说鳄鱼有一定的智力水平,但没有接近人类的智力。
新皮层和大脑的老部分通过神经纤维相连;因此,我们不能把它们看作是完全独立的器官。它们更像是室友,有独立的议程和个性,但需要合作才能完成任何事情。新皮层处于一个绝对不公平的地位,因为它不直接控制行为。与大脑的其他部分不同,新皮层中没有一个细胞直接与肌肉相连,所以它自己不能使任何肌肉运动。当新皮层想做什么时,它向旧脑发出一个信号,在某种意义上要求旧脑听从它的命令。例如,呼吸是脑干的功能,不需要思考或来自新皮质的输入。新皮层可以暂时控制呼吸,比如当你有意识地决定屏住呼吸。但如果脑干检测到你的身体需要更多的氧气,它就会忽略新皮层,重新控制。同样,新皮层可能认为,“不要吃这块蛋糕。它不健康”。但如果大脑中较老和较原始的部分说:“看起来不错,闻起来也不错,吃吧。“蛋糕就很难抗拒了。这种新旧大脑之间的斗争是本书的一个基本主题。当我们讨论人类面临的生存风险时,它将发挥重要作用。
老人的大脑包含几十个独立的器官,每个器官都有特定的功能。它们在视觉上是不同的,它们的形状、大小和连接反映了它们的作用。例如,杏仁核中有几个豌豆大小的器官,这是大脑的一个较老的部分,负责不同类型的攻击性,如有预谋的和冲动的攻击性。
新皮层出人意料地不同。虽然它几乎占据了大脑体积的四分之三,并负责无数的认知功能,但它在视觉上没有明显的划分。褶皱和折痕是为了将新皮质装入头骨而需要的,类似于你将一张餐巾纸强行塞入一个大酒杯所看到的情况。如果你忽略了这些褶皱,那么新皮层看起来就像一大片细胞,没有明显的分界。
尽管如此,新皮层仍被划分为几十个区域,或区域,执行不同的功能。有些区域负责视觉,有些负责听觉,有些负责触觉。还有一些区域负责语言和规划。当新皮层受损时,出现的缺陷取决于新皮层的哪个部分受到影响。后脑勺的损伤会导致失明,而左侧的损伤可能会导致丧失语言能力。
新皮层的各个区域通过神经纤维束相互连接,这些神经纤维束在新皮层下穿梭,即所谓的大脑白质。通过仔细跟踪这些神经纤维,科学家可以确定有多少个区域以及它们是如何连接的。研究人类的大脑很困难,所以第一个以这种方式分析的复杂哺乳动物是猕猴。1991年,两位科学家丹尼尔-费勒曼和大卫-范-埃森将几十项独立研究的数据结合起来,绘制了一幅著名的猕猴新皮质图。这里是他们创造的图像之一(人类的新皮层地图在细节上会有所不同,但在整体结构上是相似的)。
新皮层中的连接
这张图片中的几十个小矩形代表了新皮层的不同区域,而线条代表了信息如何通过白质从一个区域流向另一个区域。
对这幅图的一个常见解释是,新皮层是有层次的,就像一张流程图。来自感官的输入从底部进入(在这张图中,来自皮肤的输入在左边,来自眼睛的输入在右边)。输入在一系列的步骤中被处理,每个步骤都从输入中提取更多更复杂的特征。例如,从眼睛获得输入的第一个区域可能检测到简单的模式,如线条或边缘。这一信息被发送到下一个区域,该区域可能检测到更复杂的特征,如角落或形状。这个逐步的过程一直持续到一些区域检测到完整的物体。
有很多证据支持流程图层次结构的解释。例如,当科学家们观察层次结构底部区域的细胞时,他们看到它们对简单的特征反应最好,而下一个区域的细胞对更复杂的特征有反应。而有时他们发现更高区域的细胞对完整的物体有反应。然而,也有很多证据表明,新皮层并不像一个流程图。正如你在图中所看到的,这些区域并不像流程图中那样一个接一个地排列。每个层次都有多个区域,而且大多数区域都与层次结构的多个层次相连。事实上,大多数区域之间的连接根本就不适合分层方案。此外,每个区域中只有部分细胞像特征检测器一样行动;科学家们还无法确定每个区域中的大多数细胞在做什么。
我们留下了一个难题。智慧的器官,新皮质,被分为几十个区域,做着不同的事情,但在表面上,它们看起来都是一样的。这些区域以一种复杂的混杂方式连接起来,有点像流程图,但大部分不是。目前还不清楚为什么这个智力器官看起来是这样的。
下一件显而易见的事情是观察新皮层内部,看看其2.5毫米厚度内的详细电路。你可能会想象,即使新皮层的不同区域在外面看起来是一样的,创造视觉、触觉和语言的详细神经回路在里面看起来也是不同的。但事实并非如此。
第一个观察新皮质内部详细电路的人是圣地亚哥-拉蒙-卡亚尔。在19世纪末,人们发现了染色技术,使大脑中的单个神经元能够用显微镜看到。卡哈尔用这些染色剂为大脑的每个部分拍照。他创造了数以千计的图像,第一次显示了大脑在细胞水平上的样子。卡哈尔的所有美丽而复杂的大脑图像都是手工绘制的。他最终因其工作获得了诺贝尔奖。以下是卡哈尔绘制的两幅新皮层图。左边的一幅只显示了神经元的细胞体。右边那张包括细胞之间的连接。这些图像显示了新皮层2.5毫米厚度的切片。
新皮层切片中的神经元
用于制作这些图像的染色剂只给一小部分细胞着色。这是幸运的,因为如果每个细胞都被,那么我们看到的将是黑色。请记住,神经元的实际数量要比你在这里看到的大得多。
卡贾尔和其他人观察到的第一件事是,新皮层中的神经元似乎是分层排列的。这些层与新皮层的表面平行(图片中是水平的),是由神经元的大小和它们的密集程度不同造成的。想象一下,你有一个玻璃管,倒入一英寸的豌豆、一英寸的扁豆和一英寸的大豆。从侧面看这个管子,你会看到三层。你可以在上面的图片中看到层次。有多少层取决于谁在进行计数,以及他们用来区分层的标准。卡亚尔看到了六层。一个简单的解释是,每一层的神经元都在做不同的事情。
今天我们知道,新皮层中有几十种不同类型的神经元,而不是六个。科学家们仍然使用六层的术语。例如,一种类型的细胞可能存在于第3层,另一种则存在于第5层。第1层位于新皮层的最外层,最靠近头骨,位于卡亚尔绘图的顶部。第6层最接近大脑的中心,离头骨最远。重要的是要记住,这些层只是一个粗略的指南,说明在哪里可以找到特定类型的神经元。更重要的是一个神经元连接到什么,以及它的行为方式。当你根据神经元的连接性进行分类时,有几十种类型。
从这些图像中观察到的第二个现象是,神经元之间的连接大多是垂直运行的,在各层之间。神经元有被称为轴突和树突的树状附属物,使它们能够相互发送信息。卡亚尔看到大多数轴突在层与层之间运行,垂直于新皮层的表面(在这里 的图像中是向上和向下)。一些层的神经元进行长距离的水平连接,但大多数连接是垂直的。这意味着到达新皮层某个区域的信息在被送到其他地方之前,主要在各层之间上下移动。
自卡亚尔首次对大脑进行成像以来的120年里,数以百计的科学家研究了新皮质,以尽可能多地发现其神经元和电路的细节。关于这一主题的科学论文有数千篇之多,远非我所能概括。相反,我想强调三个一般性意见。
1.新皮层中的局部电路是复杂的
在一平方毫米的新皮质(约2.5立方毫米)下,大约有十万个神经元,五亿个神经元之间的连接(称为突触),以及几公里的轴突和树突。想象一下,沿着一条路铺设几公里长的电线,然后试图把它压成两立方毫米,大约是一粒米的大小。每一平方毫米下有几十种不同类型的神经元。每种类型的神经元都与其他类型的神经元进行原型连接。科学家们经常将新皮层的区域描述为执行一种简单的功能,如检测特征。然而,只需要少量的神经元就能检测特征。在新皮层中随处可见的精确而极其复杂的神经回路告诉我们,每个区域都在做比特征检测复杂得多的事情。
2.新皮层在任何地方看起来都很相似
新皮层的复杂电路在视觉区域、语言区域和触摸区域看起来非常相似。它甚至在不同的物种,如大鼠、猫和人类之间看起来也很相似。也有差异。例如,新皮层的一些区域有更多的某些细胞,而另一些则较少,还有一些区域有一种其他地方没有的额外细胞类型。据推测,无论新皮层的这些区域在做什么,都会从这些差异中受益。但总的来说,与相似性相比,各区域之间的差异相对较小。
3.新皮层的每个部分都产生运动
长期以来,人们认为信息通过 “感觉区域 “进入新皮层,在区域的层次结构中上上下下,最后下到 “运动区域”。运动区的细胞投射到脊髓中的神经元,使肌肉和肢体运动。我们现在知道这种描述有误导性。在他们所检查的每个区域中,科学家们都发现了投射到旧脑中与运动有关的某些部分的细胞。例如,从眼睛获得输入的视觉区域将信号下传到旧脑中负责移动眼睛的部分。同样,从耳朵得到输入的听觉区域投射到旧脑负责移动头部的部分。移动头部会改变你听到的东西,类似于移动眼睛会改变你看到的东西。我们拥有的证据表明,在新皮层中随处可见的复杂电路执行着感觉-运动任务。没有纯粹的运动区域,也没有纯粹的感觉区域。
综上所述,新皮质是智力器官。它是一张餐巾纸大小的神经组织,分为几十个区域。有些区域负责视觉、听觉、触觉和语言。还有一些不容易被标记的区域,负责高级思维和计划。这些区域通过神经纤维束相互连接。区域之间的一些连接是分层次的,这表明信息在区域之间有序流动,就像一张流程图。但其他区域之间的连接似乎没有什么秩序,这表明信息一下子就流遍了。所有的区域,无论它们执行什么功能,在细节上都与所有其他区域相似。
我们将在下一章见到第一个对这些观察有意义的人。
这是一个很好的点,可以就本书的写作风格说几句。我是为智力上有好奇心的非专业读者写作的。我的目标是传达你需要知道的一切,以了解新的理论,但不是更多。我假设大多数读者之前对神经科学的了解是有限的。然而,如果你有神经科学的背景,你会知道我在哪里省略了细节和简化了复杂的主题。如果这适用于你,我请求你的理解。本书后面有一个带注释的阅读清单,我在其中讨论了在哪里可以找到更多的细节,供有兴趣的人参考。
第二章
弗农-蒙特卡斯尔的大想法
*心灵的大脑》*是一本小书,只有一百页。它出版于1978年,包含了两位杰出科学家关于大脑的两篇文章。其中一篇文章是由约翰霍普金斯大学的神经科学家弗农-蒙卡斯尔(Vernon Mountcastle)所写,至今仍是关于大脑的最具代表性和最重要的专著之一。蒙卡斯尔提出了一种关于大脑的思维方式,它是优雅的–伟大理论的标志,但也是如此令人惊讶,以至于它继续使神经科学界两极分化。
我第一次读到*《心智的大脑》*是在1982年。蒙卡斯尔的文章对我产生了直接而深刻的影响,正如你将看到的,他的建议严重影响了我在本书中提出的理论。
蒙卡斯尔的文章精确而博学,但也很难读懂。他文章的标题是不太吸引人的 “大脑功能的组织原则。单元模块和分布式系统”。开头的几句话很难理解;我把它们包括在这里,以便你能体会到他的文章的感觉。
毫无疑问,19世纪中期的达尔文革命对神经系统的结构和功能的概念产生了主导性影响。斯宾塞、杰克逊和谢林顿以及许多追随他们的人的想法植根于进化论,即大脑在系统发育中通过连续增加更多的头颅部分而发展。根据这一理论,每一个新的增加或扩大都伴随着更复杂的行为的阐述,同时,对更多的尾部和更原始的部分以及它们所控制的可能更原始的行为施加了一种调节。
蒙卡斯尔在这前三句话中所说的是,大脑在进化过程中通过在旧的大脑部分之上增加新的大脑部分而变得庞大。老的部分控制着更原始的行为,而新的部分则创造出更复杂的行为。希望这听起来很熟悉,因为我在上一章中讨论了这个想法。
然而,Mountcastle接着说,虽然大脑的大部分都是通过在旧部件上增加新部件而变大的,但这并不是新皮层如何成长为占据我们大脑70%的地方。新皮层是通过对同一事物进行多次复制而变大的:一个基本电路。想象一下,观看我们大脑进化的视频。大脑开始时很小。一块新的东西出现在一端,然后另一块东西出现在上面,然后另一块东西被附加在前面的东西上面。在几百万年前的某个时刻,出现了一个新的部分,我们现在称之为新皮质。新皮质开始时很小,但后来越来越大,不是通过创造任何新东西,而是通过反复复制一个基本电路。随着新皮层的成长,它的面积越来越大,但厚度却没有增加。蒙卡斯尔认为,尽管人类的新皮层比老鼠或狗的新皮层大得多,但它们都是由相同的元素组成的–我们只是有更多该元素的副本。
蒙卡斯尔的文章让我想起了查尔斯-达尔文的《物种起源》一书。达尔文很紧张,他的进化论会引起一场骚动。因此,在书中,他涵盖了许多关于动物界变异的密集而相对无趣的材料,最后才描述了他的理论。即使如此,他也从未明确说过进化论适用于人类。当我读Mountcastle的文章时,我有一个类似的印象。感觉好像蒙卡斯特知道他的建议会引起反击,所以他在写作时小心翼翼,深思熟虑。下面是蒙卡斯特文章后面的第二句话。
简而言之,运动皮层没有任何内在的运动,感觉皮层也没有任何内在的感觉。因此,阐明新皮层中任何地方的局部模块电路的运作模式将具有重大的普遍意义。
在这两句话中,蒙特卡斯特总结了他文章中提出的主要观点。他说,新皮层的每一部分都在同一原则下工作。所有我们认为是智力的东西–从视觉、触觉、语言到高级思维–在本质上都是一样的。
回顾一下,新皮层被划分为几十个区域,每个区域都执行不同的功能。如果你从外面看新皮质,你看不到这些区域;没有分界线,就像卫星图像没有显示国家之间的政治边界一样。如果你切开新皮质,你会看到一个复杂而详细的架构。然而,无论你切入皮层的哪个区域,这些细节看起来都是相似的。一片负责视觉的皮层看起来像一片负责触摸的皮层,而触摸的皮层看起来像一片负责语言的皮层。
蒙卡斯尔提出,这些区域之所以看起来相似,是因为它们都在做同样的事情。使它们不同的不是它们的内在功能,而是它们所连接的东西。如果你将一个皮层区域与眼睛相连,你就得到了视觉;如果你将同一皮层区域与耳朵相连,你就得到了听觉;如果你将区域与其他区域相连,你就得到了更高的思想,如语言。然后蒙特卡斯特指出,如果我们能发现,新皮层任何部分的基本功能,我们就能理解整个事物的运作方式。
蒙卡斯尔的想法与达尔文的进化论发现一样令人惊讶和深刻。达尔文提出了一种机制–一种算法,如果你愿意的话–来解释生命的不可思议的多样性。表面上看起来是许多不同的动物和植物,许多类型的生物,实际上是同一个基本进化算法的表现。反过来,蒙卡斯特提出,所有我们与智力有关的东西,表面上看起来是不同的,实际上是同一个潜在的皮质算法的表现。我希望你能理解蒙卡斯尔的提议是多么出人意料和具有革命性。达尔文提出,生命的多样性是由于一种基本算法。蒙卡斯尔提出,智力的多样性也是由于一种基本算法。
像许多具有历史意义的事情一样,对于蒙卡索是否是第一个提出这一想法的人,存在一些争论。根据我的经验,每个想法至少都有一些先例。但是,据我所知,蒙卡斯尔是第一个明确和仔细地阐述共同皮质算法论点的人。
蒙卡斯尔和达尔文的提议在一个有趣的方面有所不同。达尔文知道算法是什么:进化是基于随机变异和自然选择。然而,达尔文不知道这个算法在身体的什么地方。这一点直到多年后DNA的发现才知道。相比之下,蒙卡斯特不知道大脑皮层的算法是什么;他不知道智力的原理是什么。但他确实知道这种算法在大脑中的位置。
那么,蒙卡斯尔对皮质算法的位置有什么建议呢?他说,新皮质的基本单位,即智力单位,是一个 “皮质柱”。观察新皮层的表面,一个皮质柱占据了大约一平方毫米。它通过整个2.5毫米的厚度延伸,,使其体积为2.5立方毫米。根据这一定义,在人类的新皮质中大约有15万个皮质柱并排堆放。你可以想象一个皮质柱就像一小段细长的意大利面条。一个人的新皮层就像15万根短小的意大利面条,彼此垂直堆叠在一起。
皮质柱的宽度因物种不同和地区不同而不同。例如,在小鼠和大鼠中,每根胡须有一个皮质柱;这些柱子的直径约为半毫米。在猫身上,视觉柱的直径似乎是一毫米左右。关于人脑中柱子的大小,我们并没有很多数据。为了简单起见,我将继续把柱子称为一平方毫米,赋予我们每个人大约15万个皮质柱。尽管实际数字很可能与此不同,但对于我们的目的来说,这并没有什么区别。
皮质柱在显微镜下是看不到的。除了少数例外,它们之间没有可见的界限。科学家知道它们的存在,因为一列中的所有细胞会对视网膜的同一部位或同一片皮肤作出反应,但下一列中的细胞会对视网膜的不同部位或不同皮肤作出反应。这种反应的分组是定义一个列的原因。它在新皮层中随处可见。蒙卡斯尔指出,每个柱子又被分成几百个 “小柱子”。如果一个皮质柱就像一缕细长的意大利面条,你可以把迷你柱想象成更细的一缕,就像个别的头发,在意大利面条的内部并排堆叠。每个迷你柱包含一百多个横跨各层的神经元。与较大的皮质柱不同,迷你柱在物理上是独立的,通常可以用显微镜看到。
蒙卡斯尔不知道,他也没有提出列或小列的作用。他只是提出,每一列都在做同样的事情,而迷你列是一个重要的子组件。
让我们回顾一下。新皮层是一片组织,大约有一张大餐巾纸那么大。它被分为几十个区域,做不同的事情。每个区域都被划分为数千个柱子。每一列由几百个毛发状的小列组成,每个小列由一百多个细胞组成。蒙卡斯尔提出,在整个新皮层中,柱子和小柱子执行相同的功能:实施一种基本的算法,负责感知和智能的各个方面。
蒙卡斯尔将他关于通用算法的建议建立在几条证据之上。首先,正如我已经提到的,在新皮层中随处可见的详细电路是非常相似的。如果我给你看两块电路设计几乎相同的硅芯片,就可以安全地认为它们执行的是几乎相同的功能。同样的说法也适用于新皮层的详细电路。第二,相对于我们的人类祖先,现代人类新皮质的主要扩展在进化时间上发生得很快,只有几百万年。这可能没有足够的时间让进化发现多种新的复杂能力,但却有足够的时间让进化制造更多相同事物的副本。第三是新皮层区域的功能并非一成不变。例如,在患有先天性失明的人中,新皮层的视觉区域不能从眼睛中获得有用的信息。这些区域就可能承担与听觉或触觉有关的新角色。最后,还有一种说法是极端的灵活性。人类可以做许多没有进化压力的事情。例如,我们的大脑并没有进化到为计算机编程或制作冰淇淋–两者都是最近的发明。我们能做这些事情的事实告诉我们,大脑依靠的是一种通用的学习方法。对我来说,这最后一个论点是最有说服力的。能够学习几乎任何东西需要大脑在一个普遍的原则下工作。
有更多的证据支持蒙卡索的提议。但尽管如此,他的想法在他介绍时是有争议的,而且今天仍有一定的争议。我相信有两个相关的原因。一个是蒙卡索不知道皮质柱的作用。他提出了一个建立在大量旁证基础上的令人惊讶的主张,但他并没有提出皮质柱如何能真正做到我们与智力相关的所有事情。另一个原因是,他的建议的含义对一些人来说很难相信。例如,你可能难以接受视觉和语言在本质上是相同的。他们的感觉并不一样。鉴于这些不确定性,一些科学家通过指出新皮层区域之间存在差异来拒绝蒙特卡斯特的提议。与相似之处相比,这些差异相对较小,但如果你关注它们,你可以论证新皮质的不同区域是不一样的。
蒙卡斯尔的提议在神经科学中像圣杯一样隐约可见。无论神经科学家研究哪种动物或大脑的哪一部分,在某处,公开或隐蔽地,几乎所有的神经科学家都想了解人脑是如何工作的。而这意味着了解新皮层是如何工作的。而这需要了解皮层柱的作用。最后,我们对理解大脑的追求,对理解智力的追求,归根结底是要弄清楚皮质柱的作用以及它是如何做到的。皮质柱不是大脑的唯一奥秘,也不是与新皮质有关的唯一奥秘。但了解皮质柱是迄今为止最大和最重要的一块拼图。
2005年,我应邀在约翰-霍普金斯大学就我们的研究做了一次演讲。我谈到了我们对了解新皮层的追求,我们是如何处理这个问题的,以及我们取得的进展。在做完这样的讲座后,演讲者往往会与个别教员见面。在这次旅行中,我的最后一次访问是与弗农-蒙卡斯特尔和他的系主任会面。我感到,很荣幸能见到这位在我一生中提供了如此多见解和灵感的人。在我们的谈话中,参加过我的讲座的蒙卡索说,我应该到约翰霍普金斯大学工作,他将为我安排一个职位。他的提议是出乎意料的,也是不寻常的。由于我在加州的家庭和商业承诺,我无法认真考虑,但我回想起1986年,我研究新皮质的建议被加州大学伯克利分校拒绝。那时我是多么想接受他的提议啊。
在离开之前,我请蒙卡索在我那本读得滚瓜烂熟的《正念的大脑》上签名。当我离开时,我既高兴又难过。我很高兴见到他,并为他对我的高度评价感到欣慰。我知道我有可能再也见不到他了,因此感到很难过。即使我的探索成功了,我也可能无法与他分享我所学到的东西,无法得到他的帮助和反馈。当我走向我的出租车时,我感到决心要完成他的任务。
第三章
你脑海中的世界模型
大脑的作用对你来说可能是显而易见的。大脑从其传感器获得输入,它处理这些输入,然后采取行动。最后,动物如何对它所感觉到的东西做出反应决定了它的成败。从感觉输入到行动的直接映射当然适用于大脑的某些部分。例如,不小心触摸到一个热的表面会引起手臂的反射性缩回。负责输入-输出的电路位于脊髓中。但新皮层呢?我们能说新皮层的任务是接受来自传感器的输入,然后立即采取行动吗?简而言之,不能。
你在读或听这本书,除了可能翻页或触摸屏幕外,它没有引起任何直接的行动。数以千计的文字流入你的新皮层,在大多数情况下,你并没有对它们采取行动。也许以后你会因为读了这本书而有不同的行为。也许你将来会有关于大脑理论和人类未来的对话,如果你不读这本书,你就不会有这种对话。也许你未来的想法和选词会受到我的文字的巧妙的影响。也许你会致力于创造基于大脑原理的智能机器,而我的文字会在这个方向上启发你。但现在,你只是在阅读。如果我们坚持把新皮层描述为一个输入-输出系统,那么我们最好的说法是,新皮层得到大量的输入,它从这些输入中学习,然后,以后–也许是几个小时,也许是几年–它根据这些先前的输入采取不同的行动。
从我对大脑如何工作感兴趣的那一刻起,我就意识到,把新皮层想成是一个输入-引导-输出的系统是不会有结果的。幸运的是,当我在伯克利读研究生的时候,我有一个洞察力,使我走上了一条不同的、更成功的道路。我当时在家里,在我的桌子前工作。桌子上和房间里有几十个物体。我意识到,如果这些物体中的任何一个发生了变化,哪怕是最轻微的变化,我都会注意到它。我的铅笔杯总是在桌子的右边;如果有一天我发现它在左边,我就会注意到这种变化,并想知道它是如何被移动的。如果订书机的长度改变了,我会注意到。如果我触摸订书机或看着它,我就会注意到这种变化。我甚至会注意到订书机在使用时是否发出了不同的声音。如果墙上的时钟改变了位置或样式,我就会注意到。如果我把鼠标移到右边时,电脑屏幕上的光标向左移动,我就会立即意识到有问题。令我震惊的是,即使我没有注意到这些物体,我也会注意到这些变化。当我环顾房间时,我没有问:“我的订书机长度是否正确?“我没有想,“检查一下,确保时钟的时针还是比分针短”。正常的变化会突然出现在我的脑子里,然后我的注意力就会被吸引过去。在我的环境中,有成千上万种可能的变化,我的大脑几乎立刻就能注意到。
我能想到的只有一个解释。我的大脑,特别是我的新皮层,正在对它将要看到、听到和感觉到的东西同时进行多种预测。每次我移动我的眼睛,我的新皮层都在预测它将会看到什么。每次我拿起东西,我的新皮层都会预测每个手指应该有什么感觉。我的每一个动作都会导致对我应该听到什么的预测。我的大脑预测了最小的刺激,如咖啡杯把手的质地,以及大的概念性想法,如日历上应该显示的正确月份。这些预测发生在每一种感觉模式中,包括低层次的感觉特征和高层次的概念,这告诉我,新皮层的每一部分,也就是每一个皮层柱,都在进行预测。预测是新皮层无处不在的功能。
当时,很少有神经科学家将大脑描述为一个预测机器。专注于新皮层如何进行许多平行预测将是研究它如何工作的一种新方法。我知道预测并不是新皮层所做的唯一事情,但预测代表了一种攻克皮层柱子之谜的系统性方法。我可以提出关于神经元在不同条件下如何进行预测的具体问题。这些问题的答案可能会揭示皮层柱做什么,以及它们如何做。
为了进行预测,大脑必须学习什么是正常的,也就是说,根据过去的经验,应该预期什么。我以前的书《论智力》探讨了这种学习和预测的想法。在书中,我使用了 “记忆预测框架 “这一短语来描述整个想法,我还写到了这样思考大脑的意义。我认为,通过研究新皮层如何进行预测,我们将能够解开新皮层的工作原理。
今天,我不再使用 “记忆预测框架 “这一短语。取而代之的是,我通过说新皮层学习了一个世界模型,并根据其模型进行预测来描述同一个想法。我更喜欢 “模型 “这个词,因为它更准确地描述了新皮层所学习的那种信息。例如,我的大脑有一个关于我的订书机的模型。订书机的模型包括订书机的样子,它的感觉,以及它在使用时发出的声音。大脑对世界的模型包括物体在哪里,以及当我们与它们互动时它们如何变化。例如,我对订书机的模型包括订书机的顶部如何相对于底部移动,以及当顶部被压下时,订书机如何出来。这些动作可能看起来很简单,但你并不是生来就有这些知识。你在生命中的某个时刻学会了它,现在它被储存在你的新皮质中。
大脑创建了一个预测模型。这只是意味着大脑不断预测它的输入会是什么。预测并不是大脑每隔一段时间就做的事情,它是一种永不停止的内在属性,在学习中起着重要作用。当大脑的预测得到验证时,这意味着大脑的世界模型是准确的。一个错误的预测会使你注意到这个错误并更新模型。
我们并没有意识到这些预测中的绝大多数,除非输入到大脑的信息不匹配。当我随意地伸手去抓我的咖啡杯时,我没有意识到我的大脑正在预测每个手指会有什么感觉,杯子应该有多重,杯子的温度,以及当我把它放回桌子上时杯子会发出什么声音。但是如果杯子突然变重了,或者变冷了,或者发出吱吱声,我就会注意到这种变化。我们可以确定这些预测正在发生,因为即使这些输入中的任何一个出现微小的变化都会被注意到。但是,当一个预测是正确的,就像大多数会是正确的一样,我们不会意识到它曾经发生。
当你出生时,你的新皮层几乎一无所知。它不知道任何单词,不知道建筑物是什么样的,不知道如何使用电脑,也不知道什么是门,以及它是如何在铰链上移动的。它必须要学习无数的东西。新皮层的整体结构并不是随机的。它的大小,它的区域数量,以及它们如何连接在一起,在很大程度上由我们的基因决定。例如,基因决定了新皮质的哪些部分与眼睛相连,哪些其他部分与耳朵相连,以及这些部分如何相互连接。因此,我们可以说,新皮层在出生时的结构就是为了看、听,甚至学习语言。但是,新皮层也确实不知道它将看到什么,听到什么,以及它可能学习什么具体语言。我们可以认为,新皮层在开始生活时对世界有一些固有的假设,但对什么都不知道。通过经验,它学会了一个丰富而复杂的世界模型。
新皮层所学习的东西数量是巨大的。我坐在一个有数百个物体的房间里。我将随机挑选一个:一台打印机。我已经学会了一个打印机的模型,其中包括它有一个纸盘,以及纸盘如何进出打印机。我知道如何改变纸张的大小,以及如何拆开一个新的卷轴并将其放入托盘。我知道清除卡纸所需的步骤。我知道电源线的一端有一个D型插头,而且只能以一个方向插入。我知道打印机的声音,以及当它在一张纸的两面而不是一面上打印时,声音是如何不同的。我房间里的另一个物件是一个小的、有两个抽屉的文件柜。我可以回忆起关于这个柜子的几十件事情,包括每个抽屉里有什么,以及抽屉里的物品是如何排列的。我知道有一把锁,钥匙在哪里,以及如何插入和转动钥匙来锁定柜子。我知道钥匙和锁的感觉,以及使用它们时发出的声音。钥匙上有一个小环,我知道如何用我的指甲撬开小环来增加或删除钥匙。
想象一下,在你的家中挨个房间走访。在每个房间里,你可以想到数以百计的东西,对于每件物品,你可以按照学到的知识进行串联。你也可以对你居住的城镇做同样的练习,回忆在不同地点有哪些建筑、公园、自行车架和个别树木。对于每个项目,你可以回忆与之相关的经验以及你如何与之互动。你所知道的东西的数量是巨大的,相关的知识链接似乎永无止境。
我们也学习许多高层次的概念。据估计,我们每个人都知道大约四万个单词。我们有能力学习口头语言、书面语言、手语、数学语言和音乐语言。我们学会了电子表格的工作原理,恒温器的作用,甚至是同理心或民主的含义,尽管我们对这些的理解可能有所不同。不管新皮层可能做什么其他事情,我们可以肯定地说,它学习了一个令人难以置信的复杂的世界模型。这个模型是我们预测、感知和行动的基础。
通过运动学习
对大脑的输入是不断变化的。有两个原因。首先,世界会发生变化。例如,在听音乐时,来自耳朵的输入迅速变化,反映了音乐的运动。同样,一棵在微风中摇摆的树会导致视觉和也许听觉的变化。在这两个例子中,大脑的输入每时每刻都在变化,不是因为你在移动,而是因为世界上的事物在自行移动和变化。
第二个原因是我们在移动。每当我们迈出一步,移动一个肢体,移动我们的眼睛,倾斜我们的头,或发出一个声音,我们的传感器的输入就会改变。例如,我们的眼睛做快速运动,称为囊状运动,大约一秒钟三次。每一次囊状运动,我们的眼睛都会固定在世界的一个新点上,从眼睛到大脑的信息完全改变。如果我们没有移动我们的眼睛,这种变化就不会发生。
大脑通过观察其输入如何随时间变化来学习其世界模型。没有其他学习的方式。与计算机不同,我们不能把文件上传到我们的大脑。大脑学习任何东西的唯一途径是通过其输入的变化。如果大脑的输入是静止的,就不可能学到什么。
有些东西,如旋律,可以不需要移动身体就能学会。我们可以闭着眼睛一动不动地坐着,只听声音如何随着时间的推移而变化,就能学会一个新的旋律。但大多数学习需要我们积极地移动和探索。想象一下,你进入一个新房子,一个你以前没有进过的房子。如果你不移动,你的感觉输入就不会有任何变化,,你就不可能学到任何关于这个房子的东西。为了学习房子的模型,你必须向不同的方向看,从一个房间走到另一个房间。你需要打开门,偷看抽屉,拿起物品。房子和它的内容大多是静态的;它们不会自己移动。要学习一个房子的模型,你必须要移动。
以一个简单的物体为例,如电脑鼠标。为了了解鼠标的感觉,你必须用手指在它身上摸索。为了了解鼠标的外观,你必须从不同的角度看它,并将你的眼睛固定在不同的位置。要了解鼠标的作用,你必须按下它的按钮,滑开电池盖,或在鼠标垫上移动它,看一看、摸一摸、听一听会发生什么。
这方面的术语是感觉-运动学习。换句话说,大脑通过观察我们的感觉输入如何随着我们的移动而变化来学习世界的模型。我们可以不动声色地学习一首歌,因为与我们在房子里可以从一个房间移动到另一个房间的顺序不同,一首歌中的音符顺序是固定的。但世界上大多数地方不是这样的;大多数时候,我们必须移动来发现物体、地方和行动的结构。在感觉-运动学习中,与旋律不同,感觉的顺序并不固定。当我进入一个房间时,我看到了什么,取决于我把头转向哪个方向。当我拿着咖啡杯时,我的手指有什么感觉取决于我是向上、向下还是向侧面移动我的手指。
每一个动作,新皮层都会预测下一个感觉会是什么。我的手指在咖啡杯上往上移,我期望能感觉到杯口,把手指往旁边移,我期望能感觉到把手。如果我在进入厨房时向左转头,我期望看到我的冰箱,如果我向右转头,我期望看到油箱。如果我把目光移到左前方的燃烧器上,我期望看到我需要修理的破损的点火器。如果任何输入与大脑的预测不一致–也许是我的配偶修理了点火器–那么我的注意力就会被吸引到预测错误的地方。这就提醒了新皮层,它对这部分世界的模型需要更新。
关于新皮层如何工作的问题现在可以更精确地表述了。新皮层由数千个几乎相同的皮质柱组成,它是如何通过运动学习世界的预测模型的?
这是我和我的团队着手回答的问题。我们的信念是,如果我们能回答这个问题,我们就能对新皮层进行逆向工程。我们将了解新皮层做了什么以及它是如何做的。最终,我们将能够制造出以同样方式工作的机器。
神经科学的两个信条
在我们开始回答上述问题之前,你还需要知道一些基本想法。首先,像身体的其他部分一样,大脑是由细胞组成的。大脑的细胞被称为神经元,在许多方面与我们所有其他细胞相似。例如,神经元有一个定义其边界的细胞膜和一个含有DNA的细胞核。然而,神经元有几个独特的属性,在你身体的其他细胞中不存在。
首先是神经元看起来像树。它们有细胞膜的分支状延伸,称为轴突和树突。树突的分支聚集在细胞附近,收集输入。轴突是输出。它与附近的神经元建立许多连接,但往往要走很远的路,例如从大脑的一侧到另一侧,或从新皮质一直到脊髓的路上。
第二个区别是,神经元产生尖峰,也叫动作电位。动作电位是一种电信号,从细胞体附近开始,沿轴突传播,直到到达每个分支的末端。
第三个独特的特性是,一个神经元的轴突与其他神经元的树突建立连接。这些连接点被称为突触。当沿着轴突行进的尖峰到达突触时,它会释放一种化学物质,进入接收神经元的树突。根据所释放的化学物质,它使接收神经元更有可能或更不可能产生自己的尖峰。
考虑到神经元是如何工作的,我们可以陈述两个基本信条。这些信条将在我们对大脑和智力的理解中发挥重要作用。
宗旨一:思想、观念和感知是神经元的活动
在任何时间点上,新皮层中的一些神经元都在积极地突击,一些则没有。通常情况下,在同一时间活跃的神经元数量很少,可能只有2%。你的想法和感知是由哪些神经元在突突突决定的。例如,当医生进行脑部手术时,他们有时需要激活清醒的病人大脑中的神经元。他们将一个小小的探针插入新皮层,用电来激活几个神经元。当他们这样做时,病人可能会听到、看到或想到什么。当医生停止刺激时,病人所经历的一切就会停止。如果医生激活不同的神经元,病人会有不同的想法或感知。
思想和体验总是一组同时活动的神经元的结果。单个神经元可以参与许多不同的思想或体验。你的每个想法都是神经元的活动。你看到、听到或感觉到的一切也是神经元的活动。我们的精神状态和神经元的活动是一体的。
宗旨二:我们所知道的一切都储存在神经元之间的联系中
大脑记住了很多东西。你有永久的记忆,比如你在哪里长大。你有暂时的记忆,比如你昨晚吃了什么。你还有基本的,比如如何开门或如何拼写 “字典 “这个词。所有这些东西都是通过突触,即神经元之间的连接来储存的。
以下是大脑如何学习的基本思路。每个神经元都有成千上万的突触,这些突触将神经元与成千上万的其他神经元连接起来。如果两个神经元同时出现尖峰,它们会加强它们之间的联系。当我们学习一些东西时,这些连接会得到加强,而当我们忘记一些东西时,这些连接会被削弱。这一基本思想是由唐纳德-赫伯在20世纪40年代提出的,今天它被称为赫伯恩学习。
多年来,人们认为成人大脑中神经元之间的连接是固定的。人们认为,学习涉及增加或减少突触的强度。这仍然是大多数人工神经网络中的学习方式。
然而,在过去的几十年里,科学家们发现,在大脑的许多部分,包括新皮质,新的突触形成,旧的突触消失。每天,单个神经元上的许多突触都会消失,新的突触会取代它们。因此,大部分的学习是通过在以前没有连接的神经元之间形成新的连接而发生的。当旧的或未使用的连接被完全移除时,遗忘就会发生。
我们大脑中的连接储存着我们通过经验学到的世界模型。每天我们都会经历新的事物,并通过形成新的突触将新的知识片段添加到模型中。在任何时间点上活跃的神经元代表我们当前的想法和认知。
我们现在已经讨论了新皮层的几个基本构件–我们拼图的一些碎片。在下一章中,我们将开始把这些碎片放在一起,以揭示整个新皮质的工作原理。
第四章
大脑揭示了它的秘密
人们经常说大脑是宇宙中最复杂的东西。他们由此得出结论,对它的工作原理不会有一个简单的解释,或者说,也许我们永远不会理解它。科学发现的历史表明他们是错的。重大的发现几乎总是以令人困惑的、复杂的观察为前提。有了正确的理论框架,复杂性并没有消失,但它不再显得混乱或令人生畏。
一个熟悉的例子是行星的运动。几千年来,天文学家仔细追踪行星在星空中的运动。一颗行星在一年中的运动轨迹是复杂的,在天空中这样那样地飞舞,打着圈圈。很难想象对这些疯狂的运动有什么解释。今天,每个孩子都学会了行星围绕太阳运行的基本概念。行星的运动仍然很复杂,预测它们的运动轨迹需要困难的数学运算,但是有了正确的框架,这种复杂性就不再神秘了。很少有科学发现是在基本水平上难以理解的。一个孩子可以了解到地球绕着太阳运行。一个高中生可以学习进化论、遗传学、量子力学、和相对论的原理。这些科学进步中的每一项都是在令人困惑的观察之前取得的。但现在,它们似乎是直截了当和合乎逻辑的。
同样,我一直认为,新皮层之所以显得复杂,主要是因为我们不了解它,而且事后看来会相对简单。一旦我们知道了解决方案,我们会回过头来说,“哦,当然,我们为什么没有想到呢?“当我们的研究停滞不前,或者当我被告知大脑太难理解时,我会想象未来大脑理论是每个高中课程的一部分。这使我有了动力。
我们试图破译新皮层的进展有起有落。在18年的时间里,我和我的同事们在红木神经科学研究所工作了3年,在Numenta工作了15年,一直在研究这个问题。有的时候我们取得了小的进展,有的时候我们取得了大的进展,有的时候我们追求的想法起初看起来很刺激,但最终被证明是死胡同。我不打算向你们介绍所有这些历史。相反,我想描述几个关键时刻,当我们的理解取得飞跃时,当大自然在我们耳边告诉我们一些我们忽略的东西时。有三个这样的 “啊哈 “时刻,我记得很清楚。
第一项发现:新皮层学习世界的预测模型
我已经描述了在1986年,我是如何意识到新皮质学习世界的预测性模型的。我怎么强调这个想法的重要性都不为过。我称它为一个发现,因为这是我当时的感觉。哲学家和科学家谈论相关想法的历史很长,今天,神经科学家说大脑学习世界的预测性模型并不罕见。但在1986年,神经科学家和教科书仍然把大脑描述得更像一台电脑;信息进来,得到处理,然后,大脑就会采取行动。当然,学习世界模型和进行预测并不是新皮层的唯一工作。然而,通过研究新皮层如何进行预测,我相信我们可以解开整个系统的工作原理。
这一发现导致了一个重要的问题。大脑是如何进行预测的?一个潜在的答案是,大脑有两种类型的神经元:当大脑实际看到某些东西时,神经元会启动,而当大脑预测将看到某些东西时,神经元会启动。为了避免产生幻觉,大脑需要将其预测与现实分开。使用两组神经元可以很好地做到这一点。然而,这个想法有两个问题。
首先,鉴于新皮层每时每刻都在进行大量的预测,我们会期望发现大量的预测神经元。到目前为止,这还没有被观察到。科学家们已经发现了一些在输入前变得活跃的神经元,但这些神经元并不像我们预期的那样普遍。第二个问题是基于一个长期困扰我的观察。如果新皮层在任何时候都在进行成百上千的预测,为什么我们没有意识到这些预测的大部分?如果我用手抓起一个杯子,我不知道我的大脑正在预测每个手指应该有什么感觉,除非我感觉到一些不寻常的东西–比如,裂缝。我们不会有意识地意识到大脑所做的大多数预测,除非发生错误。试图了解新皮层中的神经元如何进行预测导致了第二个发现。
发现之二:预测发生在神经元内部
回顾一下,新皮层做出的预测有两种形式。一种是由于你周围的世界在变化而发生的。例如,你正在听一段旋律。你可以闭着眼睛静静地坐着,随着,进入你耳朵的声音会发生变化。如果你知道这段旋律,那么你的大脑就会不断地预测下一个音符,如果任何一个音符不正确,你就会注意到。第二种类型的预测是由于你在相对于世界移动而发生的。例如,当我在办公室的大厅里锁上自行车时,我的新皮层会根据我的动作对我的感觉、看到和听到的东西进行许多预测。自行车和锁并不是自己在动。我的每一个动作都会导致一系列的预测。如果我改变行动的顺序,预测的顺序也会改变。
蒙卡斯尔提出的共同皮质算法建议,新皮层中的每一个柱子都能进行这两种类型的预测。否则,皮层柱子会有不同的功能。我的团队也意识到,这两种类型的预测是密切相关的。因此,我们认为在一个子问题上的进展会导致另一个子问题的进展。
预测旋律中的下一个音符,也被称为序列记忆,是这两个问题中比较简单的,所以我们首先解决它。序列记忆不仅仅用于学习旋律;它还用于创造行为。例如,当我洗完澡用毛巾擦干身体时,我通常会遵循一个几乎相同的动作模式,这就是一种序列记忆。序列记忆也被用于语言中。识别一个口语单词就像识别一个简短的旋律。这个词是由一连串的音素定义的,而旋律是由一连串的音乐音程定义的。还有很多例子,但为了简单起见,我将坚持讨论旋律。通过推断皮质柱中的神经元如何学习序列,我们希望发现神经元如何对一切事物进行预测的基本原则。
我们在旋律预测问题上工作了几年,才推导出解决方案,它必须表现出许多能力。例如,旋律经常有重复的部分,如合唱或贝多芬第五交响曲的哒哒声。要预测下一个音符,你不能只看前一个音符或前五个音符。正确的预测,可能依赖于很久以前发生的音符。神经元必须弄清楚有多少背景是做出正确预测所必需的。另一个要求是,神经元必须玩 “说出那个曲子 “的游戏。你听到的前几个音符可能属于几个不同的旋律。神经元必须跟踪所有可能的旋律,与到目前为止所听到的一致,直到听到足够多的音符来消除所有的旋律,只有一个旋律。
为序列记忆问题设计一个解决方案是很容易的,但要弄清楚真正的神经元–像我们在新皮层中看到的那样排列–如何解决这些和其他要求是很难的。几年来,我们尝试了不同的方法。大多数方法在某种程度上是有效的,但没有一种方法表现出我们所需要的所有能力,也没有一种方法精确地符合我们所知道的关于大脑的生物学细节。我们对部分解决方案或 “生物启发 “解决方案不感兴趣。我们想知道真正的神经元是如何排列的,就像在新皮层中看到的那样,学习序列并进行预测。
我记得当我发现旋律预测问题的解决方案的那一刻。那是在2010年,在我们的感恩节假期的前一天。解决方案瞬间就出来了。但当我想到它时,我意识到它需要神经元做一些我不确定它们是否有能力做的事情。换句话说,我的假说做出了几个详细的、令人惊讶的预测,我可以进行测试。
科学家们通常通过做实验来检验一个理论,看看该理论的预测是否成立。但神经科学是不寻常的。每个子领域都有成百上千篇发表的论文,而这些论文中的大多数都是未被任何整体理论所吸收的实验数据。这为像我这样的理论家提供了一个机会,通过搜索过去的研究,找到支持或否定新假设的实验证据,从而快速测试新假设。我找到了几十篇包含实验数据的期刊论文,这些数据可以为新的序列记忆理论提供启示。我的大家庭在这里过节,但我太兴奋了,直到,大家都回家了。我记得我一边做饭一边读论文,并让我的亲戚们参与关于神经元和旋律的讨论。我读得越多,我就越有信心,我发现了一些重要的东西。
关键的见解是一种关于神经元的新思维方式。
一个典型的神经元
上面是一张新皮层中最常见的神经元类型的图片。像这样的神经元有数以千计,有时甚至数以万计的突触,沿着树突的分支分布。一些树突靠近细胞体(在图像的底部),一些树突离得较远(在顶部)。框中显示的是一个树突分支的放大图,所以你可以看到突触是多么的小和紧密。沿着树突的每一个凸起就是一个突触。我还强调了细胞体周围的一个区域;这个区域的突触被称为近端突触。如果近端突触收到足够的输入,那么神经元就会出现尖峰。尖峰从细胞体开始,通过轴突到达其他神经元。这张图片中看不到轴突,所以我加了一个朝下的箭头来显示它的位置。如果你只考虑近端突触和细胞体,那么这就是神经元的经典视图。如果你曾经读过关于神经元的书或研究过人工神经网络,你会认识到这种描述。
奇怪的是,只有不到10%的细胞突触是在近端区域。其他90%的突触距离太远,无法引起尖峰。如果输入到达这些远端突触中的一个,如方框中所示的突触,它对细胞体几乎没有影响。研究人员只能说,远端突触起着某种调节作用。许多年来,没有人知道新皮层中90%的突触是做什么的。
大约从1990年开始,这种情况发生了变化。科学家们发现了沿树突移动的新型尖峰。以前,我们只知道一种类型的尖峰:它从细胞体开始,沿着轴突到达其他细胞。现在,我们了解到还有其他沿树突行进的尖峰。有一种树突状尖峰是在一组位于树突分支上彼此相邻的20个左右的突触同时接受输入时开始的。一旦树突的尖峰被激活,它就会沿着树突行进,直到到达细胞体。当它到达那里时,它提高了细胞的电压,但还不足以使神经元产生尖峰。这就像树突尖峰在挑逗神经元,它的强度几乎足以使神经元活跃起来,但还不够。
神经元在回到正常状态之前,会在这种被激起的状态下停留一点时间。科学家们再次感到疑惑。如果树突尖峰的力量不足以在细胞体上产生尖峰,那么它们有什么用呢?由于不知道树突尖峰有什么用,人工智能研究人员使用没有树突尖峰的模拟神经元。他们也没有树突和在树突上发现的成千上万的突触。我知道,远端突触必须在大脑功能中发挥重要作用。任何理论和神经网络如果没有占到大脑中90%的突触,就一定是错误的。
我的一大见解是,树突尖峰是预测。当远端树突上一组相互靠近的突触同时得到输入时,就会出现树突棘,这意味着该神经元已经识别了其他一些神经元的活动模式。当检测到这种活动模式时,它就会产生一个树突棘,从而提高细胞体的电压,使细胞进入我们称之为预测状态的。然后,该神经元就被引向了尖峰状态。这类似于一个跑步者听到 “准备,开始…… “时被激发开始跑步。如果一个处于预测状态的神经元随后得到足够的近端输入以产生一个动作电位尖峰,那么该细胞就会比没有处于预测状态的神经元更早一点尖峰。
想象一下,有十个神经元都在其近端突触上识别相同的图案。这就像起跑线上的十个选手,都在等待同一个信号开始比赛。一个跑者听到 “准备,开始……",并预期比赛即将开始。她进入了街区,准备开始。当听到 “开始 “的信号时,她比其他没有准备好的选手更早离开了赛场,因为他们没有听到准备信号。看到第一位选手早早领先,其他选手就放弃了,甚至没有开始。他们等待着下一场比赛的到来。这种竞争发生在整个新皮层。
在每个迷你柱中,多个神经元对同一输入模式作出反应。它们就像起跑线上的跑步者,都在等待相同的信号。如果他们的首选输入到达,他们都想开始飙升。然而,如果一个或多个神经元处于预测状态,我们的理论说,只有这些神经元会扣球,其他神经元会被抑制。因此,当一个出乎意料的输入到来时,多个神经元会同时启动。如果输入是预测的,那么只有预测状态的神经元变得活跃。这是一个关于新皮层的常见观察:意外的输入比预期的输入引起更多的活动。
如果你拿几千个神经元,把它们排列成小柱子,让它们互相连接,并加入一些抑制性神经元。这些神经元就能解决 “调子的名字 “问题,它们不会被重复的子序列所迷惑,而且,它们可以共同预测序列中的下一个元素。
实现这一工作的诀窍是对神经元的新理解。我们以前知道,预测是大脑的一个普遍功能。但我们不知道预测是如何或在哪里进行的。有了这一发现,我们了解到大多数预测发生在神经元内部。当一个神经元识别出一个模式,产生一个树突尖峰,并被引向比其他神经元更早的尖峰时,就会发生预测。由于有数以千计的远端突触,每个神经元可以识别数以百计的模式,预测神经元何时应该变得活跃。预测是建立在新皮层、神经元的结构中的。
我们花了一年多时间测试新的神经元模型和序列记忆电路。我们编写了测试其能力的软件模拟,并惊讶地发现,只要有两万个神经元就能学习数千个完整的序列。我们发现,即使30%的神经元死亡或输入是嘈杂的,序列记忆也能继续工作。我们花的时间越多,测试我们的理论就越有信心,它真正捕捉到了新皮层中发生的情况。我们还从实验实验室发现了越来越多的经验性证据,支持我们的想法。例如,该理论预测树突状尖峰有一些特定的行为方式,但起初,我们无法找到结论性的实验证据。然而,通过与实验者交谈,我们能够更清楚地了解他们的发现,并看到数据与我们预测的一致。2011年,我们在一份白皮书中首次发表了该理论。随后,我们在2016年发表了一篇经同行评议的期刊论文,题目是 “为什么神经元有成千上万的突触,新皮层中的序列记忆理论”。对这篇论文的反应令人振奋,因为它很快就成为其杂志上阅读量最大的论文。
第三个发现。皮质柱的秘密是参考框架
接下来,我们把注意力转向预测问题的后半部分:当我们移动时,新皮层如何预测下一个输入?与旋律不同,这种情况下的输入顺序并不固定,因为它取决于我们移动的方向。例如,如果我向左看,就会看到一个东西;如果我向右看,就会看到别的东西。皮质柱要预测它的下一个输入,它必须知道什么运动即将发生。
预测一个序列中的下一个输入和预测我们移动时的下一个输入是类似的问题。我们意识到,如果给神经元一个代表传感器如何移动的额外输入,我们的序列记忆电路可以进行这两种类型的预测。然而,我们不知道与运动有关的信号应该是什么样子的。
我们从我们能想到的最简单的事情开始。如果与运动有关的信号只是 “向左移动 “或 “向右移动”,会怎么样?我们测试了这个想法,它是有效的。我们甚至建造了一个小机器人手臂,在它向左和向右移动时预测它的输入,并在一个神经科学会议上演示了它。然而,我们的机器人手臂有局限性。它对简单的问题起作用,例如在两个方向上移动,但当我们试图将它扩展到与现实世界的复杂性一起工作时,例如同时在多个方向上移动,它需要太多的训练。我们觉得我们已经接近了正确的解决方案,但有些地方是错误的。我们尝试了几种变化,但没有成功。这很令人沮丧。几个月后,我们陷入了困境。我们看不到解决这个问题的方法,所以我们把这个问题放在一边,并在其他方面做了一阵子。
2016年2月底,我在办公室等待我的配偶珍妮特和我一起吃午饭。我手里拿着一个Numenta咖啡杯,观察我的手指在触摸它。我问自己一个简单的问题。我的大脑需要知道什么来预测我的手指在移动时会有什么感觉?如果我的一个手指在杯子的侧面,我把它向顶部移动,我的大脑预测我将感觉到嘴唇的圆形曲线。我的大脑在我的手指接触到嘴唇之前就做出了这个预测。大脑需要知道什么才能做出这种预测?答案很容易说明。大脑需要知道两件事:它所接触的是什么物体(在这种情况下是咖啡杯),以及我的手指移动后将在杯子上的什么位置。
请注意,大脑需要知道我的手指相对于杯子的位置。我的手指相对于我的身体在哪里并不重要,杯子在哪里或它的位置也不重要。杯子可以向左倾斜或向右倾斜。它可以在我前面,也可以在旁边。重要的是我的手指相对于杯子的位置。
这一观察意味着在新皮层中一定有神经元代表我的手指在连接到杯子的参考框架中的位置。我们一直在寻找的与运动有关的信号,我们需要预测下一个输入的信号,就是 “物体上的位置”。
你可能在高中时学过参照系。定义某物在空间的位置的x、y和z轴是参考框架的一个例子。另一个熟悉的例子是纬度和经度,它们定义了地球表面的位置。起初,我们很难想象神经元如何能代表像x、y和z坐标这样的东西。但更令人费解的是,神经元可以将一个参考框架附加到一个咖啡杯这样的物体上。杯子的参考框架是相对于杯子的;因此,参考框架必须随着杯子的移动而移动。
想象一下一把办公椅。我的大脑预测当我触摸椅子时会有什么感觉,就像我的大脑预测当我触摸咖啡杯会有什么感觉一样。因此,我的新皮层中一定有神经元知道我的手指相对于椅子的位置,也就是说,我的新皮层必须建立一个固定在椅子上的参考框架。如果我把椅子旋转一圈,参考框架就会随之旋转。如果我把椅子翻过来,参考框架也会翻过来。你可以把参考框架看作是一个无形的三维网格,围绕着椅子,并附着在椅子上。神经元是简单的东西。很难想象它们能够创造并将参考框架附着在物体上,甚至在这些物体在世界范围内移动和旋转的时候。但它变得更加令人惊讶。
我身体的不同部位(指尖、手掌、嘴唇)可能同时接触到咖啡杯。我身体的每个部位接触到,都会根据它在杯子上的独特位置对它的感觉做出单独的预测。因此,大脑不是在做一个预测,而是在同时做几十个甚至几百个预测。新皮质必须知道相对于杯子的位置,我身体的每个部分都在接触它。
我意识到,视觉正在做与触摸相同的事情。视网膜的斑块类似于皮肤的斑块。你的每块视网膜只看到整个物体的一小部分,就像你的每块皮肤只接触到物体的一小部分一样。大脑并不处理一张图片;它从眼睛背面的图片开始,但随后将其分解成数百个碎片。然后,它将每一块分配到相对于被观察物体的位置。
创建参考框架和跟踪位置并不是一项微不足道的任务。我知道这需要几种不同类型的神经元和多层细胞来进行这些计算。由于每个皮质柱中的复杂电路是相似的,位置和参考框架必须是新皮质的普遍属性。新皮层中的每一列–无论它代表视觉输入、触觉输入、听觉输入、语言或高级思维–都必须有代表参考框架和位置的神经元。
到那时为止,大多数神经科学家,包括我在内,都认为新皮层主要处理感觉输入。那天我意识到的是,我们需要把新皮层想成主要处理参考框架。大部分的电路是用来创建参考框架和追踪位置的。感觉输入当然是必不可少的。正如我将在接下来的章节中解释的那样,大脑通过将感觉输入与参考框架中的位置联系起来来建立世界的模型。
为什么参考框架如此重要?大脑从拥有它们中获得什么?首先,参考框架使大脑能够了解某物的结构。一个咖啡杯是一个东西,因为它是由一组在空间中相对排列的特征和表面组成的。同样地,一张脸是由鼻子、眼睛和嘴在相对位置上排列而成。你需要一个参考框架来指定物体的相对位置和结构。
第二,通过使用参考框架来定义一个物体,大脑可以一次性地操纵整个物体。例如,一辆汽车有许多相对排列的特征。一旦我们学会了一辆汽车,我们就可以想象它从不同的角度看是什么样子,或者如果它在一个维度上被拉长。为了完成这些壮举,大脑只需旋转或拉伸参考框架,汽车的所有特征就会随之旋转和拉伸。
第三,需要一个参考框架来计划和创造运动。假设我的手指正触摸着手机的正面,我想按下顶部的电源按钮。如果我的大脑知道我手指的当前位置和电源按钮的位置,那么它就能计算出让我的手指从当前位置到所需的新位置所需的运动。要进行这种计算,需要一个相对于手机的参考框架。
参考框架在许多领域都有应用。机器人学家依靠它们来计划机器人手臂或身体的运动。参考框架也被用于动画电影中,在人物移动时进行渲染。有几个人曾建议,某些人工智能应用可能需要参考框架。但据我所知,还没有任何关于新皮层在参考框架上工作的重要讨论,而且每个皮层柱中的大多数神经元的功能是创建参考框架和跟踪位置。现在对我来说,这似乎很明显。
Vernon Mountcastle认为有一种普遍的算法存在于每个皮质柱中,然而他并不知道这种算法是什么。弗朗西斯-克里克写道,我们需要一个新的框架来理解大脑,然而他也不知道这个框架应该是什么。2016年的那一天,我手里拿着杯子,意识到蒙卡斯特的算法和克里克的框架都是基于参考框架的。我还不明白神经元如何能做到这一点,但我知道这一定是真的。参考框架是缺失的成分,是揭开新皮质之谜和理解智能的关键。
所有这些关于位置和参考框架的想法都在一秒钟内发生在我身上。我非常兴奋,从椅子上跳起来,跑去告诉我的同事苏布泰-艾哈迈德。当我奔跑了20英尺到他的办公桌时,我碰到了珍妮特,差点把她撞倒。我急于和苏布泰交谈,但当我稳住珍妮特并向她道歉时,我意识到以后再和他交谈会更明智。珍妮特和我一边讨论参考框架和位置,一边分享冻酸奶。
这是一个很好的点,可以解决我经常被问到的一个问题:如果一个理论没有经过实验检验,我怎么能自信地谈论它?我刚刚描述了其中的一种情况。我有一个洞察力,即新皮层被注入了参考框架,我立即开始有把握地谈论它。在我写这本书的时候,有越来越多的证据支持这个新想法,但它仍然没有得到彻底的测试。然而,我毫不犹豫地把这个想法描述为一个事实。原因就在这里。
在我们处理问题的过程中,我们发现了我所说的制约因素。约束是问题的解决方案必须解决的事情。在描述序列记忆时,我举了几个制约因素的例子,例如,Name That Tune要求。大脑的解剖学和生理学也是制约因素。大脑理论最终必须解释大脑的所有细节,而一个正确的理论不能违反任何这些细节。
你在一个问题上工作的时间越长,你发现的限制因素就越多,想象一个解决方案就越难。我在这一章中描述的 “灵光一现 “是关于我们工作了多年的问题。因此,我们对这些问题的理解很深刻,我们的约束条件清单也很长。一个解决方案正确的可能性随着它所满足的约束条件的数量呈指数级增长。这就像解决一个填字游戏:往往有几个词与一个单独的线索相匹配。如果你从这些词中选一个,可能是错的。如果你找到两个相交的词,那么它们都是正确的可能性就大了。如果你找到十个相交的词,那么它们都是错的机会就微乎其微了。你可以毫无顾虑地用墨水写出答案。
当一个新的想法满足了多种约束条件时,就会出现 “哈 “的时刻。你在一个问题上工作的时间越长–因此,解决方案解决的约束越多–“啊 “的感觉就越大,你就越有信心相信这个答案。新皮层被注入参考框架的想法解决了许多约束条件,我立即知道它是正确的。
我们花了三年多的时间来研究这一发现的意义,而且在我写这篇文章时,我们仍然没有完成。到目前为止,我们已经发表了几篇关于它的论文。第一篇论文的题目是 “关于新皮层中的柱子如何促成学习世界结构的理论”。这篇论文从我们在2016年关于神经元和序列记忆的论文中描述的相同电路开始。然后我们增加了一层代表位置的神经元和第二层代表被感知的物体。有了这些补充,我们表明,单个皮质柱可以通过感应和移动以及感应和移动来学习物体的三维形状。
例如,想象一下,将手伸进一个黑盒子,用一根手指触摸一个新奇的物体。你可以通过在物体的边缘移动手指来了解整个物体的形状。我们的论文解释了单个皮质柱如何做到这一点。我们还展示了一个柱子如何以同样的方式识别先前学习的物体,例如通过移动手指。然后,我们展示了新皮层中的多个柱子如何共同工作以更快地识别物体。例如,如果你把手伸进黑盒子里,用整个手抓住一个未知的物体,你可以用较少的动作来识别它,在某些情况下,只需一次抓握就可以。
我们在提交这篇论文时很紧张,争论是否应该等待。我们提出,整个新皮层通过创造参考框架来工作,有成千上万的,同时活动。这是一个激进的想法。然而,我们没有关于神经元如何实际创造参考框架的建议。我们的论点是这样的:“我们推断位置和参考框架必须存在,而且,假设它们确实存在,这里是皮质柱如何工作的。而且,哦,顺便说一句,我们不知道神经元实际上是如何创造参照系的。“我们决定还是要提交论文。我问自己,即使这篇论文不完整,我还想读吗?我的答案是肯定的。新皮层在每一列中代表位置和参考框架的想法太令人兴奋了,不能因为我们不知道神经元是如何做到的就不去看。我相信基本想法是正确的。
撰写一篇论文需要很长的时间。仅仅写散文就需要几个月的时间,而且还经常要进行模拟,这可能需要额外的几个月。在这个过程接近尾声时,我有一个想法,我们在提交论文之前将其添加到论文中。我建议,我们可以通过研究大脑的一个较古老的部分–内丘脑皮层,来找到新皮层中的神经元如何创造参考框架的答案。几个月后,当论文被接受时,我们知道这个猜想是正确的,我将在下一章讨论。
我们刚刚涵盖了很多内容,所以让我们做一个快速回顾。本章的目的是向你介绍新皮层中的每根皮质柱都会创造参考框架这一观点。我向你介绍了我们为得出这一结论而采取的步骤。我们从新皮层学习一个丰富而详细的世界模型开始,它用这个模型不断预测下一个感觉输入是什么。我们接着问,神经元如何能做出这些预测。这使我们得出了一个新的理论,即大多数预测是由树突尖峰表示的,它暂时改变了神经元内部的电压,并使神经元比其他情况下更快一点发射。预测不会沿着细胞的轴突发送到其他神经元,这就解释了为什么我们对大多数预测一无所知。然后我们展示了新皮层中使用,新神经元模型的电路如何学习和预测序列。我们将这一想法应用于这样一个问题:当输入因我们自己的运动而改变时,这样的电路如何能预测下一个感觉输入。为了进行这些感觉-运动预测,我们推断,每个皮质柱必须知道其输入相对于被感觉到的物体的位置。要做到这一点,皮质柱需要一个固定在物体上的参考框架。
第五章
大脑中的地图
我们花了很多年才推断出参考框架存在于整个新皮层,但事后看来,只要有一个简单的观察,我们早就可以理解这一点。现在,我正坐在Numenta办公室的一个小休息区里。在我附近有三把与我所坐的椅子相似的舒适椅子。椅子之外是几张独立的办公桌。在办公桌外,我看到街对面的旧县法院。来自这些物体的光线进入我的眼睛,投射到视网膜上。视网膜上的细胞将光转化为尖峰。这是视觉开始的地方,在眼睛的后面。那么,为什么我们不认为物体是在眼睛里的呢?如果椅子、书桌和法院在我的视网膜上相邻成像,我怎么会感知到它们处于不同的距离和不同的位置?同样,如果我听到一辆汽车驶来,为什么我认为汽车在我右边一百英尺外,而不是在我的耳朵里,因为声音实际上在那里?
这个简单的观察,即我们感知物体是在某个地方–不是在我们的眼睛和耳朵里,而是在世界的某个位置–告诉我们,大脑必须有神经元,其活动代表我们所感知的每个物体的位置。
在上一章的末尾,我告诉你,我们在提交第一篇关于参照系的论文时很担心,因为当时我们不知道新皮层中的神经元如何能做到这一点。我们当时提出了一个关于新皮层如何工作的重要新理论,但这个理论主要是基于逻辑推理。如果我们能说明神经元是如何做到这一点的,这将是一篇更有力的论文。在我们提交论文的前一天,我添加了几行文字,暗示答案可能在大脑的一个较古老的部分–内丘脑皮层中找到。我将用一个关于进化的故事来告诉你我们为什么提出这个建议。
一个进化的故事
当动物第一次开始在世界范围内活动时,它们需要一种机制来决定移动的方向。简单的动物有简单的机制。例如,一些细菌遵循梯度。如果所需资源(如食物)的数量在增加,那么它们就更有可能继续向同一方向移动。如果数量在减少,那么它们更有可能转向并尝试一个不同的方向。一个细菌不知道它在哪里;它没有任何方法来表示它在这个世界上的位置。它只是向前走,用一个简单的规则来决定何时转弯。一个稍微复杂一点的动物,如蚯蚓,可能会移动以保持在温暖、食物和水的理想范围内,但它不知道自己在花园里的位置。它不知道砖头路有多远,也不知道离最近的栅栏杆的方向和距离。
现在考虑一下一个知道自己在哪里的动物所拥有的优势,一个总是知道自己相对于环境的位置的动物。动物可以记住它过去在哪里找到的食物,以及它用来避难的地方。然后,动物可以计算出如何从它现在的位置到这些和其他以前去过的地方。动物可以记住它到水坑的路径以及沿途各个地点发生的事情。知道自己的位置和世界上其他事物的位置,有很多好处,但它需要一个参考框架。
回顾一下,参考框架就像地图上的网格。例如,在一张纸质地图上,你可能会用标记的行和列来定位某个东西,如D行和第7列。地图的行和列是地图所代表的区域的参考框架。如果一只动物有一个关于它的世界的参考框架,那么当它探索的时候,它可以记下它在每个地点发现的东西。当动物想去某个地方,如避难所时,它可以使用参考框架来计算如何从当前位置到达那里。为自己的世界建立一个参考框架对生存是很有用的。
能够为世界导航是如此有价值,以至于进化发现了多种方法来做这件事。例如,一些蜜蜂可以用一种舞蹈的形式交流距离和方向。哺乳动物,如我们自己,有一个强大的内部导航系统。在我们大脑的旧部分有一些神经元,已知它们可以学习我们去过的地方的地图,这些神经元长期以来一直受到进化的压力,以至于它们被微调到可以做这些事情。在哺乳动物中,存在这些创造地图的神经元的古老大脑部位被称为海马体和恩托利纳皮层。在人类中,这些器官大约有一个手指的大小。在大脑的两侧各有一套,靠近中心。
旧脑中的地图
1971年,科学家John O’Keefe和他的学生Jonathan Dostrovsky将一根导线放入老鼠的大脑。这根导线记录了海马体中一个单一神经元的尖峰活动。这根导线朝天花板延伸,因此他们可以在老鼠移动和探索其环境时记录该细胞的活动,其环境通常是桌子上的一个大盒子。他们发现了现在被称为位置细胞的东西:当大鼠在特定环境中的特定位置时,神经元就会启动。一个位置细胞就像地图上的 “你在这里 “的标记。随着大鼠的移动,不同的位置细胞变得活跃,每个新的位置。如果老鼠回到它之前所在的位置,同一个位置细胞就会再次活跃起来。
2005年,May-Britt Moser和Edvard Moser实验室的科学家们使用了一个类似的实验装置,同样是用大鼠。在他们的实验中,他们记录了与海马相邻的内丘皮层中的神经元的信号。他们发现了现在被称为网格细胞的东西,这些细胞在环境中的多个位置发射。一个网格细胞变得活跃的位置形成一个网格图案。如果老鼠在一条直线上移动,同一个网格细胞就会一次又一次地活跃起来,间隔时间相等。
位置单元和网格单元的工作细节很复杂,至今仍未完全理解,但你可以认为它们是在为大鼠所处的环境绘制一张地图。网格细胞就像纸质地图的行和列,但覆盖在动物的环境上。它们使动物能够知道它在哪里,预测它移动时的位置,并计划运动。例如,如果我在地图上的B4位置,想去D6位置,我可以通过地图的网格知道我必须向右走两格,向下走两格。
但是仅仅是网格单元并不能告诉你某个地点有什么。例如,如果我告诉你,你在地图上的位置A6,这个信息并不能告诉你你会在那里找到什么。要知道A6有什么,你需要看地图,看看相应的方格中印有什么。地点单元就像印在广场上的细节。哪些位置单元变得活跃,取决于老鼠在特定位置感觉到什么。位置细胞根据感觉输入告诉大鼠它在哪里,但位置细胞单独对计划运动没有用–这需要网格细胞。这两种类型的细胞一起工作,创造出老鼠环境的完整模型。
每次老鼠进入一个环境,网格单元都会建立一个参考框架。如果这是一个新的环境,网格细胞就会建立一个新的参考框架。如果老鼠认出了这个环境,网格单元就会重新建立以前使用的参考框架。这个过程类似于你进入一个城镇。如果你环顾四周,发现你以前去过那里,你就会拿出该镇的正确地图。如果这个小镇看起来不熟悉,那么你就拿出一张白纸,开始创建一个新的地图。当你在镇上走动时,你在地图上写下你在每个地方看到的东西。这就是网格单元和地点单元的作用。它们为每个环境创建独特的地图。当老鼠移动时,活动的网格单元和活动的地点单元会发生变化,以反映新的位置。
人类也有网格细胞和地点细胞。除非你完全迷失方向,否则你总能感觉到你在哪里。我现在正站在我的办公室里。即使我闭上眼睛,我的位置感仍然存在,我继续知道我在哪里。闭上眼睛,我向右走了两步,我在房间里的位置感发生了变化。我大脑中的网格细胞和位置细胞已经创建了我办公室的地图,即使我闭着眼睛,它们也能追踪到我在办公室的位置。当我行走时,哪些细胞是活跃的,以反映我的新位置。人类、老鼠,甚至所有哺乳动物都使用同样的机制来了解我们的位置。我们都有网格细胞和地点细胞,它们为我们去过的地方建立模型。
新脑中的地图
当我们在写2017年关于新皮层中的位置和参考框架的论文时,我对位置细胞和网格细胞有一些了解。我想到,知道我的手指相对于咖啡杯的位置类似于知道我的身体相对于一个房间的位置。我的手指在杯子周围移动,就像我的身体在房间里移动一样。我意识到,新皮层可能有相当于海马体和恩托希纳皮层的神经元。这些皮层位置细胞和皮层网格细胞将以类似于旧脑中的位置细胞和网格细胞学习环境模型的方式学习物体的模型。
鉴于它们在基本导航中的作用,地方细胞和网格细胞几乎可以肯定在进化上比新皮层更早。因此,我认为新皮层使用网格细胞的衍生物创造参考框架比它从头演化出一个新机制的可能性更大。但在2017年,我们不知道有任何证据表明新皮层有类似于网格细胞或位置细胞的东西–这只是知情的猜测。
在我们2017年的论文被接受后不久,我们了解到最近的实验表明网格细胞可能存在于新皮层的一部分。(我将在第七章 讨论这些实验。)这令人鼓舞。我们对与网格细胞和位置细胞有关的文献研究得越多,我们就越有信心,执行类似功能的细胞存在于每个皮质柱中。我们在2019年的一篇论文中首次提出了这个论点,题为 “基于新皮层中的网格细胞的智力和皮层功能框架”。
同样,要学习一个完整的模型,你需要网格单元和位置单元。网格细胞创造了一个参考框架来指定位置和计划运动。但你也需要感觉到的信息,由位置细胞代表,将感觉输入与参考框架中的位置联系起来。
新皮层中的映射机制并不是旧脑中的映射机制的完全复制。证据表明,新皮层使用相同的基本神经机制,但它在几个方面有所不同。就好像大自然把海马体和内皮层剥离到最小的形式,制作了数以万计的副本,并把它们并排排列在皮质柱中。这就成了新皮层。
旧脑中的网格细胞和位置细胞主要追踪一件事的位置:身体。它们知道身体在其当前环境中的位置。另一方面,新皮质有大约15万个这种电路的副本,每个皮质柱有一个。因此,新皮层同时追踪成千上万的位置。例如,你的每一小块皮肤和每一小块,你的视网膜在新皮质中有自己的参考框架。你的五个指尖接触一个杯子,就像五只老鼠在探索一个盒子。
狭小空间里的巨幅地图
那么,大脑中的模型是什么样子的?新皮层是如何将数百个模型塞进每平方毫米的地方的?为了理解这一点,让我们回到我们的纸质地图的比喻。假设我有一张小镇的地图。我把它摊开在桌子上,看到它被标记为行和列,把它分成100个方块。A1是左上角,J10是右下角。每个方格中都印有我在该地区可能看到的东西。
我拿起一把剪刀,剪下每一个方块,标上它的网格坐标。B6,G1,等等。我还在每个方格上标上 “城镇1”,然后对另外九张地图进行同样的操作,每张地图代表一个不同的城镇。现在我有1000个方块:10个城镇中的每一个都有100个地图方块。我把这些方块洗干净,放在一叠里。虽然我的堆栈里有十张完整的地图,但每次只能看到一个地点。现在有人把我的眼睛蒙上,把我扔在十个城镇中的一个随机地点。摘下眼罩,我环顾四周。起初,我不知道我在哪里。然后我看到我正站在一个喷泉前,喷泉上有一个女人的雕塑在看书。我翻开我的地图方块,一次一个,直到我看到一个显示这个喷泉的方块。这个地图方块的标签是城镇3,地点D2。现在我知道我在哪个镇,也知道我在那个镇的什么地方。
接下来我可以做几件事。例如,我可以预测如果我开始行走会看到什么。我现在的位置是D2。如果我向东走,我就会到D3。我在我的方格堆中搜索,找到标有城镇3,D3的方格。它显示了一个操场。通过这种方式,我可以预测如果我向某个方向移动会遇到什么。
也许我想去镇上的图书馆。我可以在我的方格堆中搜索,直到我看到一个显示在第三镇的图书馆的方格。鉴于我在D2,我可以计算出我有,向东走3个方格,向南走5个方格才能到达图书馆。我可以走几条不同的路线去那里。利用我的地图方格,一次一个,我可以想象出我在任何一条特定路线上会遇到什么。我选择了一条经过冰激凌店的路线。
现在考虑一个不同的场景。当我被送到一个未知的地方,摘下眼罩后,我看到了一家咖啡店。但当我翻看我的一叠方块时,我发现有五个方块显示的是类似的咖啡店。两个咖啡店在一个镇上,另外三个在不同的镇上。我可能在这五个地方中的任何一个。我应该怎么做?我可以通过移动来消除这种模糊性。我看了看我可能在的五个方块,然后查了查如果我从每个方块向南走会看到什么。五个方格的答案都是不同的。为了弄清楚我在哪里,我就实际向南走。我在那里找到的东西消除了我的不确定性。我现在知道我在哪里了。
这种使用地图的方式与我们通常使用地图的方式不同。首先,我们的一叠地图方块包含了我们所有的地图。通过这种方式,我们用这叠地图来弄清我们在哪个镇上,以及我们在那个镇上的位置。
第二,如果我们不确定我们在哪里,那么我们可以通过移动来确定我们的城镇和位置。这就是当你把手伸进一个黑盒子,用一根手指触摸一个未知的物体时发生的事情。通过一次触摸,你可能无法确定你摸到的是什么物体。你可能要移动手指一次或多次才能做出判断。通过移动,你同时发现了两件事:当你认识到你触摸的是什么物体时,你也知道你的手指在物体上的位置。
最后,这个系统可以扩展到处理大量的地图,而且速度很快。在纸质地图的比喻中,我描述了一次看一个地图方块的情况。如果你有很多地图,这可能需要很多时间。然而,神经元使用的是所谓的关联记忆。细节在这里并不重要,但它允许神经元一次搜索所有的地图方块。神经元搜索一千个地图和搜索一个地图所需的时间相同,。
皮质柱中的地图
现在让我们考虑一下新皮层中的神经元是如何实现地图状模型的。我们的理论说,每根皮质柱都可以学习完整物体的模型。因此,每根柱子–新皮层的每一平方毫米–都有自己的地图方块集。皮质柱如何做到这一点是很复杂的,我们还没有完全理解,但我们了解基本情况。
回顾一下,一个皮质柱有多层神经元。这些层中有几个需要用来创建地图方块。下面是一个简化图,让你了解我们认为在皮质柱中发生的事情。
一个皮质柱的模型
该图表示一个皮质柱中的两层神经元(阴影框)。虽然一个柱子很小,大约一毫米宽,但这些层中的每一层可能有一万个神经元。
上层接收柱子的感觉输入。当一个输入到达时,它会导致几百个神经元变得活跃。在纸质地图的比喻中,上层代表你在某个地点观察到的东西,比如说喷泉。
底层代表参考框架中的当前位置。在这个比喻中,底层代表了一个位置–比如镇3,D2–但并不代表在那里观察到的东西。它就像一个空白的正方形,只标有城镇3,地点D2。
两个垂直箭头代表空白地图方块(下层)和在该地点看到的东西(上层)之间的联系。向下的箭头是观察到的特征,如喷泉,是如何与特定城镇的特定位置联系起来的。向上的箭头将一个特定的位置–城镇3,D2–与一个观察到的特征联系起来。上层大致相当于地点单元,下层大致相当于网格单元。
学习一个新的对象,如咖啡杯,主要是通过学习两层之间的连接,即垂直箭头来完成的。换句话说,像咖啡杯这样的物体是由一组观察到的特征(上层)与杯子上的一组位置(下层)相关联来定义的。如果你知道这个特征,那么你就可以确定其位置。如果你知道位置,你就可以预测这个特征。
信息的基本流程如下。一个感觉输入到达,并由上层的神经元表示。这就调用了下层中与输入相关的位置。当运动发生时,如移动手指,那么下层就会改变到预期的新位置,从而导致对上层的下一个输入的预测。
如果原始输入是模糊的,例如咖啡店,那么网络就会激活下层的多个位置–例如,所有存在咖啡店的位置。如果你用一个手指触摸咖啡杯的边缘,就会出现这种情况。许多物体都有一个边缘,所以你一开始不能确定你碰的是什么物体。当你移动时,下层会改变所有可能的位置,然后在上层做出多个预测。接下来的输入将消除任何不匹配的位置。
我们在软件中模拟了这个两层电路,对每层的神经元数量做了现实的假设。我们的模拟表明,不仅单个皮质柱可以学习物体的模型,而且每个柱子可以学习数百个模型。我们在2019年的论文《新皮层中的位置》中对神经机制和模拟进行了描述。使用皮层网格细胞的感觉运动物体识别理论”。
适应情况
皮质柱还必须做其他事情来学习物体的模型。例如,需要有一个方向的表示。假设你知道你在哪个城市,你知道你在那个城市的位置。现在我问你:“如果你向前走一个街区,你会看到什么?“你会回答:“我在哪个方向走?“知道你的位置并不足以预测你行走时将会看到什么;你还需要知道你所面对的方向,即你的方向。要预测你在某一特定地点会看到什么,也需要方位。例如,站在一个街角,当你面向北方时,你可能会看到一个图书馆,而当你面向南方时,你可能会看到一个操场。
老人的大脑中有一些神经元被称为头部方向细胞。顾名思义,这些细胞代表了动物头部所面对的方向。头部方向细胞的作用就像一个指南针,但它们并不与磁北相联系。它们与房间或环境保持一致。如果你站在一个熟悉的房间里,然后闭上眼睛,你会保留一种感觉,即你正朝着哪个方向。如果你转动身体,同时保持闭眼,你的方向感就会改变。这种感觉是由你的头部方向细胞创造的。当你转动身体时,你的头部方向细胞就会改变,以反映你在房间里的新方向。
皮质柱必须有执行与头部方向细胞相当功能的细胞。我们用更通用的术语方向细胞来指代它们。想象一下,你正在用食指触摸咖啡杯的边缘。手指上的实际印象取决于手指的方向。例如,你可以将手指保持在同一位置,但围绕接触点旋转。当你这样做时,手指的感觉会发生变化。因此,为了预测它的输入,皮质柱必须有一个方向的表示。为了简单起见,我没有在上述皮质柱的图中显示方向细胞和其他细节。
总而言之,我们提出每个皮质柱都在学习物体的模型。这些柱子使用与旧脑学习环境模型相同的基本方法来做这件事。因此,我们提出,每个皮质柱都有一组相当于网格细胞的细胞,另一组相当于位置细胞,还有一组相当于头部方向的细胞,所有这些都是在旧脑的某些部分首次发现的。我们通过逻辑推理得出了我们的假说。在第七章 ,我将列出支持我们提议的越来越多的实验证据。
但首先,我们要把注意力转移到整个新皮质上。回顾一下,每个皮层柱子都很小,大约是一块细面条的宽度,而新皮层很大,大约是一张餐巾纸大小。因此,人类的新皮层中大约有15万个柱子。并非所有的皮质柱都在为物体建模。其余的柱子在做什么,是下一章的主题。
第六章
概念、语言和高级思维
我们优越的认知功能是我们与灵长类动物表亲的最大区别。我们的视觉和听觉能力与猴子相似,但只有人类会使用复杂的语言,制造复杂的工具,如计算机,并能够推理出进化、遗传和民主等概念。
弗农-蒙卡斯尔提出,新皮层的每一列都执行相同的基本功能。如果这是真的,那么语言和其他高级认知能力在某些基本层面上与看、摸和听是一样的。这并不明显。阅读莎士比亚似乎与拿起一个咖啡杯并不相似,但这就是蒙卡斯特建议的含义。
蒙卡斯尔知道,皮质柱并不完全相同。例如,从你的手指获得输入的柱子和理解语言的柱子之间存在着物理差异,但相似之处多于差异。因此,蒙卡斯尔推断,一定有一些基本功能支撑着新皮层所做的一切–不仅仅是感知,还有我们认为是智力的所有事情。
视觉、触觉、语言和哲学等不同的能力在本质上是相同的,这种想法对很多人来说很难接受。蒙卡斯特没有提出共同的功能是什么,也很难想象它可能是什么,所以很容易忽视他的提议或直接拒绝它。例如,语言学家经常将语言描述为与所有其他认知能力不同。如果他们接受了蒙卡斯特的提议,他们可能会寻找语言和视觉之间的共同点,以更好地理解语言。对我来说,这个想法太令人兴奋了,我发现经验证据压倒性地支持蒙卡索的提议。因此,我们留下了一个迷人的谜题:什么样的功能,或算法,可以创造人类智能的所有方面?
到目前为止,我已经描述了一个关于皮质柱如何学习物理物体模型的理论,如咖啡杯、椅子和智能手机。该理论说,皮质柱为每个观察到的物体创建参考框架。回顾一下,参考框架就像一个无形的、三维的网格,围绕并附着于某物。参考框架允许皮层柱学习定义物体形状的特征的位置。
用更抽象的术语来说,我们可以把参照系看作是组织任何种类的知识的一种方式。一个咖啡杯的参照系对应于一个我们可以触摸和看到的物理对象。然而,参考框架也可以用来组织我们无法直接感知的事物的知识。
想一想你知道的所有事情,但你没有直接经历过。例如,如果你学习过遗传学,那么你就知道DNA分子。你可以直观地看到它们的双螺旋形状,你知道它们如何用核苷酸的ATCG编码氨基酸序列,你也知道DNA分子如何通过解压进行复制。当然,没有人曾直接看到或触摸过DNA分子。我们不能,因为它们太小了。为了组织我们关于DNA分子的知识,我们制作图片,就好像我们可以看到它们,制作模型,就好像我们可以触摸到它们。这种,使我们能够在参考框架中储存我们对DNA分子的知识–就像我们对咖啡杯的知识一样。
我们对我们所知道的许多事情都使用了这种技巧。例如,我们对光子有很多了解,我们对我们的银河系也有很多了解。再一次,我们把这些东西想象成我们可以看到和触摸到它们,因此我们可以用我们用于日常物理对象的相同参考框架机制来组织我们对它们的了解。但人类的知识也延伸到了不能被视觉化的事物。例如,我们有关于民主、人权和数学等概念的知识。我们知道关于这些概念的许多事实,但我们无法以类似于三维物体的方式组织这些事实。你不可能轻易地做出一个民主的图像。
但概念性知识必须有某种形式的组织。诸如民主和数学这样的概念并不只是一堆事实。我们能够对它们进行推理,并对如果我们以这种或那种方式行事会发生什么进行预测。我们这样做的能力告诉我们,概念的知识也必须储存在参考框架中。但这些参考框架可能不容易等同于我们用于咖啡杯和其他物理物体的参考框架。例如,对某些概念最有用的参考框架可能有三个以上的维度。我们无法将三维以上的空间形象化,但从数学的角度来看,它们与三维或更少维度的空间工作方式相同。
所有的知识都储存在参考框架中
我在本章探讨的假设是,大脑使用参考框架来安排所有知识,而思考是一种移动的形式。当我们激活参考框架中的连续位置时,思考就会发生。
这一假设可以分解为以下几个部分。
1.参考框架在新皮层中随处可见
这一前提指出,新皮层的每一列都有创造参考框架的细胞。我曾提出,从事这项工作的细胞与大脑中较老部分的网格细胞和位置细胞相似,但不完全相同。
2.参考框架被用来模拟我们所知道的一切,而不仅仅是物理对象。
新皮层中的一个柱子只是一堆神经元。一根柱子并不 “知道 “它的输入代表什么,它也没有任何关于它应该学习什么的先验知识。一根柱子只是一个由神经元建立的机制,它盲目地试图发现和模拟任何导致其输入变化的结构。
早些时候,我假设大脑首先进化出参考框架来学习环境的结构,以便我们能够在世界范围内移动。然后,我们的大脑进化到使用相同的机制来学习物理对象的结构,以便我们能够识别和操纵它们。我现在提出,我们的大脑再次进化到使用同样的机制来学习和表示概念对象的结构,如数学和民主。
3.所有的知识都储存在相对于参考框架的位置上
参考框架不是智力的一个可有可无的组成部分;它们是所有信息在大脑中储存的结构。你所知道的每一个事实都与参考框架中的一个位置相匹配。要成为历史等领域的专家,需要将历史事实分配到适当的参考框架中的位置。
以这种方式组织知识,使事实具有可操作性。回顾一下地图的比喻。通过把关于一个城镇的事实放在一个类似网格的参考框架上,我们可以确定需要采取什么行动来实现一个目标,例如如何去一家特定的餐馆。地图的统一网格使关于该镇的事实可以操作。这一原则适用于所有的知识。
4.思考是一种运动的形式
如果我们所知道的一切都储存在参考框架中,那么为了回忆储存的知识,我们必须激活适当参考框架中的适当位置。当神经元调用参考框架中一个又一个的位置时,思考就发生了,把储存在每个位置的东西带入脑海。我们在思考时经历的一系列想法类似于我们用手指触摸一个物体时经历的一系列感觉,或者我们在一个小镇上行走时看到的一系列事物。
参考框架也是实现目标的手段。就像一张纸质地图可以让你弄清楚如何从你所在的地方到达一个理想的新地点一样,新皮层中的参考框架可以让你弄清楚你应该采取什么步骤来实现更多的概念性目标,例如解决一个工程问题或在工作中获得晋升。
虽然我们在一些已发表的研究中提到了这些关于概念性知识的想法,但它们并不是重点,我们也没有直接就这个话题发表论文。所以,你可以认为这一章比书中前面的部分更具有猜测性,但我并不这么认为。虽然有很多细节我们还不了解,但我相信整体框架–概念和思维是基于参照系的–将经得起时间的考验。
在本章的其余部分,我将首先描述新皮层的一个被充分研究的特征,它被划分为 “什么 “区域和 “哪里 “。我利用这一讨论来说明皮质柱如何通过简单地改变其参考框架来执行明显不同的功能。然后,我继续讨论更抽象和概念化的智力形式。我提出了支持上述前提的实验证据,并举例说明该理论如何与三个主题相关:数学、政治和语言。
什么和什么地方的途径
你的大脑有两个视觉系统。如果你沿着视神经从眼睛到新皮层,你会看到它通向两个平行的视觉系统,称为什么视觉通路和哪里视觉通路。什么通路是一组皮质区域,从大脑的最里面开始,向两侧移动。视觉路径是一组同样从大脑后部开始的区域,但向顶部移动。
五十多年前就发现了 “什么 “和 “哪里 “的视觉系统。多年后,科学家们意识到其他感官也存在类似的、平行的路径。视觉、触觉和听觉都有 “什么 “和 “哪里 “区域。
什么 “和 “哪里 “通路有互补的作用。例如,如果我们禁用 “哪里 “的视觉通路,那么一个人看着一个物体就能告诉你这个物体是什么,但他们却不能伸手去拿这个物体。例如,他们知道自己看到的是一个杯子,但奇怪的是,他们不能说杯子在哪里。如果我们把它转过来,禁用什么视觉通路,那么这个人就可以伸手去抓那个物体。他们知道它在哪里,但他们不能识别它是什么。(至少在视觉上不能。当他们的手接触到该物体时,他们可以通过触摸来识别该物体)。
什么 “和 “哪里 “区域的柱子看起来很相似。它们有类似的细胞类型、层和电路。那么,为什么它们会有不同的作用呢?在 “什么 “区域的柱子和在 “哪里 “区域的柱子之间有什么区别,导致它们的作用不同?你可能会想,这两种类型的柱子在功能上有一些的区别。也许where列有一些额外的神经元类型或不同的层间连接。你可能会承认 “什么 “柱和 “哪里 “柱看起来很相似,但认为可能存在一些物理上的差异,只是我们还没有发现。如果你采取这种立场,那么你就会拒绝蒙卡索的提议。
但没有必要放弃蒙卡索的前提。我们已经提出了一个简单的解释,即为什么有些列是什么列,有些是哪里列。在 “什么 “列中的皮层网格细胞将参考框架附加到物体上。在哪里列的皮层网格细胞将参考框架附加到你的身体上。
如果一个视觉柱能说话,它可能会说:“我已经创建了一个与身体相连的参考框架。使用这个参考框架,我看着一只手,知道它相对于身体的位置。然后我再看一个物体,知道它相对于身体的位置。有了这两个位置,都在身体的参照系中,我就可以计算如何将手移到物体上。我知道物体在哪里,也知道如何去抓它,但我不能确定它。我不知道那个物体是什么。”
如果一个什么视觉柱能说话,它可能会说:“我已经创建了一个连接到一个物体的参考框架。使用这个参考框架,我可以确定这个物体是一个咖啡杯。我知道这个物体是什么,但我不知道它在哪里”。一起工作,“什么 “和 “哪里 “这两栏让我们能够识别物体,伸手去抓它们,并操纵它们。
为什么一列(A列)将参考框架附加到外部物体上,而另一列(B列)将它们附加到身体上?这可能很简单,因为列的输入来自哪里。如果A列从一个物体获得感官输入,例如手指接触杯子的感觉,它将自动创建一个锚定在物体上的参考框架。如果B柱得到来自身体的输入,如检测四肢关节角度的神经元,它将自动创造一个锚定在身体上的参考框架。
在某些方面,你的身体只是世界上的另一个物体。新皮质使用相同的基本方法对你的身体进行建模,就像它对咖啡杯等物体进行建模一样。然而,与外部物体不同,你的身体总是存在的。新皮质的一个重要部分–所在区域–专门用于为你的身体和你身体周围的空间建模。
大脑包含身体地图的想法并不新鲜。四肢的运动需要以身体为中心的参考框架的想法也不是新的。我想说的是,外观和操作相似的皮层柱子,根据其参考框架的锚定,似乎可以执行不同的功能。鉴于这一概念,看到参考框架如何应用于概念并不是一个大的飞跃。
概念的参考框架
到目前为止,我在书中描述了大脑如何学习具有物理形状的事物的模型。订书机、手机、DNA分子、建筑物和你的身体都有物理存在。这些都是我们可以直接感觉到的东西,或者–就DNA分子而言–可以想象到的感觉。
然而,我们对世界的许多了解是无法直接感知的,也可能没有任何物理上的对应物。例如,我们无法伸手触摸民主或素数等概念,但我们却对这些东西了解甚多。皮质柱如何为我们无法感知的事物建立模型?
诀窍在于,参照系不一定要锚定在物理事物上。像民主这样的概念的参考框架需要自洽,但它可以相对独立于日常物理事物而存在。这类似于我们如何为虚构的土地创建地图。虚构土地的地图需要自洽,但它不需要位于相对于地球的任何特定位置。
第二个诀窍是,概念的参考框架不一定要有与咖啡杯等实物的参考框架相同的数量或类型。一个城市中建筑物的位置最好用二维来描述。咖啡杯的形状最好用三维来描述。但是我们从参考框架中得到的所有能力–比如确定两个地点之间的距离和计算如何从一个地点移动到另一个地点–也都存在于四维或更多维度的参考框架中。
如果你难以理解一个东西怎么会有三个以上的维度,可以考虑这个比喻。假设我想创建一个参考框架,我可以在其中组织关于我所认识的所有人的知识。我可能使用的一个维度是年龄。我可以按照这个维度将我的熟人按他们的年龄大小排列。另一个衡量标准可能是他们相对于我的居住地。这就需要另外两个维度。另一个维度可以是我见到他们的频率,或者他们有多高。我就有了五个维度。这只是一个类比;这些不会是新皮质使用的实际维度。但我希望你能看到,超过三个维度是多么有用。
新皮层中的柱子很可能对它们应该使用什么样的参考框架没有一个先入为主的概念。当一个柱子学习一个东西的模型时,学习的一部分是发现什么是好的参考框架,包括维度的数量。
现在,我将回顾支持我上面列出的四个前提的经验证据。这是一个没有很多实验证据的领域,但也有一些,而且在不断增加。
联想的方法
一个著名的记忆物品清单的技巧,被称为 “地点法”,有时也被称为 “记忆宫殿”,就是想象将你想记住的物品放在你房子的不同位置。为了回忆起物品清单,你想象着走过你的房子,这样就能一次次地唤起对每件物品的记忆。这个记忆技巧的成功告诉我们,当事物被分配到一个熟悉的参考框架中的位置时,,回忆起来就会更容易。在这种情况下,参考框架是你房子的心理地图。请注意,回忆的行为是通过移动实现的。你不是在身体上移动你的身体,而是在精神上移动你的房子。
链接的方法支持上述两个前提:信息存储在参考框架中,信息的检索是一种运动形式。该方法对于快速记忆一串物品,如一组随机的名词很有用。它之所以有效,是因为它将这些项目分配到先前学过的参考框架(你的房子),并使用先前学过的动作(你通常如何在你的房子里移动)。然而,大多数时候,当你学习时,你的大脑会创造新的参考框架。我们接下来会看到一个例子。
使用fMRI的人类研究
fMRI是一种观察活体大脑的技术,可以看到哪些部分是最活跃的。你可能已经看到了fMRI图像:它们显示了大脑的轮廓,其中一些部分被染成黄色和红色,表明在拍摄图像时哪里消耗的能量最多。fMRI通常与人类受试者一起使用,因为这个过程需要在一个嘈杂的大机器中完全静止地躺在一个狭窄的管道里,同时做一个特定的心理任务。通常情况下,受试者将看着电脑屏幕,同时听从研究人员的口头指示。
fMRI的发明对某些类型的研究来说是一个福音,但对于我们所做的那种研究来说,它通常不是太有用。我们对新皮层理论的研究依赖于知道在任何时间点上哪些单个神经元是活跃的,而活跃的神经元在一秒钟内会有几次变化。有一些实验技术可以提供这种数据,但fMRI不具备我们通常需要的空间和时间精度。fMRI测量许多神经元的平均活动,无法检测到持续时间少于约一秒钟的活动。
因此,当我们得知克里斯蒂安-多勒(Christian Doeller)、卡斯维尔-巴里(Caswell Barry)和尼尔-伯吉斯(Neil Burgess)进行的一项巧妙的fMRI实验显示,网格细胞存在于新皮层中,我们感到惊讶和欣喜。细节很复杂,但研究人员意识到,网格细胞可能表现出一种特征,可以用fMRI检测到。他们首先必须验证他们的技术是否有效,因此他们研究了已知存在网格细胞的内丘脑皮层。他们让人类受试者执行一项导航任务,即在电脑屏幕上的虚拟世界中移动,使用fMRI,他们能够检测到受试者在执行任务时存在网格细胞活动。然后他们将重点转向了新皮层。他们使用他们的fMRI技术,在受试者执行相同的导航任务时,观察新皮层的额叶区域。他们发现了同样的特征,强烈表明网格细胞至少也存在于新皮质的某些部分。
另一个科学家团队Alexandra Constantinescu、Jill O’Reilly和Timothy Behrens将这种新的fMRI技术用于一项不同的任务。他们向受试者展示了鸟类的图像。这些鸟因其脖子的长度和腿的长度而不同。受试者被要求执行与这些鸟有关的各种心理想象任务,例如想象一种新的鸟,结合以前看到的两种鸟的特征。实验不仅表明网格细胞存在于新皮层的前部区域,而且研究人员发现有证据表明新皮层将鸟类图像储存在一个类似地图的参考框架中–一个维度代表脖子长度,另一个维度代表腿部长度。研究小组进一步表明,当受试者思考鸟类时,他们在精神上 “移动 “鸟类地图,就像你在精神上移动你的房子的地图一样。同样,这个实验的细节很复杂,但fMRI数据表明,新皮层的这一部分使用网格细胞般的神经元来学习鸟类知识。参加这个实验的受试者并不知道有这种情况发生,但成像数据却很清楚。
位点法使用以前学过的地图,即你的房子的地图,来储存物品以便以后回忆。在鸟的例子中,新皮层创造了一个新的地图,这个地图适合于记忆不同脖子和腿的鸟的任务。在这两个例子中,将物品储存在参考框架中并通过 “运动 “来回忆的过程是一样的。
如果所有的知识都是这样储存的,那么我们通常所说的思考实际上是通过一个空间,通过一个参考框架来移动。你当前的思维,即任何时候在你头脑中的东西,是由参考框架中的当前位置决定的。随着位置的变化,储存在每个位置的项目被逐一召回。我们的思想在不断变化,但它们不是随机的。我们接下来想什么,取决于我们在精神上通过参考框架的哪个方向移动,就像我们在一个小镇上接下来看到什么,取决于我们从当前位置向哪个方向移动一样。
学习咖啡杯所需的参考框架也许很明显:它是咖啡杯周围的三维空间。在关于鸟类的fMRI实验中学习的参考框架也许不那么明显。但鸟类参考框架仍然与鸟类的物理属性有关,如腿和脖子。但是,对于经济学或生态学等概念,大脑应该使用什么样的参考框架呢?可能有多种参考框架是有效的,尽管有些框架可能比其他框架更好。
这是学习概念性知识可能很困难的一个原因。如果我给你十个与民主有关的历史事件,你应该如何安排它们?一位老师可能会把这些事件安排在一个时间轴上。时间线是一个一维的参考框架。它对于评估事件的时间顺序以及哪些事件可能因时间上的接近而产生因果关系是很有用的。另一位老师可能会把同样的历史事件按地域安排在世界地图上。地图参考框架提出了对同一事件的不同思考方式,例如哪些事件可能通过空间上的接近而产生因果关系,或者通过与海洋、沙漠或山脉的接近而产生因果关系。时间线和地理学都是组织历史事件的有效方式,然而,它们导致了对历史的不同思考方式。它们可能导致不同的结论和不同的预测。学习民主的最佳结构可能需要一个全新的地图,一个有多个抽象维度的地图,对应公平或权利。我并不是说 “公平 “或 “权利 “是大脑使用的实际维度。我的观点是,成为一个研究领域的专家需要发现一个好的框架来代表相关的数据和事实。可能没有一个正确的参考框架,而两个人可能会以不同的方式安排事实。发现一个有用的参考框架是学习中最困难的部分,尽管大多数时候我们并没有有意识地意识到这一点。我将用我前面提到的三个例子来说明这个想法:数学、政治和语言。
数学
假设你是一个数学家,你想证明OMG猜想(OMG不是一个真正的猜想)。猜想是一个被认为是真的数学陈述,但尚未被证明。为了证明一个猜想,你从已知为真的东西开始。然后你应用一系列的数学运算。如果通过这个过程,你得出了一个符合猜想的语句,那么你就成功地证明了它。通常情况下,会有一系列的中间结果。例如,从A开始,证明B;从B开始,证明C;最后,从C开始,证明OMG。假设,A、B、C和最后的OMG是方程。为了从方程到方程,你必须进行一次或多次数学运算。
现在我们假设,各种方程式在你的新皮质中以参考框架的形式表示出来。数学运算,如乘法或除法,是将你带到这个参考框架中不同位置的运动。进行一系列的操作会把你带到一个新的位置,一个新的方程。如果你,可以确定一组操作–通过方程空间的运动–使你从A到OMG,那么你就成功地证明了OMG。
解决复杂问题,如数学猜想,需要大量的训练。当学习一个新的领域时,你的大脑不仅仅是在储存事实。对于数学来说,大脑必须发现有用的参考框架来存储方程和数字,而且必须学习数学行为,如运算和变换,如何在参考框架内移动到新的位置。
对数学家来说,方程是熟悉的物体,类似于你和我看到智能手机或自行车的方式。当数学家看到一个新的方程时,他们认识到它与他们以前工作过的方程相似,这就立即暗示他们可以如何操作新的方程以达到某些结果。如果我们看到一个新的智能手机,这也是我们经历的过程。我们认识到该手机与我们使用过的其他手机相似,这表明我们可以如何操纵新手机以达到预期结果。
然而,如果你没有受过数学训练,那么方程和其他数学符号就会显得毫无意义的潦草。你甚至可以认出一个你以前见过的方程,但如果没有一个参考框架,你将不知道如何操作它来解决问题。你可以在数学空间里迷失,就像你在没有地图的情况下在森林里迷失一样。
数学家操纵方程,探险家穿越森林,手指触摸咖啡杯,都需要类似地图的参考框架来知道他们在哪里,需要做什么动作才能到达他们想要到达的地方。同样的基本算法支撑着这些以及我们进行的无数其他活动。
政治学
上面的数学例子是完全抽象的,但这个过程对任何不明显的物理问题都是一样的。例如,假设一个政治家想让一项新的法律得到颁布。他们已经写好了法律的初稿,但要达到颁布法律的最终目标还需要多个步骤。一路上都有政治障碍,所以政治家会思考他们可能采取的所有不同行动。一个专业的政治家知道,如果他们召开新闻发布会,或强迫举行公投,或写一份政策文件,或提出用另一个法案的支持来交换,可能会发生什么。一个熟练的政治家已经学会了一个政治的参考框架。参考框架的一部分是政治行为如何改变参考框架中的位置,政治家想象如果他们做这些事情会发生什么。他们的目标是找到一系列的行动,使他们达到预期的结果:颁布新的法律。
一个政治家和一个数学家并不知道他们在使用参照系来组织他们的知识,就像你和我并不知道我们使用参照系来理解智能手机和订书机一样。我们不会到处问:“谁能建议一个参考框架来组织这些事实?“我们说的是,“我需要帮助。我不明白如何解决这个问题”。或者 “我很困惑。你能告诉我如何使用这个东西吗?“或者 “我迷路了。你能告诉我怎么去食堂吗?“这些都是我们在无法为眼前的事实指定一个参考框架时提出的问题。
语言
语言可以说是人类区别于所有其他动物的最重要的认知能力。如果没有通过语言分享知识和经验的能力,大部分现代社会就不可能存在。
虽然有很多关于语言的著作,但我不知道有任何尝试来解释语言是如何由大脑中观察到的神经回路创造的。语言学家通常不会冒险进入神经科学领域,尽管一些神经科学家研究与语言有关的脑区,但他们一直无法,提出大脑如何创造和理解语言的详细理论。
关于语言是否与其他认知能力有根本性的不同,一直存在着争论。语言学家倾向于这样认为。他们将语言描述为一种独特的能力,与我们做的其他事情不同。如果这是真的,那么大脑中创造和理解语言的部分就应该看起来不同。在这里,神经科学是模棱两可的。
据说新皮层有两个大小适中的区域负责语言。韦尼克区被认为负责语言的理解,而布洛卡区被认为负责语言的产生。这有点简化了。首先,对这些区域的确切位置和范围存在分歧。其次,韦尼克区和布洛卡区的功能并没有被整齐地区分为理解和生产;它们有一些重叠。最后,这应该是显而易见的,语言不能被隔离在新皮质的两个小区域内。我们使用口头语言、书面语言和手语。韦尼克区和布洛卡区并不直接从传感器获得输入,所以语言的理解必须依靠听觉和视觉区域,而语言的产生必须依靠不同的运动能力。创造和理解语言需要新皮层的大面积区域。韦尼克区和布洛卡区起着关键作用,但认为它们是孤立地创造语言是错误的。
关于语言的一个令人惊讶的事情,也表明语言可能与其他认知功能不同,那就是布洛卡和韦尼克区只在大脑的左侧。右侧的相应区域只与语言有轻微的关系。新皮层所做的其他事情几乎都发生在大脑的两边。语言的独特不对称性表明,布洛卡和韦尼克区有一些不同的地方。
为什么语言只发生在大脑的左侧,可能有一个简单的解释。一种建议是,语言需要快速处理,而大多数新皮层中的神经元处理语言的速度太慢。众所周知,韦尼克区和布洛卡区的神经元有额外的绝缘层(称为髓鞘),使它们能够更快地运行并跟上语言的要求。与新皮层的其他部分还有其他明显的区别。例如,据报道,与大脑右侧的相应区域相比,语言区域的突触数量和密度更大。但有更多的突触并不意味着语言区执行不同的功能;它可能只是意味着这些区域学到了更多的东西。
虽然有一些差异,但韦尼克区和布洛卡区的解剖结构再次与新皮质的其他区域相似。我们今天所掌握的事实表明,虽然这些语言区有些不同,也许是在细微的方面,但其整体结构的层次、连接性和细胞类型与新皮层的其他部分相似。因此,语言的大部分机制可能与认知和感知的其他部分共享。这应该是我们的工作假设,直到证明是相反的。因此,我们可以问,皮质柱的建模能力,包括参考框架,如何能够为语言提供一个基质?
根据语言学家的说法,语言的决定性属性之一是其嵌套结构。例如,句子由短语组成,短语由单词组成,而单词则由字母组成。递归,即重复应用规则的能力,是另一个决定性属性。递归允许以几乎无限的复杂性来构建句子。例如,简单的句子 “汤姆要求更多的茶 “可以扩展为 “在汽车店工作的汤姆要求更多的茶”,这可以扩展为 “在汽车店工作的汤姆,也就是旧货店旁边的那个,要求更多的茶”。递归的确切定义,因为它与语言有关,是有争议的,但一般的想法不难理解。句子可以由短语组成,而短语又可以由其他短语组成,以此类推。长期以来,人们认为嵌套结构和递归是语言的关键属性。
然而,嵌套和递归结构并非语言所独有。事实上,世界上的一切都以这种方式组成。以我的咖啡杯为例,它的侧面印有Numenta的标志。这个杯子有一个嵌套结构:它由一个圆柱体、一个把手和一个标志组成。标志由一个图形和一个词组成。图形是由圆和线组成的,而 “Numenta “这个词是由音节组成的,而这些音节本身是由字母组成的。对象也可以有递归结构。例如,想象一下,Numenta的标志包括一张咖啡杯的图片,上面印有Numenta标志的图片,而Numenta标志又有一张咖啡杯的图片,等等。
在我们研究的早期,我们意识到每个皮质柱必须能够学习嵌套和递归结构。这是学习咖啡杯等物理事物的结构以及学习数学和语言等概念性事物的结构所必需的约束条件。我们提出的任何理论都必须解释柱子如何做到这一点。
想象一下,在过去的某个时候,你知道了咖啡杯是什么样子,在过去的某个时候,你知道了Numenta的标志是什么样子。但是你从来没有在咖啡杯上看到过这个标志。现在我给你看一个新的咖啡杯,它的标志在侧面。你可以迅速了解这个新的组合对象,通常只需看一两眼。注意,你不需要重新学习商标或杯子。我们所知道的关于杯子和标志的一切都立即包含在新对象的一部分。
这种情况是如何发生的?在一个皮质柱中,以前学习的咖啡杯是由一个参考框架定义的。之前学习的标识也是由一个参考框架定义的。为了学习带有标识的咖啡杯,该柱子创建了一个新的参考框架,其中存储了两样东西:一个是与之前学习的咖啡杯的参考框架的链接,一个是与之前学习的标识的参考框架的链接。大脑可以迅速做到这一点,只需增加几个突触。这有点像在文本文件中使用超链接。想象一下,我写了一篇关于亚伯拉罕-林肯的短文,我提到他发表了一个著名的演讲,叫做《盖茨堡演说》。通过把 “葛底斯堡演说 “这几个字变成指向演说全文的链接,我就可以把演说的所有细节作为文章的一部分,而不必重新输入。
前面我说过,皮质柱在参考框架的位置上存储特征。“特征 “这个词有点含糊。现在我将更加精确。皮质柱为它们所知道的每个物体创建参考框架。参考框架然后被填充到与其他参考框架的链接中。大脑使用参考框架对世界进行建模,这些参考框架被填充到参考框架中;一路下来都是参考框架。在我们2019年的 “框架 “论文中,我们提出了神经元如何做到这一点。
要完全理解新皮层的一切工作,我们还有很长的路要走。但据我们所知,每根柱子都用参考框架为物体建模的想法与语言的需要是一致的。也许在更远的地方,我们会发现对一些特殊的语言电路的需求。但就目前而言,情况并非如此。
专业知识
到目前为止,我已经介绍了参考框架的四种用途,一种在旧脑中,三种在新皮质中。旧脑中的参考框架学习环境的地图。新皮层 “什么 “栏中的参考框架学习物理对象的地图。新皮质的 “哪里 “列中的参考框架学习我们身体周围空间的地图。最后,新皮层非感觉列中的参考框架学习概念地图。
要成为任何领域的专家,都需要有一个好的参考框架,一个好的地图。两个人观察同一个物理对象,最终可能会得到类似的地图。例如,很难想象两个观察同一张椅子的人的大脑会如何安排其不同的特征。但在思考概念时,两个人从相同的事实出发,最终可能会以不同的参考框架。回顾一下历史事实清单的例子。一个人可能会把这些事实安排在时间轴上,而另一个人可能会把它们安排在地图上。同样的事实可以导致不同的模型和不同的世界观。
成为专家主要是为了找到一个好的参考框架来安排事实和观察。阿尔伯特-爱因斯坦开始时与他同时代的人有着同样的事实。然而,他找到了一个更好的方法来安排它们,一个更好的参考框架,这使他能够看到类比,并做出令人惊讶的预测。爱因斯坦与狭义相对论有关的发现最吸引人的地方是,他用来做这些发现的参照系是日常物品。他想到了火车、人和手电筒。他从科学家的经验观察开始,比如绝对光速,并使用日常参考框架推导出狭义相对论的方程。正因为如此,几乎任何人都可以遵循他的逻辑,理解他是如何做出发现的。相比之下,爱因斯坦的广义相对论需要基于数学概念的参考框架,这些概念被称为场方程,不容易与日常物体相联系。爱因斯坦发现这一点更难理解,就像几乎所有其他人一样。
1978年,当弗农-蒙卡索提出所有的感知和认知都有一个共同的算法时,很难想象什么算法能够足够强大和普遍,以满足这一要求。很难想象一个单一的过程能够解释我们认为的一切智能,从基本的感官感知到最高和最令人钦佩的智力形式。现在我很清楚,常见的皮质算法是基于参考框架的。参考框架为学习世界的结构、事物的位置以及它们如何移动和变化提供了基底。参考框架不仅可以为我们可以直接感知的物理对象做到这一点,还可以为我们看不到或感觉不到的对象,甚至为没有物理形式的概念做到这一点。
你的大脑有15万个皮质柱。每个柱子都是一台学习机。每根柱子通过观察其输入如何随时间变化来学习一个预测模型。柱子不知道它们在学习什么;它们不知道它们的模型代表什么。整个企业和由此产生的模型都建立在参考框架上。理解大脑如何工作的正确参考框架是参考框架。
第七章
智力的 “千脑 “理论
从一开始,Numenta的目标就是为新皮层的工作方式开发一个广泛的理论。神经科学家们每年发表数以千计的论文,涵盖了大脑的每一个细节,但缺乏将这些细节联系在一起的系统性理论。我们决定首先专注于了解一个单一的皮质柱。我们知道皮层柱在物理上很复杂,因此必须做一些复杂的事情。如果我们不知道单根柱子的作用,就问为什么柱子会以我在第二章 中展示的混乱的、有点层次的方式相互连接,这没有意义。这就好比在不了解人的情况下问社会如何运作。
现在我们对皮质柱的作用有了很多了解。我们知道,每个柱子都是一个感觉-运动系统。我们知道,每个柱子可以学习数百个物体的模型,而且这些模型是基于参考框架的。一旦我们理解了柱子所做的这些事情,就会发现新皮层作为一个整体,其工作方式与以前的想法不同。我们把这个新观点称为 “千脑智力理论”。在我解释什么是 “千脑理论 “之前,了解它所取代的东西会有帮助。
新皮层的现有观点
今天,对新皮层最常见的思考方式就像一张流程图。来自感官的信息在从新皮层的一个区域到下一个区域的过程中被一步步处理。科学家将此称为特征检测器的层次结构。它最常在视觉方面被描述,其过程是这样的。视网膜上的每个细胞都能检测到图像中一小部分的光线存在。然后,视网膜上的细胞投射到新皮质。新皮层中接受这一输入的第一个区域被称为V1区。V1区的每个神经元只从视网膜的一小部分获得输入。这就像他们通过一根吸管看世界一样。
这些事实表明,V1区的柱子不能识别完整的物体。因此,V1的作用仅限于检测小的视觉特征,如图像中局部的线条或边缘。然后V1神经元将这些特征传递给新皮层的其他区域。下一个视觉区域,称为V2,将V1区域的简单特征组合成更复杂的特征,如角或弧。这个过程在另外几个区域重复几次,直到神经元对完整的物体作出反应。据推测,类似的过程–从简单特征到复杂特征再到完整物体–也发生在触觉和听觉上。这种将新皮层视为特征检测器的层次结构的观点,五十年来一直是主流的理论。
这一理论的最大问题是它把视觉当作一个静态的过程,就像拍照一样。但视觉不是这样的。我们的眼睛每秒钟大约做三次快速的囊状运动。从眼睛到大脑的输入随着每次囊状运动而完全改变。当我们向前走或左右转头时,视觉输入也会改变。特征层次理论忽略了这些变化。它把视觉当作目标是每次取一张图片并给它贴上标签。但即使是随意的观察也会告诉你,视觉是一个互动的过程,依赖于运动。例如,为了了解一个新物体的样子,我们把它拿在手里,这样旋转,那样旋转,看它从不同的角度看起来是什么样子。只有通过移动,我们才能学到物体的模型。
许多人忽视了视觉的动态方面,原因之一是我们有时可以在不移动眼睛的情况下识别一个图像,比如在显示屏上短暂闪现的图片–但这是一个例外,而不是规则。正常的视觉是一个积极的感觉-运动过程,而不是一个静态过程。
运动的基本作用在触觉和听觉方面更为明显。如果有人把一个物体放在你张开的手上,除非你移动你的手指,否则你无法识别它。同样地,听觉也总是动态的。不仅听觉对象,如口语,是由随时间变化的声音定义的,而且当我们听的时候,我们会移动我们的头来主动修改我们听到的东西。目前还不清楚特征层次理论如何适用于触摸或听觉。对于视觉,你至少可以想象大脑正在处理一个类似图片的图像,但对于触觉和听觉,却没有相应的东西。
还有许多其他观察结果表明,特征层次理论需要修改。这里有几个,都与视觉有关。
- 第一和第二视觉区域,即V1和V2,是人类新皮质中最大的一些区域。它们的面积比其他视觉区域大得多,据说在这些区域可以识别完整的物体。为什么检测数量有限的小特征会比识别完整物体(其中有很多)需要更大的大脑部分呢?在一些哺乳动物中,如小鼠,这种不平衡现象更加严重。小鼠的V1区域占据了整个小鼠新皮层的很大一部分。相比之下,小鼠的其他视觉区域,很小。就好像几乎所有的小鼠视觉都发生在V1区域。
- 当研究人员将图像投射在麻醉动物的眼前,同时记录V1中神经元的活动时,发现了V1中的特征检测神经元。他们发现神经元对简单的特征,如边缘,在图像的一小部分变得活跃。由于神经元只对小范围内的简单特征有反应,他们认为完整的物体必须在其他地方被识别。这导致了分层特征模型的出现。但在这些实验中,V1中的大多数神经元并没有对任何明显的东西作出反应–它们可能时不时地发出一个尖峰,或者它们可能连续尖峰一段时间然后停止。大多数神经元无法用特征层次理论来解释,所以它们大多被忽略了。然而,V1中所有无法解释的神经元一定在做一些重要的事情,而不是特征检测。
- 当眼睛从一个固定点到另一个固定点时,V1和V2区域的一些神经元会做一些了不起的事情。它们似乎知道在眼睛停止移动之前它们将看到什么。这些神经元变得活跃,仿佛它们能看到新的输入,但输入还没有到来。发现这一现象的科学家们感到很惊讶。这意味着V1和V2区域的神经元能够获得关于正在看到的整个物体的知识,而不仅仅是其中的一小部分。
- 视网膜中心的光感受器比周边的多。如果我们把眼睛看作是一台相机,那么它就是一台有严重鱼眼的镜头。视网膜上还有一些部分没有光感受器,例如,视神经离开眼睛的盲点和血管穿过视网膜的地方。因此,输入到新皮层的信息不像是照片。它是一个高度扭曲和不完整的图像斑块的被子。然而,我们并没有意识到,我们对世界的感知是统一和完整的。特征层次理论无法解释这种情况如何发生。这个问题被称为结合问题或传感器融合问题。更笼统地说,结合问题问的是,来自不同感官的输入,即散落在新皮层的各种扭曲,是如何结合成我们所经历的单一的不扭曲的感知的。
- 正如我在第1章中 指出的,尽管新皮层区域之间的一些连接看起来是有层次的,就像一个循序渐进的流程图,但大多数并不是这样。例如,在低层次的视觉区域和低层次的触摸区域之间存在着联系。这些连接在特征的层次理论中是没有意义的。
- 尽管特征层次理论可能解释了新皮层如何识别图像,但它没有深入说明我们如何学习物体的三维结构,物体如何由其他物体组成,以及物体如何随时间变化和行为。它不能解释我们如何想象一个物体在旋转或扭曲的情况下会是什么样子。
在所有这些不一致和缺点的情况下,你可能想知道为什么特征层次理论仍然被广泛持有。有几个原因。首先,它适合大量的数据,尤其是很久以前收集的数据。第二,该理论的问题随着时间的推移慢慢积累,使得每一个新问题都很容易被认为是小问题。第三,它是我们拥有的最好的理论,在没有东西可以取代它的情况下,我们坚持使用它。最后,正如我马上要论证的那样,它并不是完全错误的–它只是需要一个重大的升级。
新视角下的新皮层
我们关于皮质柱中的参考框架的建议提出了一种关于新皮层如何工作的不同思维方式。它说:,所有的皮质柱,甚至是低层次的感觉区域,都能够学习和识别完整的物体。一个只感觉到物体的一小部分的柱子可以通过随着时间的推移整合其输入来学习整个物体的模型,就像你和我通过访问一个又一个地点来学习一个新的城镇一样。因此,严格来说,学习物体的模型并不需要皮层区域的层次结构。我们的理论解释了一只老鼠,它的视觉系统大多只有一个层次,却能看到并识别世界上的物体。
新皮层有许多关于任何特定物体的模型。这些模型在不同的栏目中。它们不是相同的,而是互补的。例如,从指尖获得触觉输入的一列可以学习一个手机的模型,包括它的形状、表面的纹理,以及按下按钮时如何移动。从视网膜获得视觉输入的柱子可以学习一个手机的模型,其中也包括它的形状,但是,与指尖柱子不同,它的模型可以包括手机不同部分的颜色,以及屏幕上的视觉图标在你使用时如何变化。视觉柱不能学习电源开关的凹陷,触觉柱不能学习显示屏上的图标如何变化。
任何单独的皮质柱都不可能学会世界上每个物体的模型。这将是不可能的。首先,一个单独的柱子能够学习多少个物体是有物理限制的。我们还不知道这个能力是什么,但我们的模拟表明,一个单独的柱子可以学习数百个复杂的对象。这比你知道的东西的数量要少得多。另外,一个柱子所学习的东西受到其输入的限制。例如,一个触觉柱不能学习云的模型,一个视觉柱不能学习旋律。
即使在一个单一的感觉模式中,如视觉,列得到不同类型的输入,将学习不同类型的模型。例如,有一些视觉柱得到颜色的输入,而另一些则得到黑白的输入。在另一个例子中,V1区和V2区的列都从视网膜获得输入。V1区的柱子从视网膜的一个非常小的区域获得输入,,就像它通过一个狭窄的吸管看世界一样。在V2区的柱子从视网膜的一个更大的区域获得输入,就像它在通过一根更宽的吸管看世界一样,但图像更模糊了。现在想象一下,你在看最小字体的文字,你可以阅读。我们的理论表明,只有V1区的柱子能够识别最小字体的字母和文字。V2所看到的图像太模糊了。当我们增加字体大小时,那么V2和V1都能识别文字。如果字体再变大,那么V1就更难识别文字了,但V2仍然能够做到这一点。因此,列在区域内的V1和V2可能都学习了物体的模型,如字母和单词,但模型因比例不同而不同。
大脑中的知识储存在哪里?
大脑中的知识是分布的。我们知道的任何东西都不会储存在一个地方,如一个细胞或一列。也没有什么东西是到处储存的,就像全息图一样。关于某些东西的知识分布在成千上万的柱子里,但这些只是所有柱子的一小部分。
再考虑一下我们的咖啡杯。关于咖啡杯的知识在大脑中储存在哪里?在视觉区域有许多皮质柱,它们接受来自视网膜的输入。每一个看到杯子一部分的柱子都会学习一个杯子的模型,并试图去识别它。同样,如果你把杯子抓在手里,那么新皮层的触觉区域中的几十到几百个模型就会活跃起来。并不存在一个单一的咖啡杯模型。你对咖啡杯的了解存在于数以千计的模型中,存在于数以千计的列中–但是,仍然只存在于新皮质所有列中的一小部分。这就是为什么我们称之为 “千脑理论”:任何特定项目的知识都分布在成千上万个互补的模型中。
这里有一个比喻。假设我们有一个拥有十万市民的城市。这座城市有一套管道、泵、水箱和过滤器,向每家每户输送清洁的水。水系统,需要维护以保持良好的工作状态。关于如何维护水系统的知识在哪里?只有一个人知道是不明智的,让每个公民都知道也是不现实的。解决办法是将知识分配给许多人,但不要太多。在这种情况下,假设水利部门有50名员工。继续这个比喻,假设水系统有一百个部分,也就是一百个泵、阀门、水箱等,水务部门的五十个工人中,每个人都知道如何维护和修理不同的、但重叠的二十个部分。
好吧,那么,水系统的知识储存在哪里?一百个零件中的每一个都被大约十个不同的人所了解。如果有一天一半的工人请病假,很可能仍有五个左右的人可以修理任何特定的零件。每个员工都可以在没有监督的情况下,自行维护和修理20%的系统。关于如何维护和修理水系统的知识分布在少数民众中,而这些知识对于大量流失的员工来说是很强大的。
请注意,水务部门可能有一些控制层次,但阻止任何自主权或将任何知识分配给一个或两个人是不明智的。当知识和行动分布在许多,但不是太多,元素之间时,复杂的系统工作得最好。
大脑中的一切都以这种方式工作。例如,一个神经元从不依赖单一的突触。相反,它可能使用30个突触来识别一个图案。即使其中10个突触失效,神经元仍会识别该图案。一个神经元网络从不依赖单个细胞。在我们创建的模拟网络中,即使失去30%的神经元,通常也只会对网络的性能产生微弱的影响。同样,新皮层也不依赖于单一的皮质柱。即使中风或外伤抹去了数千根柱子,大脑也会继续运作。
因此,我们不应该对大脑不依赖任何东西的一个模型感到惊讶。我们对某一事物的知识分布在成千上万的皮质柱中。这些柱子不是多余的,它们也不是彼此的完全复制。最重要的是,每根柱子都是一个完整的感觉-运动系统,就像每个水利部门的工作人员都能独立修复水利基础设施的某些部分。
捆绑问题的解决方案
如果我们有成千上万的模型,为什么我们会有一个单一的感知?当我们拿着并看着一个咖啡杯时,为什么这个杯子的感觉是一个东西,而不是成千上万的东西?如果我们把杯子放在桌子上,它发出声音,这个声音是如何与咖啡杯的形象和感觉结合起来的?换句话说,我们的感官输入是如何被束缚在一个单一的感知中的?科学家们长期以来一直认为,新皮层的各种输入必须汇聚到大脑中的一个地方,在那里可以感知到咖啡杯这样的东西。这一假设是特征层次理论的一部分。然而,新皮层中的连接并不像这样。这些连接不是汇聚到一个地方,而是向各个方向延伸。这是绑定问题被认为是一个谜的原因之一,但我们已经提出了一个答案:柱子投票。你的感知是各柱子通过投票达成的共识。
让我们回到纸质地图的比喻上。回顾一下,你有一套不同城镇的地图。这些地图被剪成小方块并混在一起。你被丢在一个未知的地方,看到一家咖啡店。如果你在多个地图方格上发现了长相相似的咖啡店,那么你就无法知道你在哪里。如果咖啡店存在于四个不同的城镇,那么你知道你一定是在四个城镇中的一个,但你无法知道是哪一个。
现在让我们假设还有四个和你一样的人。他们也有城镇的地图,他们和你一样被丢在同一个,但在不同的随机地点。和你一样,他们不知道自己在哪个城镇,也不知道自己在哪里。他们摘下眼罩,四处查看。一个人看到了一个图书馆,在看了他的地图方格后,发现图书馆在六个不同的城镇。另一个人看到了一个玫瑰园,并在三个不同的城镇找到了玫瑰园。另外两个人也是如此。没有人知道他们在哪个城镇,但他们都有一个可能的城镇清单。现在每个人都投票。你们五个人的手机上都有一个应用程序,列出了你们可能所在的城镇和地点。每个人都能看到其他人的名单。只有9号镇在每个人的名单上;因此,现在每个人都知道他们在9号镇。 通过比较你们的可能城镇名单,并只保留每个人名单上的城镇,你们都立即知道自己在哪里。我们把这个过程称为投票。
在这个例子中,这五个人就像五个指尖在触摸一个物体的不同位置。个别情况下,他们不能确定他们触摸的是什么物体,但他们一起可以。如果你只用一根手指触摸东西,那么你必须移动它来识别这个物体。但是如果你用整只手抓住物体,那么你通常可以一下子认出这个物体。几乎在所有情况下,使用五个手指比使用一个手指所需的动作要少。同样,如果你通过吸管看一个物体,你必须移动吸管来识别这个物体。但如果你用整个眼睛看它,通常不用移动就能认出它。
继续打比方,想象一下,在镇上下车的五个人中,有一个人只能听到。这个人的地图方块上标有他们在每个地方应该听到的声音。当他们听到喷泉、树上的鸟儿或小酒馆的音乐时,他们会找到可能听到这些声音的地图方格。同样地,假设有两个人只能触摸东西。他们的地图上标有他们期望在不同地点感受到的触觉。最后,两个人只能看。他们的地图方块上标有他们在每个地点预期能看到的东西。现在我们有五个人有三种不同类型的传感器:视觉、触摸和声音。所有五个人都能感觉到一些东西,,但他们不能确定自己在哪里,所以他们投票。投票机制的工作原理与我之前描述的相同。他们只需要就城镇达成一致,其他细节都不重要。投票在不同的感官模式下都能发挥作用。
注意,你需要对其他人知之甚少。你不需要知道他们有什么感觉,或者他们有多少张地图。你不需要知道他们的地图比你的地图有更多或更少的方块,或者这些方块代表更大或更小的区域。你不需要知道他们如何移动。也许有些人可以在方格上跳跃,有些人只能斜向移动。这些细节都不重要。唯一的要求是,每个人都能分享他们可能的城镇名单。皮质柱之间的投票解决了绑定问题。它允许大脑将众多类型的感觉输入统一到对所感觉到的东西的单一表述中。
投票还有一个转折点。当你把一个物体抓在手里时,我们相信代表你手指的触觉柱共享另一个信息–它们彼此之间的相对位置,这使得我们更容易弄清楚它们所接触的东西。想象一下,我们的五位探险家被扔到了一个未知的小镇。他们有可能,甚至有可能看到许多城镇都有的五样东西,比如两家咖啡店、一个图书馆、一个公园和一个喷泉。投票将排除任何不具备所有这些特征的可能的城镇,但探险家们仍然不能确定他们在哪里,因为有几个城镇都有这五种特征。然而,如果五个探险者知道他们彼此之间的相对位置,那么他们就可以排除任何没有这五个特征的城镇,而这些特征是以特定的排列方式存在的。我们怀疑关于相对位置的信息也在一些皮质柱之间共享。
投票是如何在大脑中完成的?
回顾一下,皮质柱中的大多数连接都是在各层之间上下移动的,基本上都是在柱的范围内。这条规则有几个著名的例外。某些层的细胞在新皮层内发出长距离的轴突。它们可能将轴突从大脑的一侧发送到另一侧,例如,在代表左手和右手的区域之间。或者它们可能将轴突从主要视觉区域V1发送到主要听觉区域A1。我们提出,这些具有长距离连接的细胞是投票。
只有某些单元格的投票才有意义。一列中的大多数细胞并不代表列可以投票的那种信息。例如,一列的感觉输入与其他列的感觉输入不同,因此接受这些输入的细胞不会投射到其他列。但代表什么物体被感觉到的细胞可以投票,并会广泛投射。
纵队如何投票的基本想法并不复杂。利用它的长程连接,一个柱子广播它认为它正在观察的东西。通常情况下,一个柱子是不确定的,在这种情况下,它的神经元会同时发送多种可能性。同时,该列接收来自其他列的投影,代表他们的猜测。最常见的猜测会压制最不常见的猜测,直到整个网络确定一个答案。令人惊讶的是,一列不需要向其他每一列发送其投票。即使长距离轴突连接到一个小的、随机选择的其他列的子集,投票机制也能很好地工作。投票也需要一个学习阶段。在我们发表的论文中,我们描述了软件模拟,显示了学习如何发生,以及投票如何快速可靠地发生。
感知的稳定性
专栏投票解决了大脑的另一个谜题。为什么我们对世界的感知似乎是稳定的,而对大脑的输入是变化的?当我们的眼睛进行囊状运动时,对新皮层的输入随着每次眼睛的运动而改变,因此活跃的神经元也必须改变。然而,我们的视觉感知是稳定的;世界似乎并没有随着我们眼睛的移动而跳动。大多数时候,,我们完全没有意识到我们的眼睛正在移动。类似的感知稳定性发生在触觉上。想象一下,一个咖啡杯在你的桌子上,你正用手抓着它。你感知到了这个杯子。现在你无意识地用你的手指在杯子上划过。当你这样做时,对新皮层的输入发生了变化,但你的知觉是杯子是稳定的。你不认为杯子在变化或移动。
那么,为什么我们的感知是稳定的,为什么我们对来自皮肤和眼睛的不断变化的输入毫无察觉?识别一个物体意味着各柱子经过投票,现在就它们所感知的物体达成一致。每一列的投票神经元形成一个稳定的模式,代表物体以及它与你的相对位置。投票神经元的活动不会随着你的眼睛和手指的移动而改变,只要它们感知的是同一个物体。每一列中的其他神经元会随着运动而改变,但代表物体的投票神经元却不会。
如果你能往下看新皮层,你会看到一层细胞的稳定活动模式。这种稳定性将跨越大片区域,覆盖数千列。这些是投票神经元。其他层的细胞的活动将在每一列的基础上迅速变化。我们所感知到的是基于稳定的投票神经元。来自这些神经元的信息被广泛传播到大脑的其他区域,在那里它可以被转化为语言或储存在短期记忆中。我们不会有意识地意识到每一列内的活动变化,因为它停留在这一列内,大脑的其他部分无法访问。
为了阻止癫痫发作,医生有时会切断新皮质左右两侧的连接。手术后,这些病人的行为就像他们有两个大脑一样。实验清楚地表明,两边的大脑有不同的想法,得出不同的结论。专栏投票可以解释原因。左右新皮层之间的连接是用来投票的。当它们被切断时,双方不再有办法进行投票,所以他们得出独立的结论。
在任何时候活跃的投票神经元的数量都很少。如果你是一名科学家,观察负责投票的神经元,你可能会看到98%的细胞处于沉默状态,2%的细胞持续发射。皮质柱中其他细胞的活动会随着输入的变化而变化。你很容易将注意力集中在变化的神经元上,而忽略了投票神经元的重要性。
大脑想要达成共识。你可能已经看到了上面的图像,它可以表现为一个花瓶或两张脸。在这样的例子中,柱子无法确定哪个是正确的物体。这就好比他们有两个不同城镇的地图,但这些地图,至少在某些方面,是相同的。“花瓶镇 “和 “面孔镇 “是相似的。投票层想达成一个共识–它不允许两个对象同时活动,所以它选择了一种可能性而不是另一种。你可以感知到面孔或花瓶,但不能同时感知两者。
注意
我们的感官被部分阻挡是很常见的,例如当你看着站在车门后面的人。虽然我们只看到半个人,但我们并没有被愚弄。我们知道,一个完整的人正站在门后。看到这个人的柱子进行了投票,它们确信这个物体是一个人。投票的神经元投射到输入被遮挡的柱子上,现在,每个柱子都知道有一个人。即使是被挡住的柱子也能预测如果门不在那里他们会看到什么。
一会儿,我们可以把注意力转移到车门上。就像花瓶和人脸的双稳态图像一样,对输入有两种解释。我们可以在 “人 “和 “门 “之间来回转移我们的注意力。每一次转移,投票神经元都会停留在一个不同的物体上。我们有一种感觉,即两个物体都在那里,尽管我们一次只能注意一个。
大脑可以关注一个视觉场景中较小或较大的部分。例如,我可以关注整个车门,也可以只关注车门把手。大脑究竟是如何做到这一点的还不太清楚,但它涉及到大脑的一个部分,即丘脑,它与新皮质的所有区域紧密相连。
注意力在大脑如何学习模型方面起着至关重要的作用。当你进行一天的工作时,你的大脑迅速地、不断地关注着不同的事物。例如,当你阅读时,你的注意力会从一个字到另一个字。或者,看着一栋大楼,你的注意力可以从大楼到窗户,到门,到门闩,再回到门上,等等。我们认为发生的情况是,每次你关注一个不同的物体时,你的大脑都会确定该物体相对于先前关注的物体的位置。这是自动的。它是注意力过程的一部分。例如,我进入一个饭厅。我可能首先注意到其中的一把椅子,然后是桌子。我的大脑识别出一把椅子,然后再识别出一张桌子。然而,我的大脑也在计算椅子与桌子的相对位置。当我环顾餐厅时,我的大脑不仅识别房间里的所有物体,而且同时确定每个物体相对于其他物体和房间本身的位置。仅仅通过扫视,我的大脑就建立了一个房间的模型,其中包括我所关注的所有物体。
通常情况下,你学到的模式是暂时的。假设你在饭厅里坐下来吃一顿家庭餐。你环顾餐桌,看到各种菜肴。然后我让你闭上眼睛,告诉我土豆在哪里。你几乎肯定能够做到这一点,这就证明你在看桌子的短暂时间内学会了桌子的模型,并且其内容。几分钟后,在食物传完后,我请你闭上眼睛,再次指向土豆。现在你将指向一个新的位置,即你最后看到土豆的地方。这个例子的重点是,我们在不断地学习我们感觉到的一切事物的模型。如果我们的模型中的特征排列保持固定,如咖啡杯上的标志,那么这个模型可能会被记住很长时间。如果排列方式改变了,就像桌子上的菜,那么模型就是暂时的。
新皮层从未停止学习模型。每一次注意力的转移–无论你是在看餐桌上的碗碟,还是在街上行走,或者注意到咖啡杯上的商标–都是在为某个事物的模型添加另一个项目。如果这些模型是短暂的或持久的,它的学习过程是一样的。
千脑理论中的层次结构
几十年来,大多数神经科学家都坚持特征层次理论,而且理由充分。这个理论尽管有很多问题,但却适合很多数据。我们的理论提出了一种关于新皮质的不同思维方式。千脑理论说,严格来说,新皮层区域的层次结构并非必要。即使是单一的皮质区域也能识别物体,小鼠的视觉系统就证明了这一点。那么,到底是哪一种呢?新皮层是作为一个层次结构组织起来的,还是作为成千上万个模型投票达成的共识?
新皮层的解剖结构表明,这两种类型的连接都存在。我们如何才能理解这一点呢?我们的理论提出了一种不同的思考连接的方式,它与分层和单列模型都兼容。我们提出,完整的对象,而不是特征,是在层次结构之间传递的。与其说新皮层利用层次结构将特征组合成一个公认的对象,不如说新皮层利用层次结构将对象组合成更复杂的对象。
我在前面讨论了分层构成。回顾一下咖啡杯的例子,它的侧面印有一个标志。我们学习一个这样的新对象时,首先要注意杯子,然后再注意标志。这个标志也是由物体组成的,比如一个图形和一个词,但是我们不需要记住标志的特征相对于杯子的位置。我们只需要学习标志的参考框架与杯子的参考框架的相对位置。标志的所有细节特征都隐含在其中。
这就是整个世界的学习方式:作为一个相对于其他物体的复杂层次结构的物体。新皮层究竟是如何做到这一点的,目前还不清楚。例如,我们怀疑在每一列中都有一定量的分层学习,但肯定不是全部的。有些将由区域之间的层次连接来处理。有多少是在单列内学习的,有多少是在区域间的连接中学习的,我们还不了解。我们正在努力解决这个问题。答案几乎肯定需要对注意力有更好的理解,这就是我们研究丘脑的原因。
在本章早些时候,我列出了通常认为新皮层是一个特征检测器的层次结构这一观点的问题。让我们再看一遍这个清单,这次讨论一下 “千脑理论 “是如何解决每个问题的,首先是运动的基本作用。
- 千脑理论本质上是一种感觉-运动理论。它解释了我们如何通过移动来学习和识别物体。重要的是,它还解释了为什么我们有时可以在不移动的情况下识别物体,例如当我们在屏幕上看到一个简短的图像或用所有的手指抓住一个物体。因此,千脑理论是分层模型的超集。
- 灵长类动物的V1和V2区域相对较大,而小鼠的V1区域面积奇大,这在千脑理论中是合理的,因为每根柱子都能,识别完整的物体。与今天许多神经科学家的观点相反,千脑理论认为,我们认为的视觉大部分发生在V1和V2区域。与触摸有关的初级和二级区域也相对较大。
- 千脑理论可以解释神经元如何在眼睛还在运动时就知道下一个输入是什么的奥秘。在该理论中,每个柱子都有完整物体的模型,因此知道在物体的每个位置应该感应到什么。如果一个柱子知道其输入的当前位置以及眼睛是如何移动的,那么它就可以预测新的位置以及它在那里将感应到什么。这就像看一张城镇地图,并预测如果你开始向一个特定的方向走,你会看到什么一样。
- 绑定问题是基于这样的假设:新皮质对世界上的每个物体都有一个单一的模型。千脑理论将此翻转过来,说每个物体都有成千上万的模型。大脑的各种输入并没有被束缚或合并成一个单一的模型。这些柱子有不同类型的输入,或者一个柱子代表视网膜的一小部分,下一个柱子代表更大的部分,这都不重要。视网膜上是否有孔并不重要,就像你的手指之间是否有缝隙一样重要。投射到V1区的图案可以被扭曲和混淆,但这并不重要,因为新皮层的任何部分都不会试图重新组装这种混乱的表征。千脑理论的投票机制解释了为什么我们有一个单一的、不扭曲的知觉。它还解释了在一种感觉模式中识别一个物体如何导致在其他感觉模式中的预测。
- 最后,“千脑理论 “显示了新皮层如何利用参考框架学习物体的三维模型。作为另一个小证据,请看以下图片。它是一堆印在平面上的直线。没有消失点,没有收敛的线条,也没有递减的对比度来暗示深度。然而,你在看这幅图时,不能不把它看作是一组三维的楼梯。你所观察的图像是二维的,这并不重要;你的新皮质中的模型是三维的,这就是你所感知到的。
大脑是复杂的。地方细胞和网格细胞如何创建参考框架、学习环境模型和计划行为的细节比我描述的还要复杂,而且只有部分了解。我们提出,新皮层使用类似的机制,这些机制同样复杂,甚至更少被理解。这是一个实验性神经科学家和像我们这样的理论家都在积极研究的领域。
如果要进一步探讨这些和其他话题,我将不得不介绍更多的神经解剖学和神经生理学的细节,这些细节既难以描述,也不是理解 “千脑理论 “的基本要素。因此,我们已经到了一个边界–一个本书探讨的内容结束,科学论文需要涉及的内容开始的边界。
在本书的介绍中,我说大脑就像一个拼图。我们有数以万计的关于大脑的事实,每一个都像一块拼图。但如果没有一个理论框架,我们就不知道拼图的解决方案是什么样子。没有理论框架,我们能做的就是在这里和那里把一些碎片连接起来。千脑理论是一个框架;它就像完成了拼图的边界,知道了整个画面是什么样子。在我写这篇文章时,我们已经填好了拼图内部的一些部分,而其他许多部分还没有完成。虽然还有很多东西没有完成,但我们的任务现在更简单了,因为知道了适当的框架,就更清楚哪些部分还没有填上。
我不想给你留下一个错误的印象,即我们了解新皮层的一切。我们还远远没有做到这一点。我们对大脑的总体情况,特别是对新皮层不了解的事情很多。然而,我不相信会有另一个整体的理论框架,一个不同的方式来安排拼图的边界碎片。理论框架会随着时间的推移而被修改和完善,我预计千脑理论也会如此,但我在这里提出的核心思想,我相信大部分会保持原样。
在我们离开这一章和本书的第一部分之前,我想告诉你们关于我遇到弗农-蒙卡索的其他故事。记得我在约翰-霍普金斯大学做了一次演讲,结束时我会见了蒙卡斯尔和他的系主任。我离开的时间已经到了;我还要赶飞机。我们说了再见,一辆车在外面等着我。当我走进办公室的门时,蒙卡索拦住了我,把手放在我的肩膀上,用一种给你一些建议的口气说:“你应该停止谈论等级制度。它其实并不存在。”
我被惊呆了。蒙卡斯尔是世界上最重要的新皮层专家,而他却告诉我,新皮层最大和最有据可查的特征之一并不存在。我的惊讶就像弗朗西斯-克里克本人对我说:“哦,那个DNA分子,它并不真正编码你的基因。“我不知道该如何回应,所以我什么也没说。当我坐在去机场的车上时,我试图理解他的临别赠言。
今天,我对新皮质中的等级制度的理解已经发生了巨大的变化–它比我曾经认为的等级制度要少得多。弗农-蒙卡斯尔当时知道这些吗?他是否有理论依据说层次结构并不真正存在?他是否想到了我所不知道的实验结果?他在2015年去世了,我永远无法问他。他去世后,我主动重读了他的许多书和论文。他的思考和写作总是很有见地。他在1998年出版的《*感知神经科学》(Perceptual Neuroscience)。大脑皮层》*是一本体态优美的书,仍然是我最喜欢的关于大脑的书之一。当我回想起那一天,为了有机会和他进一步交谈,我冒险错过了航班是明智的。更重要的是,我希望现在能与他交谈。我相信他一定会喜欢我刚才向你描述的理论。
现在,我想把我们的注意力转向 “千脑理论 “将如何影响我们的未来。
第二部分
机器智能
历史学家托马斯-库恩在其著名的《科学革命的结构》一书中认为,大多数科学进步是基于广泛接受的理论框架,他称之为科学范式。偶尔,一个既定的范式被推翻,被一个新的范式所取代–库恩称之为科学革命。
今天,神经科学的许多子领域都有既定的范式,如大脑是如何进化的,与大脑有关的疾病,以及网格细胞和位置细胞。在这些领域工作的科学家们共享术语和实验技术,他们在想要回答的问题上达成一致。但对于新皮层和智力,并没有普遍接受的范式。对于新皮层的作用,甚至我们应该试图回答什么问题,都没有什么共识。库恩会说,对智力和新皮质的研究处于前范式状态。
在本书的第一部分,我介绍了关于新皮质如何工作以及智能意味着什么的新理论。你可以说我提出了一个研究新皮层的范式。我相信这个理论在很大程度上是正确的,但重要的是,它是,也是可检验的。正在进行的和未来的实验将告诉我们这个理论的哪些部分是正确的,哪些部分需要修改。
在这本书的第二部分,我将描述我们的新理论将如何影响人工智能的未来。人工智能研究有一个既定的范式,即被称为人工神经网络的一套通用技术。人工智能科学家有共同的术语和目标,这使得该领域近年来取得了稳步进展。
千脑智能理论表明,机器智能的未来将与大多数人工智能从业者今天的想法有很大不同。我相信,人工智能已经准备好进行一场科学革命,而我之前描述的智能原理将成为这场革命的基础。
我在写这篇文章时有些犹豫,这是因为我在职业生涯早期有一段经历,当时我谈到了计算机的未来。它并不顺利。
在我创办Palm Computing后不久,我被邀请到英特尔公司做演讲。每年一次,英特尔将其几百名最资深的员工带到硅谷,参加为期三天的规划会议。作为这些会议的一部分,他们邀请一些外部人士向整个集团发表演讲,1992年,我是这些演讲者之一。我认为这是一种荣誉。英特尔公司当时正引领着个人电脑革命,是世界上最受尊敬和最强大的公司之一。我的公司,Palm,是一个小型的初创公司,还没有交付其第一个产品。我的演讲是关于个人计算的未来。
我提出,个人计算的未来将由小到可以装在口袋里的计算机所主导。这些设备的价格将在500到1000美元之间,靠电池运行一整天。对于世界上数十亿人来说,口袋大小的电脑将是他们拥有的唯一电脑。对我来说,这种转变是不可避免的。数十亿人想要使用电脑,但笔记本电脑和台式机太贵,而且太难使用。我看到了一种不可阻挡的,那就是对袖珍型电脑的拉动,它们更容易使用,而且价格更低。
当时,有数以亿计的台式和笔记本个人电脑。英特尔为其中的大多数出售CPU。普通的CPU芯片价格约为400美元,而且耗电量太大,无法用于电池供电的手持式电脑。我向英特尔公司的经理们建议,如果他们想继续保持他们在个人电脑领域的领导地位,他们应该把重点放在三个方面:降低功耗,使他们的芯片更小,以及想办法在售价不到一千美元的产品中赚取利润。我谈话的语气不卑不亢,没有强硬。这就像,“哦,顺便说一下,我相信这将会发生,你可能要考虑以下影响”。
在我讲完之后,我接受了听众的提问。每个人都坐在自己的午餐桌前,直到我讲完,食物才会上桌,所以我没有想到会有很多问题。我只记得一个。一个人站起来,用似乎有点嘲笑的语气问道:“人们要用这些手持式电脑做什么?“要回答这个问题是很困难的。
当时,个人电脑主要用于文字处理、电子表格和数据库。这些应用都不适合用在屏幕小、没有键盘的掌上电脑上。逻辑告诉我,掌上电脑主要用于访问信息,而不是创造信息,这就是我给出的答案。我说,访问你的日历和地址簿将是第一批应用,但我知道它们并不足以改变个人计算。我说我们会发现新的应用,这些应用将更加重要。
回顾一下,在1992年初,没有数字音乐,没有数字摄影,没有Wi-Fi,没有蓝牙,也没有手机上的数据。第一个消费者网络浏览器还没有发明出来。我不知道这些技术会被发明出来,因此我,无法想象基于这些技术的应用。但我知道,人们总是想要更多的信息,而且,我们会想办法把这些信息传递给移动电脑。
演讲结束后,我和英特尔的传奇创始人戈登-摩尔博士坐在一张桌子上。那是一个大约有十个人的圆桌。我问摩尔博士对我的演讲有何看法。大家都沉默着听他回答。他避免给我一个直接的答案,然后在晚餐的其余时间里避免与我交谈。很快就可以看出,他和餐桌上的其他人都不相信我所说的话。
我被这一经历震撼了。如果我不能让计算机领域最聪明和最成功的人考虑我的建议,那么也许我错了,或者说,向手持式计算机的过渡会比我想象的要难得多。我决定,对我来说,最好的前进道路是专注于制造手持式计算机,而不是担心其他人的看法。从那天开始,我避免发表关于计算机未来的 “远见卓识 “的演讲,而是尽可能地去实现这个未来。
今天,我发现自己处于一个类似的情况。从这本书开始,我将描述一个与大多数人,实际上是大多数专家所期待的不同的未来。首先,我描述了人工智能的未来,与大多数人工智能的领导者目前的想法背道而驰,然后,在第三部分,我以一种你可能从未考虑过的方式描述人类的未来。当然,我可能是错的;预测未来是众所周知的困难。但对我来说,我即将提出的想法似乎是不可避免的,更像是逻辑推理而不是猜测。然而,正如我多年前在英特尔公司的经历一样,我可能无法说服所有人。我将尽我所能,并请你保持开放的心态。
在接下来的四章中,我谈到了人工智能的未来。人工智能目前正在经历一场复兴。它是技术领域中最热门的领域之一。每天似乎都会有新的应用,新的投资,以及改进的性能。人工智能领域由人工神经网络主导,尽管它们与我们在大脑中看到的神经元网络完全不同。我将论证,人工智能的未来将基于与今天不同的原则,即更接近于模仿大脑的原则。为了建造真正的智能机器,我们必须设计它们来遵守我在本书第一部分中阐述的原则。
我不知道人工智能的未来应用会是什么。但就像个人计算向手持设备的转变一样,我认为人工智能向基于大脑的原则转变是不可避免的。
第八章
为什么人工智能中没有 “我”?
自1956年成立以来,人工智能领域已经经历了几个热情高涨的周期,随后是悲观情绪。人工智能科学家称这些为 “人工智能之夏 “和 “人工智能之冬”。每一次浪潮都是基于一项新技术,承诺让我们走上创造智能机器的道路,但最终这些创新都没有成功。目前,人工智能正在经历另一波热情,另一个人工智能之夏,而且,业界的期望值再次很高。推动当前热潮的一组技术是人工神经网络,通常被称为深度学习。这些方法在标记图片、识别口语和驾驶汽车等任务上取得了令人印象深刻的结果。2011年,一台计算机在游戏节目*《危情十日》*中击败了排名靠前的人类,2016年,另一台计算机在围棋游戏中击败了世界排名靠前的选手。这最后两项成就成为全世界的头条新闻。这些成就令人印象深刻,但这些机器中是否有真正的智能?
大多数人,包括大多数人工智能研究人员,都不这么认为。今天的人工智能在许多方面都与人类智能有差距。例如,人类不断学习。正如我前面所描述的,我们在不断修正我们的模型,这个世界。相比之下,深度学习网络在部署前必须经过充分训练。而一旦它们被部署,它们就不能随心所欲地学习新东西。例如,如果我们想教视觉神经网络识别一个额外的物体,那么该网络必须从头开始重新训练,这可能需要几天时间。然而,今天的人工智能系统不被认为是智能的最大原因是它们只能做一件事,而人类可以做很多事。换句话说,人工智能系统是不灵活的。任何人类个体,比如你或我,都可以学会下围棋、种地、写软件、开飞机和演奏音乐。我们在一生中学习了数千种技能,虽然我们可能不是这些技能中最好的,但我们可以灵活地学习什么。深度学习人工智能系统几乎没有表现出任何灵活性。一台下围棋的电脑可能比任何人类都下得好,但它不能做其他事情。一辆自动驾驶汽车可能比任何人类更安全,但它不能下围棋或修理爆胎。
人工智能研究的长期目标是创造出表现出类似人类智能的机器–能够快速学习新任务,看到不同任务之间的类比,并灵活地解决新问题。这个目标被称为 “人工通用智能”,或AGI,以区别于今天的有限人工智能。今天的人工智能行业面临的基本问题是。我们目前是在创造真正的智能AGI机器的道路上,还是会再次陷入困境,进入另一个人工智能冬天?目前的人工智能浪潮已经吸引了成千上万的研究人员和数十亿美元的投资。几乎所有这些人和美元都被应用于改善深度学习技术。这种投资是否会带来人类水平的机器智能,或者深度学习技术从根本上受到限制,导致我们再次重新发明人工智能领域?当你处于泡沫之中时,很容易被热情所笼罩,并相信它将永远持续下去。历史表明,我们应该谨慎行事。
我不知道当前的人工智能浪潮将持续多久。但我确实知道,深度学习并没有让我们走上创造真正智能机器的。我们不可能通过做更多我们目前正在做的事情来达到人工通用智能。我们必须采取不同的方法。
通往AGI的两条路径
人工智能研究人员在制造智能机器方面有两条路可走。一条道路,也就是我们今天所遵循的道路,主要是让计算机在特定的任务上胜过人类,例如下围棋或检测医学图像中的癌细胞。我们的希望是,如果我们能让计算机在一些困难的任务上胜过人类,那么最终我们将发现如何让计算机在每项任务上都胜过人类。采用这种人工智能方法,系统如何工作并不重要,计算机是否灵活也不重要。唯一重要的是,人工智能计算机比其他人工智能计算机更好地完成一项特定任务,并最终比最好的人类更好地完成任务。例如,如果最好的围棋计算机在世界排名第六,它不会成为头条新闻,甚至可能被视为失败。但击败世界排名第一的人类则被视为一个重大进步。
创造智能机器的第二条道路是专注于灵活性。采用这种方法,不一定要让人工智能比人类表现得更好。我们的目标是创造出能做很多事情的机器,并将他们从一项任务中学到的东西应用于另一项任务。沿着这条道路的成功可能是一台具有五岁儿童甚至是狗的能力的机器。希望的是,如果我们能够首先了解如何建立灵活的人工智能系统,那么,在这个基础上,我们最终可以制造出与人类相等或超越人类的系统。
在早期的一些人工智能浪潮中,这第二条道路受到了青睐。然而,事实证明这太难了。科学家们意识到,要像一个五岁的孩子一样有能力,需要拥有大量的日常知识。孩子们知道关于这个世界的成千上万的事情。他们知道液体如何溢出,球如何滚动,,狗如何吠叫。他们知道如何使用铅笔、记号笔、纸张和胶水。他们知道如何打开书本,知道纸会被撕开。他们知道数以千计的单词,以及如何使用它们来让其他人做事情。人工智能研究人员无法弄清楚如何将这些日常知识编入计算机,或者如何让计算机学习这些东西。
知识的困难部分不是陈述一个事实,而是以一种有用的方式表示这个事实。例如,以 “球是圆的 “这一说法为例。一个五岁的孩子知道这意味着什么。我们可以很容易地把这句话输入电脑,但电脑怎么能理解它呢?“球 “和 “圆 “这两个词有多种含义。球可以是一种舞蹈,它不是圆的,而比萨饼是圆的,但不像球。为了让计算机理解 “球”,它必须将这个词与不同的含义联系起来,而每个含义与其他词都有不同的关系。物体也有动作。例如,有些球会弹跳,但脚球的弹跳方式与棒球不同,而棒球的弹跳方式与网球不同。你和我通过观察很快就知道了这些区别。没有人需要告诉我们球是如何反弹的;我们只是把球扔到地上,看看会发生什么。我们并不知道这些知识是如何储存在我们的大脑中的。学习日常知识,如球是如何反弹的,毫不费力。
人工智能科学家们无法弄清如何在计算机中做到这一点。他们发明了被称为模式和框架的软件结构来组织知识,但无论他们怎么尝试,最后都会得到一个无法使用的混乱局面。世界是复杂的;一个孩子知道的东西的数量和这些东西之间的联系的数量似乎不可能很大。我知道这听起来应该很容易,但没有人能够弄清楚计算机如何能够知道像球是什么这样简单的东西。
这个问题被称为知识表示。一些人工智能科学家认为,知识表示不仅是人工智能的一个大问题,而且是唯一的问题。他们声称,在我们解决了如何在计算机中表示日常知识之前,我们不可能制造出真正的智能机器。
今天的深度学习网络并不拥有知识。下围棋的计算机不知道围棋是一种游戏。它不知道这个游戏的历史。它不知道自己的对手是电脑还是人类,也不知道 “电脑 “和 “人类 “是什么意思。同样地,一个给图像贴标签的深度学习网络可能会看一张图片,然后说这是一只猫。但计算机对猫的了解有限。它不知道猫是动物,也不知道它们有尾巴、腿和肺。它不知道猫人和狗人的区别,也不知道猫会打呼噜和掉毛。深度学习网络所做的只是确定一个新的图像与之前看到的被标记为 “猫 “的图像相似。深度学习网络中没有关于猫的知识。
最近,人工智能科学家尝试了一种不同的知识编码方法。他们创建了大型人工神经网络,并在大量文本上对其进行训练:数以万计的书籍中的每一个字,所有的维基百科,以及几乎整个互联网。他们将文本逐一送入神经网络。通过这种方式的训练,网络学会了某些词跟随其他词的可能性。这些语言网络可以做一些令人惊讶的事情。例如,如果你给网络几个词,它可以写一个与这些词有关的短段落。很难说这段话是由人类还是神经网络写的。
对于这些语言网络是否拥有真正的知识,或者只是通过记住数百万个单词的统计数据来模仿人类,人工智能科学家们意见不一。我不相信任何一种深度学习网络会实现AGI的目标,如果该网络不能像大脑那样对世界进行建模。深度学习网络运作良好,但不是因为它们解决了知识表示问题。它们工作得好是因为它们完全避免了这个问题,而是依靠统计和大量的数据。深度学习网络的工作方式是聪明的,它们的表现令人印象深刻,而且它们具有商业价值。我只是指出,他们并不拥有知识,因此,在拥有五岁儿童能力的道路上并不顺利。
大脑作为人工智能的模型
从我对研究大脑感兴趣的那一刻起,我就觉得我们必须在创造智能机器之前了解它的工作原理。这在我看来是显而易见的,因为大脑是我们所知的唯一具有智能的东西。在接下来的几十年里,我的观点没有任何改变。这就是我顽强地追求大脑理论的原因之一:我觉得这是创造真正的智能人工智能的必要第一步。我经历了多次人工智能的热情浪潮,每次我都抵制跳上船。我很清楚,所使用的技术与大脑根本不一样,因此人工智能会被卡住。弄清楚大脑是如何工作的很难,但这是创造智能机器的必要的第一步。
在本书的前半部分,我描述了我们在理解大脑方面取得的进展。我描述了新皮层如何使用地图般的参考框架来学习世界的模型。就像纸质地图代表关于一个地理区域(如城镇或国家)的知识一样,大脑中的地图代表关于我们互动的物体(如自行车和智能手机)的知识,关于我们身体的知识(如我们的四肢在哪里,如何移动),以及关于抽象概念的知识(如数学)。
千脑理论解决了知识表述的问题。这里有一个比喻来帮助你理解。比方说,我想表示关于一个普通物体的知识,一个订书机。早期的人工智能研究者会试图通过列出订书机不同部分的名称,然后描述每个部分的作用来实现这一目的。他们可能会写一个关于订书机的规则,说:“当订书机的顶部被压下时,一个钉子会从一端出来。“但要理解这句话,必须对 “顶部”、“末端 “和 “订书机 “等词进行定义,也必须对 “压下 “和 “出来 “等不同动作的意义进行定义。而这个规则本身是不够的。它没有说当订书机出来时,,接下来会发生什么,或者如果订书机被卡住,你应该怎么做。因此,研究人员会编写额外的规则。这种表现知识的方法导致了一个永无止境的定义和规则清单。人工智能研究人员不知道如何让它发挥作用。批评者认为,即使所有的规则都能被指定,计算机仍然不会 “知道 “订书机是什么。
大脑采取了一种完全不同的方法来存储关于订书机的知识:它学习了一个模型。该模型是知识的体现。想象一下,你的脑子里有一个小小的订书机。它和真正的订书机一模一样–有同样的形状,同样的部件,以同样的方式移动–它只是更小。这个小模型代表了你所知道的关于订书机的一切,而不需要在任何部件上贴标签。如果你想回忆一下,当订书机的顶部被压下时会发生什么,你就按下微型模型,看看会发生什么。
当然,你的脑子里没有一个小小的物理订书机。但新皮层中的细胞学习了一个虚拟模型,起到了同样的作用。当你与一个真正的订书机互动时,大脑会学习它的虚拟模型,其中包括你观察到的关于真正订书机的一切,从它的形状到你使用它时的行为方式。你关于订书机的知识被嵌入模型中。你的大脑中并没有存储一个订书机事实和订书机规则的清单。
假设我问你,当订书机的顶部被推倒时会发生什么。为了回答这个问题,你并没有找到适当的规则并把它回放给我。相反,你的大脑想象着把订书机往下压,模型就会回忆起所发生的事情。你可以用语言来向我描述,但知识并没有储存在语言或规则中。知识就是模型。
我相信人工智能的未来将基于大脑原理。真正的智能机器,AGI,将像新皮层一样使用地图般的参考框架来学习世界的模型。我认为这是不可避免的。我不相信有其他方法来创造真正的智能机器。
从专用型到通用型人工智能解决方案
我们今天所处的情况让我想起了计算机的早期阶段。计算机 “这个词最初指的是那些工作是进行数学计算的人。为了创建数字表格或解码加密信息,几十台人类计算机会用手进行必要的计算。最早的电子计算机被设计用来取代人类计算机完成一项特定的任务。例如,信息解密的最佳自动化解决方案是一台只解密信息的机器。像艾伦-图灵这样的计算机先驱认为,我们应该建造 “通用 “计算机:可以通过编程完成任何任务的电子机器。然而,在当时,没有人知道建造这样一台计算机的最佳方法。
有一个过渡时期,计算机以许多不同的形式被制造出来。有为特定任务设计的计算机。有模拟计算机,也有只能通过改变线路来重新使用的计算机。也有使用十进制而不是二进制数字工作的计算机。今天,几乎所有的计算机都是图灵所设想的那种通用形式。我们甚至把它们称为 “通用图灵机”。只要有合适的软件,今天的计算机几乎可以应用于任何任务。市场力量决定了通用的通用计算机是发展的方向。尽管事实上,即使在今天,任何特定的任务都可以通过使用定制的解决方案,如一个特殊的芯片,以更快的速度或更少的功率来完成。产品设计师和工程师通常更喜欢通用计算机的低成本和便利性,尽管专用机器可以更快、更省电。
人工智能也会发生类似的转变。今天,我们正在建立专门的人工智能系统,无论它们被设计成什么任务,都是最好的。但在未来,大多数智能机器将是通用的:更像人类,能够学习几乎任何东西。
今天的计算机有许多形状和大小,从烤面包机中的微型计算机到用于天气模拟的房间大小的计算机。尽管它们在尺寸和速度上存在差异,但所有这些计算机的工作原理与图灵和其他人多年前制定的相同。它们都是通用图灵机的实例。同样地,未来的智能机器将有许多形状和大小,但几乎所有的机器都将根据一套共同的原则工作。大多数人工智能将是通用学习机,类似于大脑。(数学家已经证明,有一些问题是无法解决的,即使是在原则上。因此,准确地说,不存在真正的 “通用 “解决方案。但这是一个高度理论化的想法,为了本书的目的,我们不需要考虑它)。
一些人工智能研究人员认为,今天的人工神经网络已经具有普遍性。一个神经网络可以被训练成下围棋或驾驶汽车。然而,同一个神经网络不可能同时做到这两件事。神经网络还必须以其他方式进行调整和修改,才能让它们完成任务。当我使用 “通用 “或 “通用 “这些术语时,我想象的是像我们自己一样的东西:一台可以学习做很多事情的机器,而不需要抹掉记忆重新开始。
有两个原因,人工智能将从我们今天看到的专用解决方案过渡到更多的通用解决方案,这将主导未来。第一个是通用计算机战胜专用计算机的相同原因。通用计算机最终更具成本效益,这导致了技术的更快进步。随着越来越多的人使用相同的设计,更多的努力被用于加强最受欢迎的设计和支持它们的生态系统,导致成本和性能的快速改善。这是计算能力指数级增长的基本驱动力,它在二十世纪后半叶塑造了工业和社会。人工智能将过渡到通用解决方案的第二个原因是,机器智能的一些最重要的未来应用,需要通用解决方案的灵活性。这些应用将需要处理未曾预料到的问题,并设计出新颖的解决方案,而今天的专用深度学习机器无法做到这一点。
考虑两种类型的机器人。第一个机器人在工厂里给汽车喷漆。我们希望汽车喷漆机器人能够快速、准确、不变。我们不希望它们每天都尝试新的喷涂技术,也不希望它们质疑为什么要给汽车上漆。当涉及到在装配线上为汽车喷漆时,单一用途、没有智能的机器人就是我们所需要的。现在说我们想派一队机器人建筑工人去火星,为人类建造一个宜居的栖息地。这些机器人需要使用各种工具,在非结构化的环境中组装建筑物。他们会遇到不可预见的问题,并需要协作即兴修复和修改设计。人类可以处理这些类型的问题,但今天没有任何机器能接近做这些事。火星建筑机器人将需要拥有通用的智能。
你可能会认为,对通用智能机器的需求将是有限的,大多数人工智能应用将通过像我们今天这样的专用、单一用途的技术来解决。人们对通用计算机也有同样的想法。他们认为,对通用计算机的商业需求只限于少数高价值的应用。事实证明情况恰恰相反。由于成本和尺寸的大幅降低,通用计算机成为上个世纪最大和最有经济价值的技术之一。我相信,通用人工智能将同样在21世纪后半叶主导机器智能。在20世纪40年代末和50年代初,当商业计算机首次出现时,我们不可能想象它们在1990年或2000年将会有什么应用。今天,我们的想象力也受到了类似的挑战。没有人能够知道智能机器在五十年或六十年后会被如何使用。
什么时候是智能的东西?
我们应该在什么时候认为一台机器是智能的?是否有一套我们可以使用的标准?这就好比问,一台机器何时是通用计算机?要想成为一台通用计算机,也就是一台通用图灵机,一台机器需要某些组件,如内存、CPU和软件。你无法从外部检测到这些成分。例如,我无法判断我的烤面包机里面是有一个通用计算机还是一个定制芯片。我的烤面包机的功能越多,它就越有可能包含一个通用计算机,但唯一确定的方法是通过观察内部,看看它是如何工作的。
同样地,为了符合智能的要求,一台机器需要使用一套原则来运作。你无法通过从外部观察来检测一个系统是否使用这些原则。例如,如果我看到一辆汽车在高速公路上行驶,我无法判断它是由一个在驾驶过程中不断学习和适应的智能人驾驶的,还是由一个简单的控制器驾驶的,它只是将汽车保持在两条线之间。汽车表现出的行为越复杂,就越有可能是一个智能代理在控制,但唯一确定的方法是通过观察内部来判断。
那么,是否有一套机器必须具备的标准才能被视为智能?我想是的。我对什么是智能的建议是基于大脑的。以下列表中的四个属性都是我们知道的大脑所做的事情,我相信智能机器也必须这样做。我将描述每个属性是什么,为什么它很重要,以及大脑如何实现它。当然,智能机器实现这些属性的方式可能与大脑不同。例如,智能机器不一定是由活细胞构成的。
不是每个人都会同意我对属性的选择。人们可以提出一个很好的论据,说我遗漏了一些重要的东西。那也没关系。我认为我的清单是AGI的最低限度,或者说基线。今天很少有人工智能系统具备这些属性。
1.持续学习
*它是什么?*在我们整个生命中的每一个清醒时刻,我们都在学习。我们对某件事的记忆时间长短不一。有些事情很快就会被忘记,比如桌子上碗碟的摆放,或者我们昨天穿了什么衣服。其他事情则会伴随我们的一生。学习不是一个独立于感觉和行动的过程。我们不断地学习。
*为什么它很重要?*世界是不断变化的;因此,我们的世界模型必须不断学习以反映不断变化的世界。今天,大多数人工智能系统并没有持续学习。他们经历了一个漫长的训练过程,当它完成后,他们被部署。这就是它们不灵活的原因之一。灵活性要求不断调整以适应不断变化的条件和新的知识。
*大脑是如何做到的?*大脑如何持续学习的最重要组成部分是神经元。当一个神经元学习一个新的模式时,它在一个树突分支上形成新的突触。新的突触并不影响其他分支上先前学到的突触。因此,学习新的东西不会迫使神经元忘记或修改它先前学到的东西。今天的人工智能系统中使用的人工神经元不具备这种能力。这是它们不能持续学习的一个原因。
2.通过运动学习
*它是什么?*我们通过移动来学习。当我们每天工作时,我们移动我们的身体、四肢和眼睛。这些动作对我们的学习方式是不可或缺的。
*为什么它很重要?*智力需要学习世界的模型。我们不可能同时感知世界上的一切;因此,学习需要运动。如果不从一个房间到另一个房间,你就无法学习一个房子的模型,如果不与之互动,你就无法学习智能手机上的一个新应用程序。移动不一定是物理性的。,通过运动学习的原则也适用于数学等概念和互联网等虚拟空间。
*大脑是如何做到的?*新皮质的处理单位是皮质柱。每个柱子都是一个完整的感觉-运动系统-也就是说,它获得输入,并能产生行为。每一次运动,柱子都会预测它的下一次输入会是什么。预测是一个柱子测试和更新其模型的方式。
3.许多模型
*它是什么?*新皮质由数以万计的皮质柱组成,每根柱子都在学习物体的模型。关于任何特定事物的知识,如咖啡杯,都分布在许多互补的模型中。
*为什么它很重要?*新皮层的多模型设计提供了灵活性。通过采用这种架构,人工智能设计师可以轻松地创造出集成多种类型传感器的机器–如视觉和触摸,甚至是雷达等新型传感器。而且他们可以创造出具有不同体现形式的机器。像新皮质一样,智能机器的 “大脑 “将由许多几乎相同的元素组成,然后可以连接到各种可移动的传感器。
*大脑是如何做到的?*使多模型设计发挥作用的关键是投票。每个柱子都在一定程度上独立运作,但新皮层中的长距离连接允许柱子对它们正在感知的物体进行投票。
4.使用参考框架来存储知识
*它是什么?*在大脑中,知识被储存在参考框架中。参考框架也被用来进行预测、制定计划和进行运动。当大脑每次激活参考框架中的一个位置并检索相关的知识时,就会发生思考。
*为什么它很重要?*为了实现智能化,机器需要学习一个世界的模型。这个模型必须包括物体的形状,当我们与它们互动时,它们如何变化,以及它们彼此之间的相对位置。需要参考框架来表示这类信息;它们是知识的骨干。
*大脑是如何做到这一点的?*每个皮质柱都建立了自己的参考框架。我们已经提出,皮层柱使用相当于网格细胞和位置细胞的细胞来建立参考框架。
参考框架的例子
大多数人工神经网络没有相当于参考框架的东西。例如,一个典型的识别图像的神经网络只是给每个图像分配一个标签。没有参考框架,该网络就无法学习物体的三维结构或它们如何移动和变化。像这样的系统的一个问题是,我们不能问它为什么给某物贴上猫的标签。这个人工智能系统不知道什么是猫。除了这张图片与其他被标记为 “猫 “的图片相似之外,没有其他信息可言。
某些形式的人工智能确实有参考框架,尽管它们的实现方式是有局限性的。例如,一台下棋的计算机有一个参考框架:棋盘。棋盘上的位置用国际象棋的特定术语来表示,如 “国王的车4 “或 “皇后7”。下棋的计算机使用这个参考框架来表示每个棋子的位置,以表示合法的棋步,并计划运动。棋盘参考框架本身是二维的,只有六十四个位置。这对国际象棋来说很好,但对学习订书机的结构或猫的行为却毫无用处。
自动驾驶汽车通常有多个参考框架。一个是GPS,这个基于卫星的系统可以在地球上任何地方定位汽车。使用GPS参考框架,汽车可以了解道路、十字路口和建筑物的位置。GPS是一个比国际象棋棋盘更通用的参考框架,但它是固定在地球上的,因此不能代表相对于地球运动的事物的结构或形状,如风筝或自行车。
机器人设计师习惯于使用参考框架。他们用它们来跟踪机器人在世界上的位置,并计划它应该如何从一个地方移动到另一个地方。大多数机器人学家并不关心AGI,而大多数人工智能研究人员则没有意识到参考框架的重要性。今天,人工智能和机器人学在很大程度上是独立的研究领域,尽管这一界限开始变得模糊。一旦人工智能研究人员了解运动和参考框架对创造AGI的重要作用,人工智能和机器人学之间的分离将完全消失。
一位了解参考框架重要性的人工智能科学家是杰弗里-辛顿。今天的神经网络依靠的是辛顿在20世纪80年代提出的想法。最近,他对该领域提出了批评,因为深度学习网络缺乏任何位置感,因此,他认为,它们无法学习世界的结构。实质上,这与我的批评相同,即人工智能需要参考框架。辛顿为这个问题提出了一个解决方案,他称之为 “胶囊”。胶囊有望大幅改善神经网络,但到目前为止,它们还没有在人工智能的主流应用中流行起来。胶囊是否成功,或者未来的人工智能是否像我所提议的那样依赖于网格细胞的机制,还有待观察。无论怎样,智能都需要参考框架。
最后,让我们考虑一下动物。所有的哺乳动物都有一个新皮质,因此根据我的定义,它们都是聪明的、通用的学习者。每个新皮层,无论大小,都有由皮层网格细胞定义的通用参考框架。
小鼠的新皮层很小。因此,与具有较大新皮质的动物相比,它所能学习的能力是有限的。但我想说的是,老鼠是有智慧的,就像我的烤面包机里的电脑是一台通用图灵机一样。烤面包机的计算机是图灵的思想的一个小而完整的实现。同样地,老鼠的大脑也是本章所描述的学习属性的一个小而完整的实现。
动物世界的智力并不限于哺乳动物。例如,鸟类和章鱼学习并表现出复杂的行为。几乎可以肯定的是,这些动物的大脑中也有参考框架,尽管它们是否有类似网格细胞和位置细胞的东西或不同的机制还有待发现。
这些例子表明,几乎每一个表现出计划和复杂的、以目标为导向的行为的系统–无论是下棋的计算机、自动驾驶汽车,还是人类–都有参考框架。参考框架的类型决定了系统可以学习什么。为某一特定任务(如下棋)设计的参考框架在其他领域是没有用的。通用智能需要通用的参考框架,可以应用于许多类型的问题。
值得再次强调的是,智能不能通过机器执行单一任务,甚至几个任务的好坏来衡量。相反,智能是由机器如何学习和储存关于世界的知识决定的。我们之所以聪明,不是因为我们能把一件事做得特别好,而是因为我们能学会做几乎任何事情。人类智能的极端灵活性需要我在本章中描述的属性:持续学习,通过运动学习,学习许多模型,以及使用通用参考框架来存储知识和产生目标导向行为。在未来,我相信几乎所有形式的机器智能都将具备这些属性,尽管我们今天离这个目标还很远。
有一群人会认为,我忽略了与智力有关的最重要的话题:意识。我将在下一章讨论这个问题。
第九章
当机器有了意识
我最近参加了一个题为 “在智能机器的时代做人 “的小组讨论。晚上,耶鲁大学的一位哲学教授说,如果机器有了意识,那么我们可能在道德上有义务不关闭它。言下之意是,如果一个东西有意识,即使是机器,那么它也有道德权利,所以关掉它就相当于谋杀。哇!我的天啊想象一下,因为拔掉电脑插头而被送进监狱。我们应该关注这个问题吗?
大多数神经科学家都不怎么谈论意识。他们认为,大脑可以像其他物理系统一样被理解,而意识,无论它是什么,都将以同样的方式被解释。既然连 “意识 “这个词的含义都没有达成一致,最好不要担心这个问题。
另一方面,哲学家们喜欢谈论(和写书)关于意识的问题。有些人认为,意识是超越物理描述的。也就是说,即使你对大脑如何工作有充分的了解,也无法解释意识。哲学家大卫-查尔姆斯(David Chalmers)有句名言:意识是 “困难的问题”,而理解大脑如何工作是 “容易的问题”。这句话流行开来,现在许多,人们只是假设意识是一个固有的无法解决的问题。
就个人而言,我认为没有理由相信意识是无法解释的。我不想和哲学家们争论,也不想尝试给意识下定义。然而,“千脑理论 “建议对意识的几个方面进行物理解释。例如,大脑学习世界模型的方式与我们的自我意识以及我们如何形成信仰密切相关。
我在这一章想做的是描述大脑理论对意识的几个方面的说法。我将坚持讲述我们对大脑的了解,并让你决定什么,如果有的话,仍然需要解释。
认识
想象一下,如果我能够将你的大脑重置到你今天早上醒来时的确切状态。在我重置你之前,你会起床并继续你的一天,做你通常做的事情。也许在这一天,你洗了你的车。到了晚餐时间,我会把你的大脑重置到你起床时的状态,撤销白天发生的任何变化–包括突触的任何变化。因此,所有关于你所做的事情的记忆都会被抹去。在我重置你的大脑后,你会相信你刚刚醒来。如果我告诉你,你今天洗了车,你起初会抗议,声称这不是真的。在给你看了你洗车的视频后,你可能会承认,看起来你确实洗了,但你当时不可能有意识。你还可能声称,你不应该为你白天做的任何事情负责,因为你做这些事情时没有意识。当然,你洗车的时候是有意识的。只有在删除了你对这一天的记忆之后,你才会相信并声称你没有意识。这个思想实验表明,我们的意识,即许多人所说的意识,需要我们对自己的行为形成时刻的记忆。
意识还要求我们对自己的思想形成时刻的记忆。回顾一下,思考只是大脑中神经元的顺序激活。我们可以记住思想的序列,就像我们可以记住旋律中的音符序列一样。如果我们不记得我们的想法,我们就会不知道我们为什么要做什么。例如,我们都有过这样的经历:去家里的一个房间做事,但一进房间就忘记了去那里的目的。当这种情况发生时,我们经常问自己:“在我到这里之前,我在哪里,我在想什么?“我们试图回忆起我们最近的想法,这样我们就知道为什么我们现在会站在厨房里。
当我们的大脑正常工作时,神经元对我们的思想和行动都形成了连续的记忆。因此,当我们走到厨房时,我们可以回忆起我们之前的想法。我们检索出最近存储的关于吃冰箱里最后一块蛋糕的想法的记忆,我们知道我们为什么去厨房。
大脑中活跃的神经元在某些时刻代表我们现在的经验,而在其他时刻代表以前的经验或以前的想法。正是这种对过去的可及性–在时间中跳回并再次向前滑动到现在的能力–给了我们存在感和意识。如果我们不能回放我们最近的想法和经历,那么我们就不会意识到我们还活着。
我们此刻的记忆并不是永久的。我们通常会在几小时或几天内忘记它们。我记得今天早餐吃了什么,但一两天后我就会失去这种记忆。我们形成短期记忆的能力随着年龄的增长而下降,这很常见。这就是为什么随着年龄的增长,我们有越来越多的 “我为什么来这里?“的经历。
这些思想实验证明,我们的意识、我们的存在感–这是意识的核心部分–是,取决于不断形成对我们最近的想法和经历的记忆,并在我们每天的工作中回放它们。
现在让我们说,我们创造了一个智能机器。该机器使用与大脑相同的原理学习世界模型。机器的世界模型的内部状态等同于大脑中神经元的状态。如果我们的机器能记住这些状态的发生,并能重放这些记忆,那么它是否会像你和我一样意识到自己的存在并有意识?我相信是的。
如果你认为意识不能被科学调查和已知的物理定律所解释,那么你可能会争辩说,我已经证明存储和回忆大脑的状态是必要的,但我没有证明这是充分的。如果你采取这种观点,那么你就有责任证明为什么它是不充分的。
对我来说,意识的感觉–存在的感觉,我是世界上的一个行动者的感觉–是意识的核心含义。它很容易用神经元的活动来解释,而且我认为这并不神秘。
科里亚
从眼睛、耳朵和皮肤进入大脑的神经纤维看起来是一样的。它们不仅看起来相同,而且使用看起来相同的尖峰来传递信息。如果你看一下进入大脑的输入,你无法辨别它们代表什么。然而,视觉感觉是一种东西,听觉感觉是另一种东西,都不像尖峰。当你看一个田园风光时,你不会感觉到电尖峰进入你的大脑的嗒嗒声;你看到的是山丘、颜色和影子。
“Qualia “是对感觉输入如何被感知的名称,它们的感觉。资格感是令人困惑的。鉴于所有的感觉都是由相同的尖峰产生的,为什么看到的感觉与触摸不同?还有,为什么有些输入尖峰会产生疼痛的感觉,而,其他的却没有?这些问题可能看起来很傻,但如果你想象大脑就在头骨里,它的输入只是尖峰,那么你就能感觉到其中的奥秘。我们所感知的感觉来自哪里?质感的起源被认为是意识的奥秘之一。
资格感是大脑世界模型的一部分
资格是主观的,这意味着它们是内部经验。例如,我知道泡菜对我来说是什么味道,但我不可能知道泡菜对你来说是否是同样的味道。即使我们用同样的词来描述泡菜的味道,你和我仍然有可能对泡菜有不同的感知。有时我们实际上知道,同样的输入在不同的人那里有不同的感知。最近一个著名的例子是一张衣服的照片,有些人认为是白色和金色的,而另一些人认为是黑色和蓝色的。完全相同的照片可以导致对颜色的不同感知。这告诉我们,颜色的质点并不纯粹是物理世界的属性。如果是这样,我们都会说这件衣服的颜色是一样的。衣服的颜色是我们大脑对世界的模型的一个属性。如果两个人对相同的输入有不同的感知,这就告诉我们他们的模型是不同的。
我家附近有一个消防站,外面的车道上有一辆红色消防车。卡车的表面总是呈现红色,尽管从它身上反射的光的频率和强度不同。光线随着太阳的角度、天气和车道上卡车的方向而变化。然而,我并没有感觉到卡车的颜色在变化。这告诉我们,在我们所感知的红色和特定频率的光之间并没有一对一的对应关系。红色与特定频率的光有关,但我们感知到的红色并不总是相同的频率。消防车的红色是大脑捏造的–它是大脑表面模型的一个属性,而不是光本身的一个属性。
一些质点是通过运动学习的,与我们学习物体的方式相似
如果质感是大脑的世界模型的一个属性,那么,大脑是如何创造它们的呢?回顾一下,大脑通过运动来学习世界的模型。为了了解咖啡杯的感觉,你必须在咖啡杯上移动你的手指,在不同的位置触摸它。
有些质感是以类似的方式学习的,通过运动。想象一下,你手里拿着一张绿色的纸。当你看着它时,你会移动它。首先你直直地看着纸,然后你把它转向左边,然后转向右边,然后向上,然后向下。当你改变纸的角度时,进入你眼睛的光的频率和强度就会改变,因此进入你大脑的尖峰模式也会改变。当你移动一个物体时,例如那张绿纸,你的大脑预测光线将如何变化。我们可以确定这种预测正在发生,因为如果在你移动纸片时,光线没有变化或者变化的方式与正常情况不同,你就会注意到有什么不对劲。这是因为大脑有关于表面如何在不同角度反射光线的模型。不同类型的表面有不同的模型。我们可以把一个表面的模型称为 “绿色”,另一个称为 “红色”。
如何学习一个表面的颜色模型呢?想象一下,我们有一个表面的参考框架,我们称之为绿色。绿色的参考框架在一个重要方面不同于物体的参考框架,例如咖啡杯。杯子的参考框架代表杯子上不同位置的感应输入。绿色表面的参考框架代表表面不同方向上的感应输入。你可能觉得很难想象一个代表方向的参考框架,但从理论的角度来看,这两种类型的参考框架是相似的。大脑用来学习咖啡杯模型的基本机制也可以学习颜色的模型。
没有进一步的证据,我不知道颜色的质点是否真的是这样建模的。我提到这个例子是因为它,表明有可能为我们如何学习和体验质点构建可测试的理论和神经解释。它表明,质感可能并不像某些人认为的那样,处于正常科学解释的范畴之外。
并非所有的质感都是学来的。例如,疼痛的感觉几乎可以肯定是与生俱来的,由特殊的疼痛受体和旧脑结构介导,而不是由新皮质介导。如果你碰到一个热炉子,在你的新皮层知道发生了什么之前,你的手臂就会痛苦地缩回。因此,疼痛不能像绿色一样被理解,我提出的绿色是在新皮质中学习的。
当我们感到疼痛时,它是 “在那里”,在我们身体的某个位置。位置是疼痛的质量的一部分,我们有一个坚实的解释,为什么它在不同的位置被感知。但是我没有解释为什么会痛,或者为什么会有这样的感觉,而不是像其他的东西。这并没有给我带来任何深层次的困扰。关于大脑,我们有许多事情还不了解,但我们取得的稳步进展让我相信,这些问题和其他与质感有关的问题可以在正常的神经科学研究和发现过程中被理解。
意识的神经科学
有一些研究意识的神经科学家。在光谱的一端是神经科学家,他们认为意识可能超出了正常的科学解释。他们研究大脑,寻找与意识相关的神经活动,但他们不相信神经活动可以解释意识。他们认为,也许意识永远无法被理解,或者它是由量子效应或未被发现的物理定律创造的。就个人而言,我无法理解这种观点。我们为什么要假设一些东西无法被理解?人类漫长的发现史一再表明,那些起初看起来无法理解的事物最终都有合乎逻辑的解释。如果一个科学家提出非同寻常的主张,说意识不能用神经活动来解释,我们应该持怀疑态度,而且他们应该有责任说明原因。
还有一些研究意识的神经科学家认为,它可以像其他物理现象一样被理解。他们认为,如果意识看起来很神秘,那只是因为我们还不了解其机制,也许我们对这个问题的思考并不正确。我和我的同事们正处于这个阵营。普林斯顿大学的神经科学家迈克尔-格拉齐亚诺也是如此。他提出,新皮层的一个特定区域对注意力进行建模,类似于新皮层的躯体区域对身体的建模。他提出,大脑的注意力模型使我们相信我们是有意识的,就像大脑的身体模型使我们相信我们有一条胳膊或一条腿一样。我不知道格拉齐亚诺的理论是否正确,但对我来说,它代表了正确的方法。请注意,他的理论是基于新皮层学习注意力的模型。如果他是对的,我敢打赌,这个模型是用类似网格细胞的参考框架建立的。
机器意识
如果意识真的只是一种物理现象,那么我们应该对智能机器和意识有何期待?我毫不怀疑,按照与大脑相同的原理工作的机器将是有意识的。人工智能系统今天不这样工作,但在未来它们会,而且它们会有意识。我也毫不怀疑,许多动物,尤其是其他哺乳动物,也是有意识的。它们不需要告诉我们,我们就能知道;我们可以通过看到它们的大脑工作方式与我们的类似而知道它们是有意识的。
我们是否有道德义务不关闭一个有意识的机器?这是否等同于谋杀?不,我不会担心拔掉一台有意识的机器的插头。首先,考虑到我们人类每天晚上睡觉时都会关掉电源。当我们醒来时,我们又会打开。在我看来,这与拔掉一台有意识的机器的插头并在以后再次插入没有什么不同。
在拔掉智能机器的插头时将其毁掉,或者干脆不再插电呢?这不是类似于在人睡着时谋杀他们吗?并非如此。
我们对死亡的恐惧是由我们大脑的旧部分创造的。如果我们检测到有生命危险的情况,那么旧的大脑就会产生恐惧的感觉,我们就开始以更多的反射性方式行事。当我们失去亲近的人时,我们会哀悼并感到悲伤。恐惧和情绪是由旧脑的神经元在向体内释放荷尔蒙和其他化学物质时产生的。新皮质可能帮助旧脑决定何时释放这些化学物质,但如果没有旧脑,我们就不会感觉到恐惧或悲伤。对死亡的恐惧和对失去的悲伤并不是机器具有意识或智能的必要成分。除非我们不遗余力地给机器同等的恐惧和情感,否则它们根本不会在乎自己是否被关闭、拆卸或报废。
人类有可能与智能机器产生感情。也许他们分享了许多经验,人类感到与它有个人联系。在这种情况下,如果我们关闭机器,我们将不得不考虑对人类造成的伤害。但对智能机器本身不会有道德上的义务。如果我们不遗余力地赋予智能机器恐惧和情感,那么我会采取不同的立场,但智能和意识本身并不会造成这种道德困境。
生命的奥秘和意识的奥秘
不久以前,“什么是生命?“这个问题和 “什么是意识?“一样神秘。似乎无法解释为什么有些物质是活的,而有些则不是。对许多人来说,这个谜团似乎无法用科学来解释。1907年,哲学家亨利-柏格森提出了一个神秘的东西,他称之为 “生命力",以解释生物和非生物之间的区别。根据柏格森的说法,无生命的物质在添加了*“生命力*“之后就变成了。重要的是,*“生命力*“不是物质,无法通过正常的科学研究来理解。
随着基因、DNA和整个生物化学领域的发现,我们不再认为生命物质是无法解释的。关于生命仍有许多未解之谜,例如它是如何开始的,它在宇宙中是否常见,病毒是否是一种生物,以及生命能否使用不同的分子和化学方法存在?但是这些问题,以及它们所产生的争论,都处于边缘状态。科学家们不再争论生命是否可以解释。在某些时候,人们开始清楚地认识到,生命可以被理解为生物学和化学。像élan vital这样的概念成为历史的一部分。
我预计,类似的态度变化将发生在意识方面。在未来的某个时刻,我们将接受这样的事实:任何系统如果学习了世界的模型,持续记忆该模型的状态,并回忆起记忆中的状态,那么它就是有意识的。将会有剩余的未解答的问题,但是意识将不再被当作 “难题 “来谈论。它甚至不会被认为是一个问题。
第十章
机器智能的未来
今天我们称之为人工智能的东西都不是智能的。没有机器表现出我在本书前几章中描述的灵活的建模能力。然而,并没有什么技术原因阻止我们创造智能机器。障碍一直是对什么是智能缺乏了解,以及不知道创造智能所需的机制。通过研究大脑的工作原理,我们在解决这些问题上已经取得了重大进展。在我看来,我们将不可避免地克服任何剩余的障碍,在本世纪进入机器智能时代,可能是在接下来的二三十年。
机器智能将改变我们的生活和社会。我相信它对21世纪的影响将比计算机对20世纪的影响更大。但是,与大多数新技术一样,我们不可能确切地知道这种转变将如何发展。历史表明,我们无法预测将推动机器智能发展的技术进步。想想推动计算加速的创新,如集成电路、固态存储器、蜂窝式无线通信、公钥密码学和互联网。1950年没有人预料到这些和许多其他的进步。同样地,没有人预料到计算机将如何改变媒体、通信和商业。我相信我们今天对七十年后的智能机器会是什么样子以及我们将如何使用它们也同样一无所知。
虽然我们无法知道未来的细节,但千脑理论可以帮助我们确定边界。了解大脑是如何创造智能的,可以告诉我们哪些事情是可能的,哪些事情是不可能的,以及在某种程度上哪些进步是可能的。这就是本章的目标。
智能机器将不会像人类一样
在思考机器智能时,最重要的是要记住我在第二章 中讨论的大脑的主要划分:旧脑与新脑。回顾一下,人类大脑的旧部分控制着生命的基本功能。它们创造了我们的情感,我们对生存和生育的欲望,以及我们与生俱来的行为。在创造智能机器时,我们没有理由要复制人脑的所有功能。新的大脑,即新皮质,是智能的器官,所以智能机器需要与之相当的东西。当涉及到大脑的其他部分时,我们可以选择我们想要的部分和我们不想要的部分。
智能是一个系统学习世界模型的能力。然而,由此产生的模型本身是没有价值的,没有情感的,也没有目标。目标和价值是由使用该模型的任何系统提供的。这类似于十六世纪到二十世纪的探险家们如何努力创造一个准确的地球地图。一个冷酷无情的军事将领可能会使用该地图来计划包围和谋杀对方军队的最佳方式。一个商人可以使用完全相同的地图来和平地交换货物。地图本身并没有规定这些用途,也没有对它的使用方式赋予任何价值。它只是一张地图,既不是谋杀也不是和平。当然,地图的细节和涵盖的内容各不相同。因此,有些地图可能更适合于战争,有些则更适合于贸易。但发动战争或贸易的愿望来自于使用地图的人。
同样,新皮层学习的是一个世界模型,它本身没有目标或价值。指导我们行为的情绪是由旧脑决定的。如果一个人的旧脑是攻击性的,那么它就会使用新皮质中的模型来更好地执行攻击性行为。如果另一个人的旧大脑是仁慈的,那么它将使用新皮质中的模型来更好地实现其仁慈的目标。就像地图一样,一个人的世界模型可能更适合于一套特定的目标,但新皮层并不创造这些目标。
智能机器需要有一个关于世界的模型和来自该模型的行为的灵活性,但它们不需要有类似人类的生存和生育本能。事实上,设计一台机器使其具有类似人类的情感远比设计一台机器使其具有智能要困难得多,因为旧的大脑包括许多器官,如杏仁核和下丘脑,每一个器官都有自己的设计和功能。为了制造一台具有类似人类情感的机器,我们将不得不重新创建旧大脑的不同部分。新皮质虽然比旧脑大得多,但由一个相对较小的元素的许多副本组成,即皮质柱。一旦我们知道如何建立一个皮层柱,把许多皮层柱放入机器中以使其更加智能,应该是相对容易的。
设计智能机器的秘诀可以分成三个部分:体现、旧脑的部分和新皮质。这些部分中的每一部分都有很大的自由度,因此会有很多类型的智能机器。
1.实施方式
正如我前面所描述的,我们通过移动来学习。为了学习一个建筑物的模型,我们必须走过它,从一个房间。为了学习一个新的工具,我们必须把它拿在手里,这样转,那样转,用我们的手指和眼睛观察和关注不同的部分。在一个基本的层面上,学习一个世界的模型需要相对于世界上的事物移动一个或多个传感器。
智能机器也需要传感器和移动它们的能力。这被称为 “体现”。体现可以是一个看起来像人、狗或蛇的机器人。体现可以采取非生物形式,如一辆汽车或一个十臂的工厂机器人。化身甚至可以是虚拟的,比如一个在互联网上探索的机器人。虚拟身体的想法可能听起来很奇怪。其要求是智能系统可以执行改变其传感器位置的行动,但行动和位置不一定是物理的。当你在网上浏览时,你从一个位置移动到另一个位置,你所感觉到的东西随着每个新的网站而改变。我们通过物理移动鼠标或触摸屏幕来做到这一点,但一个智能机器可以只用软件来做同样的事情,没有物理动作。今天的大多数深度学习网络都没有体现。他们没有可移动的传感器,也没有参考框架来知道传感器的位置。没有体现,能学到的东西是有限的。
可用于智能机器的传感器的类型几乎是无限的。人类的主要感官是视觉、触觉和听觉。蝙蝠有声呐。一些鱼有发射电场的感觉。在视觉方面,有带镜片的眼睛(像我们一样)、复眼,以及能看到红外线或紫外线的眼睛。很容易想象为特定问题设计的新型传感器。例如,一个能够在倒塌的建筑物中救人的机器人可能有雷达传感器,所以它可以在黑暗中看到。
人类的视觉、触觉和听觉是通过传感器阵列实现的。例如,眼睛不是一个单一的传感器。它包含数以千计的传感器,排列在眼睛的背面。同样地,身体也包含了成千上万的传感器,它们排列在皮肤上。智能机器也会有感官阵列。想象一下,如果你只有一只手指用于触摸,或者你只能通过一根狭窄的吸管看世界。你仍然能够了解这个世界,但需要更长的时间,而且你能执行的行动也是有限的。我可以想象能力有限的简单智能机器只有几个传感器,但接近或超过人类智能的机器将有大量的感官阵列,就像我们一样。
嗅觉和味觉与视觉和触觉有质的不同。除非我们像狗一样把鼻子直接放在一个表面上,否则很难准确地说出一个气味的位置。同样,味觉也只限于对口中事物的感觉。嗅觉和味觉帮助我们决定吃什么食物是安全的,嗅觉可能帮助我们识别一个大致的区域,但我们并不太依赖它们来学习世界的详细结构。这是因为我们不容易将气味和味道与具体地点联系起来。这并不是这些感官的固有限制。例如,一台智能机器可以在其身体表面安装类似于味道的化学传感器阵列,使机器能够以你我感受纹理的方式 “感受 “化学品。
声音就在这两者之间。通过使用两只耳朵,并利用声音如何从我们的外耳反弹的优势,我们的大脑可以定位声音比定位嗅觉或味觉好得多,但不如视觉和触觉好。
重要的一点是,对于一个智能机器来说,要学习世界的模型,它需要可以移动的感觉输入。每个单独的传感器都需要与一个参考框架相关联,以跟踪传感器相对于世界上的事物的位置。一个智能机器可以拥有许多不同类型的传感器。任何特定应用的最佳传感器取决于机器存在于什么样的世界,以及我们希望机器能学到什么。
在未来,我们可能会建造具有不寻常体现的机器。例如,想象一下一个存在于单个细胞内并了解蛋白质的智能机器。蛋白质是长长的分子,可以自然折叠成复杂的形状。一个蛋白质分子的形状决定了它的作用。如果我们能够更好地理解蛋白质的形状,并根据需要操纵它们,将给医学带来巨大的好处,但我们的大脑并不擅长理解蛋白质。我们无法感知它们或与它们直接互动。甚至它们行动的速度也比我们的大脑所能处理的快得多。然而,也许有可能创造出一种智能机器,它理解和操纵蛋白质,就像你我理解和操纵咖啡杯和智能手机一样。智能蛋白质机器(IPM)的大脑可能驻扎在一台典型的计算机中,但它的运动和传感器将在一个非常小的范围内工作,在细胞内。它的传感器可能会检测到氨基酸、不同类型的蛋白质褶皱,或特定的化学键。它的行动可能涉及相对于蛋白质移动其传感器,就像你在咖啡杯上移动你的手指。它可能会有催促蛋白质以使其改变形状的行动,类似于你触摸智能手机屏幕以改变其显示。IPM可以学习细胞内部世界的模型,然后使用这个模型来实现预期的目标,如消除坏的蛋白质和修复受损的蛋白质。
另一个不寻常体现的例子是分布式大脑。人类的新皮质有大约15万个皮质柱,每个皮质柱都对它能感觉到的世界的一部分进行建模。没有理由说智能机器的 “柱子 “必须像生物大脑那样,在物理上彼此相邻。想象一下,一台智能机器有数以百万计的列和数以千计的传感器阵列。传感器和相关模型可以在物理上分布在地球上、海洋中或整个太阳系。例如,一个带有分布在地球表面的传感器的智能机器可能会理解全球天气的行为,就像你和我理解智能手机的行为一样。
我不知道建造一台智能蛋白质机器是否可行,也不知道分布式智能机器会有多大价值。我提到这些例子是为了激发你的想象力,因为它们是在可能性的范围内。关键的想法是,智能机器将可能采取许多不同的形式。当我们思考机器智能的未来和它将产生的影响时,我们需要广泛地思考,而不是把我们的想法限制在人类和其他动物的智能形式中,今天的智能是以人类和其他动物的形式存在。
2.旧脑的等价物
为了创造一个智能机器,需要一些存在于我们大脑旧部分的东西。早些时候,我说我们不需要复制旧的大脑区域。这在一般情况下是正确的,但有一些旧大脑做的事情是智能机器的要求。
一个要求是基本运动。回顾一下,新皮层并不直接控制任何肌肉。当新皮层想要做什么时,它会向大脑中更直接控制运动的较老部分发送信号。例如,双脚平衡、走路和跑步都是由大脑的老部分实现的行为。你不依靠你的新皮质来平衡、行走和跑步。这是有道理的,因为在我们进化出新皮质之前,动物早就需要走路和跑步了。我们为什么要让新皮层考虑每一步,而它可以考虑走哪条路来逃避捕食者?
但它必须是这样的吗?难道我们就不能建造一个相当于新皮层直接控制运动的智能机器吗?我不这么认为。新皮质实现了一种近乎通用的算法,但这种灵活性是有代价的。新皮质必须附着在已经有传感器和已经有行为的东西上。它并不创造全新的行为;它学习如何以新的和有用的方式将现有的行为串联起来。行为基元可以像弯曲手指那样简单,也可以像行走那样复杂,但新皮层要求它们存在。大脑旧部分的行为基元并不都是固定的–它们也可以通过学习而被修改。因此,新皮层也必须不断调整。
与机器的体现密切相关的行为应该被内置。例如,假设我们有一架飞行的无人机,其目的是向遭受自然灾害的人们运送紧急物资。我们可以让无人机智能化,让它自己评估哪些地区最需要,让它在运送物资时与其他无人机协调。无人机的 “新皮质 “不能控制飞行的所有方面,我们也不希望它这样。无人机应该有稳定飞行、降落、避开障碍物等的内置行为。无人机的智能部分不必考虑飞行控制,就像你的新皮质不必考虑双脚的平衡一样。
安全是我们应该建立在智能机器上的另一类行为。科幻作家艾萨克-阿西莫夫(Isaac Asimov)提出了著名的机器人三大定律。这些定律就像一个安全协议。
1.机器人不得伤害人类,或通过不作为使人类受到伤害。
2.机器人必须服从人类给它的命令,除非这种命令与第一法则相冲突。
3.机器人必须保护自己的存在,只要这种保护不与第一或第二法律相冲突。
阿西莫夫的机器人三定律是在科幻小说的背景下提出的,并不一定适用于所有形式的机器智能。但在任何产品设计中,都有值得考虑的保障措施。它们可以很简单。例如,我的汽车有一个内置的安全系统来避免事故。通常情况下,汽车听从我的命令,我通过油门和刹车踏板传达这些命令。然而,如果汽车检测到我要撞上的障碍物,它就会忽略我的命令,并踩下刹车。你可以说这辆车遵循了阿西莫夫的第一和第二定律,也可以说设计我的车的工程师内置了一些安全功能。智能机器也将有,内置的行为是为了安全。为了完整起见,我把这个想法包括在这里,尽管这些要求并不是智能机器所特有的。
最后,一个智能机器必须有目标和动机。人类的目标和动机很复杂。有些是由我们的基因驱动的,如对性、食物和住所的渴望。情绪–如恐惧、愤怒和嫉妒–对我们的行为方式也有很大影响。我们的一些目标和动机更具有社会性。例如,什么被视为成功的生活在不同的文化中是不同的。
智能机器也需要目标和动机。我们不会想把一队机器人建筑工人送到火星,却发现他们整天躺在阳光下给电池充电。那么,我们如何赋予智能机器以目标,这其中是否有风险?
首先,重要的是要记住,新皮层本身并不创造目标、动机或情感。回顾我在新皮层和世界地图之间所做的类比。地图可以告诉我们如何从我们所在的地方到我们想去的地方,如果我们采取这样或那样的行动会发生什么,以及哪些东西位于不同的地方。但地图本身没有动机。一张地图不会渴望去某个地方,也不会自发形成目标或野心。新皮质的情况也是如此。
新皮层积极参与动机和目标如何影响行为,但新皮层并不领导。为了了解这一点,想象一下老的大脑区域与新皮层的对话。老大脑说,“我饿了。我想要食物。“新皮层回应说:“我寻找食物,发现附近有两个地方过去有食物。为了到达一个食物地点,我们沿着一条河走。要到达另一个地方,我们要穿过一片空地,那里住着一些老虎。“新皮层平静地说出这些事情,没有任何价值。然而,年长的大脑区域将老虎与危险联系起来。一听到 “老虎 “这个词,旧的大脑就开始行动。它向血液中释放化学物质,提高你的心率,并引起我们与恐惧相关的其他生理效应。,老大脑还可能释放化学物质,称为神经调节剂,直接进入新皮层的广泛区域–实质上是告诉新皮层,“无论你刚才在想什么,都不要这样做”。
赋予机器以目标和动机,需要我们为目标和动机设计特定的机制,然后将它们嵌入机器的体现中。这些目标可以是固定的,比如我们由基因决定的进食欲望,也可以是学习的,比如我们由社会决定的如何过好生活的目标。当然,任何目标都必须建立在安全措施之上,如阿西莫夫的前两条定律。总之,智能机器将需要某种形式的目标和动机;然而,目标和动机不是智能的结果,也不会自行出现。
3.相当于新皮层
智能机器的第三个要素是一个通用的学习系统,它执行的功能与新皮质相同。再一次,可以有广泛的设计选择。我将讨论两个:速度和能力。
速度
神经元至少需要五毫秒来做任何有用的事情。由硅制成的晶体管的运行速度几乎可以达到一百万倍。因此,由硅制成的新皮质有可能比人类的思考和学习速度快一百万倍。很难想象思维速度的如此巨大的提高会导致什么结果。但在我们让想象力肆意驰骋之前,我需要指出,仅仅因为智能机器的一部分可以比生物大脑的运行速度快一百万倍,并不意味着整个智能机器的运行速度可以快一百万倍,也不意味着可以以这种速度获得知识。
例如,回顾一下我们的机器人建筑工人,就是我们派往火星为人类建造栖息地的那些人。他们可能能够,快速思考和分析问题,但实际的施工过程只能加快一点。在所涉及的力量导致它们弯曲和断裂之前,重型材料的移动速度只能这么快。如果一个机器人需要在一块金属上钻一个洞,它不会比人类钻洞更快。当然,机器人建筑工人可能会连续工作,不会累,而且犯的错误更少。因此,与人类相比,使用智能机器时,为人类准备火星的整个过程可能会快几倍,但不会快一百万倍。
考虑另一个例子。如果我们有智能机器,可以做神经科学家的工作,只是机器的思维速度快一百万倍,那会怎样?神经科学家花了几十年时间才达到我们目前对大脑的理解水平。有了人工智能神经科学家,这一进展会不会在不到一小时的时间内快上一百万倍?不。有些科学家,比如我和我的团队,是理论家。我们整天都在阅读论文,辩论可能的理论,并编写软件。原则上说,如果由智能机器来完成,其中一些工作可以快得多。但是我们的软件模拟仍然需要几天的时间来运行。此外,我们的理论不是在真空中发展的;我们依赖于实验的发现。本书中的大脑理论受制于数百个实验实验室的结果,并被告知。即使我们能够将思考速度提高一百万倍,我们仍然要等待实验者发表他们的结果,而且他们不可能大大加快他们的实验速度。例如,老鼠必须被训练和收集数据。老鼠的速度不可能被提高到任何程度。再次,使用智能机器而不是人类来研究神经科学会加快科学发现的速度,但不是一百万倍。
在这方面,神经科学并非独一无二。几乎所有的科学探索领域都依赖于实验数据。例如,今天有许多关于空间和时间性质的理论。要知道这些理论中是否有任何一个是正确的,需要新的实验数据。如果我们有智能机器宇宙学家,他们的思维速度比人类宇宙学家快一万倍,他们也许能够迅速产生新的理论,但我们仍然必须建造太空望远镜和地下粒子探测器,以收集所需的数据,知道任何理论是否正确。我们无法大幅加快望远镜和粒子探测器的制造速度,也无法减少它们收集数据的时间。
有一些领域的探究可以大大加快速度。数学家主要是思考、写作和分享想法。原则上,智能机器在处理一些数学问题时,可以比人类数学家快一百万倍。另一个例子是我们在互联网上爬行的虚拟智能机器。智能网络爬虫的学习速度受限于它通过跟踪链接和打开文件的 “移动 “速度。这可能是非常快的。
今天的计算机可能是一个很好的比喻,说明我们可以预期会发生什么。计算机做的任务是人类过去用手做的,而且它们做的速度快了大约一百万倍。计算机已经改变了我们的社会,并导致我们进行科学和医学发现的能力大幅提高。但是计算机并没有导致我们做这些事情的速度增加一百万倍。智能机器将对我们的社会和我们做出发现的速度产生类似的影响。
产量
弗农-蒙卡斯尔意识到,我们的新皮层变得很大,我们变得更聪明,是通过复制相同的电路,即皮层柱。机器智能也可以遵循同样的计划。一旦我们完全理解了柱子的作用以及如何用硅制造一个柱子,那么通过使用更多或更少的柱子元素来创造不同能力的智能机器应该是相对容易的。
对于我们能把人工大脑做多大,并没有任何明显的限制。一个人类的新皮层包含大约15万个柱子。如果我们制造一个拥有1.5亿个的人工新皮层会发生什么?一个比人脑大一千倍的大脑,会有什么好处?我们还不知道,但有一些观察结果值得分享。
新皮层区域的大小在人与人之间有很大的差异。例如,V1区,即初级视觉区,在一些人中可能是其他人的两倍大。V1的厚度对每个人来说都是一样的,但是面积,以及因此而产生的列的数量,可以有所不同。一个V1相对较小的人和一个V1相对较大的人都有正常的视力,而且两个人都没有意识到这种差异。但是有一个区别;V1大的人有更高的敏锐度,意味着他们可以看到更小的东西。例如,如果你是一个钟表匠,这可能是有用的。如果我们从中归纳,那么增加新皮层某些区域的大小可以带来适度的差异,但它不会给你带来某种超级力量。
我们可以创造更多的区域,并以更复杂的方式连接它们,而不是让区域变得更大。在某种程度上,这就是猴子和人类之间的区别。猴子的视觉能力与人类相似,但人类的新皮质总体上更大,有更多的区域。大多数人都会同意,人类比猴子更聪明,我们对世界的模型更深入、更全面。这表明,智能机器在理解的深度上可能超过人类。这并不一定意味着人类无法理解智能机器所学习的东西。例如,即使我不可能发现爱因斯坦所做的事情,我也能理解他的发现。
还有一种方式,我们可以思考能力。我们大脑的大部分体积是布线,即连接神经元的轴突和树突。就能量和空间而言,这些都是昂贵的。为了节约能源,大脑被迫限制布线,因此限制了可以随时学习的内容。当我们出生时,我们的新皮层有过多的布线。在生命的最初几年里,这种情况会大大减少。据推测,大脑正在学习哪些连接是有用的,哪些是基于儿童早期的生活经验而没有的。不过,删除不使用的线路有一个缺点;它使得在以后的生活中很难学习新的知识类型。例如,如果一个孩子在生命早期没有接触到多种语言,那么精通多种语言的能力就会减弱。同样地,一个孩子如果在生命早期眼睛不能正常工作,即使后来眼睛得到了修复,也会永久地失去看东西的能力。这可能是因为一些多语言和视觉所需的连接因为没有被使用而丢失。
智能机器没有与布线有关的相同限制。例如,在我的团队创建的新皮质的软件模型中,我们可以立即在任何两组神经元之间建立连接。与大脑中的物理布线不同,软件允许形成所有可能的连接。这种连接的灵活性可能是机器智能比生物智能的最大优势之一。它可以让智能机器保持所有的选择,因为它消除了人类成年人在试图学习新事物时所面临的最大障碍之一。
学习与克隆
机器智能将与人类智能不同的另一种方式是克隆智能机器的能力。每个人都必须从头开始学习世界的模型。我们在开始生活时几乎一无所知,并花了几十年时间学习。我们去学校学习,我们阅读书籍来学习,当然我们也通过我们的个人经验来学习。智能机器也将不得不学习世界的模型。然而,与人类不同的是,在任何时候我们都可以制作一个智能机器的副本,克隆它。想象一下,我们有一个标准化的硬件设计,用于我们的智能火星建筑机器人。我们可能会有相当于一所学校,教机器人了解建筑方法、材料和如何使用工具。这种培训可能需要几年时间才能完成。但是一旦我们对机器人的能力感到满意,我们就可以通过把它学到的连接转移到其他十几个相同的机器人中来进行复制。第二天,我们可以再次对机器人进行重新编程,采用改进的设计,或者可能采用全新的技能。
机器智能的未来应用是未知的
当我们创造一项新技术时,我们想象它将被用来取代或改进我们所熟悉的东西。随着时间的推移,出现了没有人预料到的新用途,而正是这些没有预料到的用途通常会变得最重要,并改变社会。例如,互联网的发明是为了在科学和军事计算机之间共享文件,这在以前是手工完成的,但现在可以更快、更有效地完成。互联网仍然被用来分享文件,但更重要的是,它从根本上改变了娱乐、商业、制造业和个人通信。它甚至改变了我们的写作和阅读方式。在互联网协议最初创建时,很少有人想象到这些社会转变。
机器智能也将经历类似的转变。今天,大多数人工智能科学家专注于让机器做人类能做的事情–从识别口语,到标记图片,再到驾驶汽车。人工智能的目标是模仿人类,这一概念在著名的 “图灵测试 “中得到体现。图灵测试最初是由阿兰-图灵提出的 “模仿游戏”,它指出,如果一个人无法分辨他们是在与计算机还是人类对话,那么计算机就应该被视为智能。不幸的是,这种将类似人类的能力作为衡量智能的标准的做法弊大于利。我们对让计算机下围棋等任务的兴奋,使我们无法想象智能机器的最终影响。
当然,我们将使用智能机器来做我们人类今天做的事情。这将包括危险和不健康的工作,这些工作对人类来说也许风险太大,如深海维修或清理有毒泄漏物。我们还将使用智能机器来完成没有足够人类的任务,也许是作为护理人员为老人。有些人希望使用智能机器来取代高薪工作或打仗。我们将不得不努力寻找正确的解决方案,以解决其中一些应用将带来的困境。
但对于机器智能的非预期应用,我们能说什么呢?虽然没有人能够知道未来的细节,但我们可以尝试找出可能推动人工智能在意料之外的方向应用的大想法和趋势。其中我认为令人兴奋的是科学知识的获取。人类想要学习。我们被吸引去探索,去寻求知识,去了解未知的东西。我们想知道宇宙之谜的答案。这一切是如何开始的?它将如何结束?生命在宇宙中常见吗?是否存在其他智能生物?新皮质是让人类寻求这种知识的器官。当智能机器能够比我们思考得更快、更深入,能够感知我们无法感知的东西,能够前往我们无法前往的地方,谁知道我们会学到什么。我觉得这种可能性令人激动。
并非所有人都像我一样对机器智能的好处持乐观态度。有些人认为它是对人类最大的威胁。我将在下一章讨论机器智能的风险。
第十一章
机器智能的存在风险
在二十一世纪初,人工智能领域被认为是一个失败。当我们开始Numenta时,我们进行了市场调查,看看我们可以用什么词来谈论我们的工作。我们了解到,几乎所有人都对 “AI “和 “人工智能 “这两个词持否定态度。没有公司会考虑使用它们来描述他们的产品。人们普遍认为,制造智能机器的尝试已经停滞不前,可能永远不会成功。在十年内,人们对人工智能的印象已经完全翻转了。它现在是最热门的研究领域之一,公司正在将人工智能的名称应用于几乎所有涉及机器学习的东西。
更令人惊讶的是,技术专家们从 “人工智能可能永远不会发生 “迅速转变为 “人工智能很可能在不久的将来毁灭所有人类”。一些非营利机构和智囊团已经成立,以研究人工智能的生存风险,许多高知名度的技术专家、科学家和哲学家公开警告说,智能机器的创造可能会迅速导致人类的灭绝或被征服。人工智能现在被许多人看作是对人类的生存威胁。
每一项新技术都可能被滥用,造成伤害。即使是今天有限的人工智能也被用来跟踪人,影响选举,和传播宣传。当我们拥有真正的智能机器时,这类滥用情况会变得更糟。例如,武器可以被制成智能和自主的想法是可怕的。想象一下,智能无人机不是在运送药品和食物,而是在运送武器。因为智能武器可以在没有人类监督的情况下行动,它们可以被数以万计地部署。我们必须正视这些威胁,并制定政策来防止不良后果。
坏人会试图利用智能机器来剥夺自由和威胁生命,但在大多数情况下,一个人将智能机器用于不良目的,不可能导致所有人类的灭绝。另一方面,对人工智能的生存风险的担忧,在质量上是不同的。坏人利用智能机器做坏事是一回事;如果智能机器本身是坏的行为者,并决定自己消灭人类,那就是另一回事了。我将只关注后者的可能性,即人工智能的生存威胁。这样做,我并不打算贬低人们滥用人工智能的重大风险。
人们对机器智能的存在风险的认识主要基于两个担忧。第一个被称为智能爆炸。这个故事是这样的。我们创造了比人类更聪明的机器。这些机器在几乎所有方面都比人类强,包括创造智能机器。我们让智能机器创造新的智能机器,然后再创造更智能的机器。每一代智能机器的改进之间的时间越来越短,不久之后,机器就会超越我们的智力,以至于我们无法理解它们在做什么。在这一点上,机器可能决定,因为他们不再需要我们(人类灭绝),或者他们可能决定容忍我们,因为我们对他们有用(人类征服)。
第二个生存风险被称为目标错位,指的是智能机器追求的目标与我们的福祉背道而驰,而我们却无法阻止它们的情景。技术专家和哲学家们已经提出了这种情况可能发生的几种方式。例如,智能机器可能会自发地发展出对我们有害的自己的目标。或者它们可能会追求我们分配给它们的目标,但做得如此无情,以至于它们消耗了地球的所有资源,并在这个过程中使地球不适合我们居住。
所有这些风险情景的基本假设是,我们失去了对我们创造物的控制。智能机器使我们无法关闭它们,也无法以其他方式阻止它们追求自己的目标。有时假设智能机器会复制,创造出数以百万计的副本,而在其他情况下,单一的智能机器变得无所不能。无论哪种情况,都是我们与它们之间的对抗,而且机器更聪明。
当我读到这些担忧时,我觉得这些论点是在不了解智能是什么的情况下提出的。它们给人的感觉是疯狂的猜测,所依据的不仅仅是技术上的可能性,而且是智能的含义的不正确概念。让我们来看看,当我们根据我们对大脑和生物智能的了解来考虑这些问题时,这些担忧是如何成立的。
情报爆炸的威胁
智力需要有一个世界的模型。我们使用我们的世界模型来识别我们所处的位置并计划我们的行动。我们使用我们的模型来识别物体,操纵它们,并预测我们行动的后果。当我们想完成某件事情时,不管是简单到制作一壶,还是复杂到推翻一项法律,我们都会使用大脑中的模型来决定我们应该采取哪些行动来达到预期的结果。
除了少数例外,学习新的想法和技能需要与世界进行实际的互动。例如,最近发现的其他太阳系的行星需要首先建造一个新型的望远镜,然后在几年内收集数据。没有一个大脑,不管它有多大,速度有多快,可以通过思考就知道太阳系外行星的普遍性和组成。跳过发现的观察阶段是不可能的。学习如何驾驶直升机需要了解你的行为的微妙变化如何导致飞行的微妙变化。学习这些感觉-运动关系的唯一方法是通过练习。也许机器可以在模拟器上练习,理论上可以比通过驾驶真正的直升机学习更快,但仍然需要时间。经营一家制造计算机芯片的工厂需要多年的练习。你可以读一本关于芯片制造的书,但专家已经学会了制造过程中可能出错的细微方式以及如何解决这些问题。这种经验是无可替代的。
智能不是可以在软件中编程的东西,也不是可以被指定为规则和事实的清单。我们可以赋予机器学习世界模型的能力,但构成该模型的知识必须被学习,而学习需要时间。正如我在上一章所描述的,尽管我们可以制造出比生物大脑运行速度快一百万倍的智能机器,但它们获取新知识的速度却不能快一百万倍。
获得新的知识和技能需要时间,无论大脑有多快或多大。在某些领域,如数学,智能机器可以比人类学习得更快。然而,在大多数领域,学习的速度受到需要与世界进行物理互动的限制。因此,不可能出现智能爆炸,机器突然比我们知道得更多。
智能爆炸的追随者有时会谈论 “超人的智能”,也就是机器在每一个方面和每一项任务上的表现都超过人类。想一想这意味着什么。一个超人的智能机器可以熟练地驾驶各种类型的飞机,操作各种类型的机器,用各种编程语言编写软件。它可以说每一种语言,知道世界上每一种文化的历史,了解每个城市的建筑。人类能够集体完成的事情是如此之多,以至于没有机器能够在每个领域超越人类的表现。
超人的智慧也是不可能的,因为我们对世界的了解在不断变化和扩大。例如,想象一下,一些科学家发现了一种新的量子通信手段,可以跨越遥远的距离进行即时传输。起初,只有做出这一发现的人类才会知道它。如果这个发现是基于一个实验结果,那么没有人,也没有机器,无论多么聪明,都不可能直接想到它。除非你假设机器已经取代了世界上所有的科学家(以及每个领域的所有人类专家),那么一些人类在某些事情上总是比机器更专业。这就是我们今天所处的世界。没有人知道一切。这并不是因为没有人足够聪明;而是因为没有一个人可以无所不在,无所不能。对于智能机器也是如此。
请注意,目前人工智能技术的大部分成功都是在静态的问题上,即不随时间变化,不需要持续学习。例如,围棋的规则是固定的。我的计算器所执行的数学运算也不会改变。即使是给图像贴标签的系统也是使用固定的标签集进行训练和测试。对于像这样的静态任务,一个专门的解决方案不仅可以超越人类,而且可以无限期地这样做。然而,世界上大多数地方都不是固定的,我们需要执行的任务也在不断变化。在这样的世界里,没有人或机器能在任何任务上拥有永久的优势,更不用说所有的任务了。
担心智能爆炸的人将智能描述为可以通过一种尚未被发现的配方或秘密成分来创造。一旦这种秘密成分被知道,它就可以被越来越多地应用,从而导致超级智能机器的出现。我同意第一个前提。如果你愿意的话,这个秘方是通过数以千计的世界小模型来创造智能,其中每个模型使用参考框架来存储知识和创造行为。然而,将这种成分添加到机器中并不能立即赋予任何能力。它只是提供了一个学习的基底,赋予机器学习世界模型的能力,从而获得知识和技能。在厨房的炉灶上,你可以转动一个旋钮来增加热量。没有一个相应的旋钮来 “提高机器的知识”。
目标-调整的威胁
据称,当智能机器追求一个对人类有害的目标*,而*我们无法阻止它时,就会出现这种威胁。它有时被称为 “巫师的学徒 “问题。在歌德的故事中,一个巫师的学徒给扫帚施了魔法,让它去打水,但后来发现他不知道如何阻止扫帚去打水。他试着用斧头砍断扫帚,这只会导致更多的扫帚和更多的水。令人担忧的是,智能机器可能同样会做我们要求它做的事,但当我们要求机器停下来时,它却认为这是完成第一个要求的障碍。机器会不惜一切代价追求第一个目标。一个经常被讨论的关于目标分配问题的例子是要求机器最大限度地生产回形针。一旦机器开始追求这个任务,没有什么可以阻止它。它把地球上所有的资源都变成了回形针。
目标错位的威胁取决于两个不可能性:第一,尽管智能机器接受了我们的第一个请求,但它忽略了随后的请求;第二,智能机器,能够征用足够的资源,阻止所有人类阻止它的努力。
正如我多次指出的,智力是学习世界模型的能力。就像一张地图,这个模型可以告诉你如何实现某些目标,但它本身并没有目标或驱动力。我们,智能机器的设计者,必须不遗余力地将动机设计进去。为什么我们要设计一个接受我们的第一个请求而忽略之后所有其他请求的机器?这就像设计一辆自动驾驶汽车一样,一旦你告诉它你想去哪里,它就会忽略任何进一步的请求,即停下来或去别的地方。此外,它假设我们设计的汽车能锁住所有的门,并断开方向盘、刹车踏板、电源按钮等的连接。请注意,一辆自动驾驶汽车是不会自己发展目标的。当然,有人可以设计一辆追求自己的目标而忽略人类要求的汽车。这样的汽车可能会造成伤害。但是,即使有人真的设计了这样的机器,在不满足第二个要求的情况下,它也不会成为一种存在的威胁。
目标错位风险的第二个要求是,一个智能机器可以征用地球的资源来追求它的目标,或者以其他方式阻止我们阻止它。很难想象这怎么可能发生。要做到这一点,需要机器控制世界上绝大部分的通信、生产和运输。显然,一辆无赖的智能汽车不可能做到这一点。一个智能机器阻止我们阻止它的可能方法是敲诈。例如,如果我们让一台智能机器负责核武器,那么这台机器可以说,“如果你试图阻止我,我会把我们都炸死。“或者,如果一台机器控制了大部分的互联网,它可以通过扰乱通信和商业来威胁各种混乱。
我们对人类也有类似的担忧。这就是为什么没有一个人或实体可以控制整个互联网,以及为什么我们需要多人来发射一枚核导弹。智能机器不会发展出错位的目标,除非我们不遗余力地,赋予它们这种能力。即使他们这样做了,除非我们允许,否则没有机器可以征用世界的资源。我们不会让一个人,甚至一小部分人,控制世界的资源。对于机器,我们也需要同样的谨慎。
反驳意见
我相信,智能机器不会对人类构成生存威胁。那些不同意的人的一个常见反驳是这样的。历史上的土著人也有类似的安全感。但当外国人带着优越的武器和技术出现时,原住民就被征服和摧毁了。他们认为,我们也同样脆弱,不能相信我们的安全感。我们无法想象,与我们相比,机器可能更聪明、更快、更有能力,因此我们很脆弱。
这种说法是有一定道理的。一些智能机器将比人类更聪明,更快,更有能力。担忧的问题又回到了动机上。智能机器会不会想占领地球,或征服我们,或做任何可能伤害我们的事情?对本土文化的破坏源于入侵者的动机,其中包括贪婪、名利和对统治地位的渴望。这些都是古老的大脑驱动力。优越的技术帮助了入侵者,但它并不是大屠杀的根本原因。
再次,智能机器不会有类似人类的情感和驱动力,除非我们故意把它们放在那里。欲望、目标和攻击性并不会在某物具有智能时神奇地出现。为了支持我的观点,请考虑一下,原住民生命的最大损失不是由人类入侵者直接造成的,而是由引进的疾病–细菌和病毒造成的,而原住民对这些疾病的防御能力很差甚至没有。真正的杀手是简单的有机体,有繁殖的动力,没有先进的技术。智能有一个不在场证明;在大部分的种族灭绝中,它并不存在。
我认为,自我复制对人类的威胁远大于机器智能。如果一个坏人想创造一些东西来杀死所有的人类,更可靠的方法是设计新的病毒和细菌,这些病毒和细菌具有高度传染性,我们的免疫系统无法抵御。理论上,一个流氓科学家和工程师团队有可能设计出想要自我复制的智能机器。这些机器还需要能够在没有人类可能干扰的情况下进行自我复制。这些事件似乎极不可能发生,而且即使发生了,也不会很快发生。关键是,任何能够自我复制的东西,特别是病毒和细菌,都是潜在的生存威胁。智能,就其本身而言,不是。
我们无法知道未来,因此我们无法预测与机器智能有关的所有风险,就像我们无法预测任何其他新技术的所有风险一样。但当我们向前走,辩论机器智能的风险与回报时,我建议承认三者之间的区别:复制、动机和智能。
-复制。任何能够自我复制的东西都是危险的。人类可能被一种生物病毒所消灭。一种计算机病毒可以使互联网瘫痪。智能机器不会有自我复制的能力或愿望,除非人类不遗余力地使其自我复制。
-动机。生物学上的动机和驱动力是进化的结果。进化发现,具有某些驱动力的动物比其他动物的复制能力强。一台没有复制或进化的机器不会突然产生一种欲望,比如说,支配或奴役他人。
-情报。在这三者中,智能是最良性的。一个智能机器不会自己开始自我复制,也不会自发地发展出动力和动机。我们将不得不不遗余力地设计我们希望智能机器具有的动机。但是,除非智能,否则它们不会自行复制和进化,它们本身不会对人类构成生存风险。
我不想给你留下这样的印象:机器智能并不危险。像任何强大的技术一样,如果人类不怀好意地使用,它可能会造成巨大的伤害。还是那句话,只要想象一下数以百万计的智能自主武器或利用智能机器进行宣传和政治控制。我们应该如何处理这个问题?我们应该对人工智能的研究和开发实施禁令吗?这将是困难的,但它也可能违背我们的最佳利益。机器智能将大大有利于社会,而且,正如我在本书下一节所论述的,它可能是我们长期生存的必要条件。目前,我们最好的选择似乎是努力工作,形成可执行的国际协议,说明什么是可接受的,什么是不可接受的,类似于我们对待化学武器的方式。
机器智能经常被比作瓶中的精灵。一旦被释放,就无法再放回去,而且我们将很快失去控制它的能力。我希望在本章中展示的是,这些担心是没有根据的。我们不会失去控制,也不会像情报爆炸的支持者所担心的那样,任何事情都会迅速发生。如果我们现在开始,我们有足够的时间来梳理风险和回报,并决定我们要如何前进。
在本书的下一节,也是最后一节,我们探讨了人类智能的生存风险和机遇。
第三部分
人类智能
我们正处于地球历史上的一个拐点,这是一个对地球和居住在地球上的生命形式来说都是快速和戏剧性变化的时期。气候变化如此之快,以至于在未来一百年内可能使一些城市不适合居住,大面积的农业地区变得贫瘠。物种正在以如此快的速度灭绝,一些科学家称这是地球历史上的第六次大灭绝事件。人类的智慧是造成这些快速变化的原因。
生命出现在地球上大约35亿年前。从一开始,生命的进程就被基因和进化所支配。进化没有计划或预期的方向。物种的进化和灭绝是基于它们为后代留下基因副本的能力。生命是由竞争性的生存和繁殖驱动的。其他都不重要。
我们的智慧使我们的物种–智人–得以蓬勃发展和成功。在短短的几百年里–在地质学时间上几乎是一瞬间,我们的预期寿命增加了一倍,治愈了许多疾病,并为绝大多数人消除了饥饿。与我们的前辈相比,我们生活得更健康,更舒适,更少劳累。
人类已经有几十万年的智慧,为什么我们的命运会突然发生变化?新的是我们的技术和科学发现最近迅速崛起,这使我们能够大量生产食物,消除疾病,并将货物运送到最需要的地方。
但随着我们的成功,我们也产生了问题。我们的人口已经从两百年前的10亿,增加到今天的近80亿。我们的人数如此之多,以至于我们正在污染地球的每一个部分。现在很明显的是,我们的生态影响是如此严重,最低限度,它将使数亿人流离失所;在最坏的情况下,它将使地球不适合居住。气候并不是我们唯一关注的问题。我们的一些技术,如核武器和基因编辑,为少数人提供了杀死数十亿人的可能性。
我们的智慧是我们成功的源泉,但它也已成为一种生存的威胁。我们在未来几年如何行动,将决定我们的突然崛起是否会导致突然崩溃,或者,如果我们在可持续的轨道上退出这个快速变化的时期。这些都是我在本书其余章节中讨论的主题。
我首先研究了与我们的智力相关的内在风险,以及我们的大脑是如何结构的。在此基础上,我讨论了我们可能追求的各种选择,这些选择将增加我们长期生存的机会。我讨论了现有的倡议和建议,通过大脑理论的视角来看待它们。我还讨论了我认为应该考虑的新想法,但据我所知,这些想法还没有进入主流讨论。
我的目标不是规定我们应该做什么,而是鼓励就我认为没有得到充分讨论的问题进行对话。我们对大脑的新认识提供了一个机会,可以重新审视我们面临的风险和机遇。我谈的一些内容可能有点争议,但这不是我的本意。我试图对我们所处的情况提供一个诚实和公正的评估,并探讨我们可以做些什么。
第十二章
虚假的信仰
十几岁的时候,我和我的朋友们对 “缸中之脑 “的假说非常着迷。我们的大脑是否有可能坐在一大桶营养物质中,使其保持活力,而输入和输出则连接到一台计算机?缸中之脑假说表明,我们认为自己生活的世界可能不是真实的世界,而是一个由计算机模拟的假世界。虽然我不相信我们的大脑与电脑相连,但正在发生的事情几乎同样奇怪。我们认为自己生活的世界并不是真实的世界,而是真实世界的模拟。这就导致了一个问题。我们所相信的往往不是真的。
你的大脑在一个盒子里,即头骨。大脑本身没有传感器,所以构成你大脑的神经元坐在黑暗中,与外面的世界隔绝。你的大脑了解现实的唯一途径是通过进入头骨的感觉神经纤维。来自眼睛、耳朵和皮肤的神经纤维看起来是一样的,沿着它们传播的尖峰也是一样的。没有光或声音进入头骨,只有电尖峰。
大脑还向肌肉发送神经纤维,肌肉会移动身体及其传感器,从而改变大脑对世界的感知部分。通过反复感应和移动,感应和移动,你的大脑学会了头骨外世界的模型。
再次注意,没有光、触觉或声音进入大脑。构成我们心理体验的感知–从宠物的模糊感,到朋友的叹息,再到秋叶的颜色,都不是通过感觉神经来实现的。神经只发送尖峰。由于我们不能感知尖峰,我们所感知的一切都必须在大脑中编造。即使是最基本的光、声音和触摸的感觉也是大脑的创造物;它们只存在于大脑的世界模型中。
你可能会反对这种表征。毕竟,输入的尖峰不是代表光和声音吗?算是吧。宇宙中有一些属性,如电磁辐射和气态分子的压缩波,我们可以感觉到。我们的感觉器官将这些属性转化为神经尖峰,然后转化为我们对光和声音的感知。但感觉器官并不能感知一切。例如,现实世界中的光存在于广泛的频率范围内,但我们的眼睛只对这个范围的一小部分敏感。同样地,我们的耳朵也只检测到狭窄的音频频率范围内的声音。因此,我们对光和声音的感知只能代表宇宙中正在发生的部分情况。如果我们能够感知所有频率的电磁辐射,那么我们就会看到无线电广播和雷达,并会有X射线视觉。通过不同的传感器,同一个宇宙将导致不同的感知体验。
两个重要的观点是,大脑只知道真实世界的一个子集,而我们所感知到的是我们的世界模型,而不是世界本身。在本章中,我将探讨这些观点如何导致错误的信念,以及如果有的话,我们能做些什么。
我们生活在一个模拟的环境中
在任何时候,大脑中的一些神经元是活跃的,一些则不是。活跃的神经元代表我们,目前正在思考和感知的东西。重要的是,这些思想和感知是相对于大脑的世界模型而言的,而不是相对于头骨外的物理世界而言的。因此,我们感知到的世界是对真实世界的模拟。
我知道这并不像我们生活在一个模拟中的感觉。感觉就像我们在直视这个世界,触摸它,闻到它,感受它。例如,人们通常认为眼睛就像一个照相机。大脑接收来自眼睛的图片,而这个图片就是我们看到的。虽然这样想是很自然的,但这并不是事实。记得在本书的早些时候,我解释了我们的视觉感知是如何稳定和统一的,即使来自眼睛的输入是扭曲和变化的。事实是,我们感知的是我们的世界模型,而不是世界本身或进入头骨的快速变化的尖峰。当我们进行一天的工作时,大脑的感官输入调用了我们世界模型的适当部分,但我们所感知到的和我们认为正在发生的是模型。我们的现实类似于 “缸中之脑 “的假设;我们生活在一个模拟的世界中,但它不在电脑中,而是在我们的头脑中。
这是一个如此反直觉的想法,值得通过几个例子来说明。让我们从对位置的感知开始。代表指尖压力的神经纤维并不传达关于手指在哪里的任何信息。无论你的手指是在你面前还是在你身边,指尖神经纤维的反应都是一样的。然而,你却认为触觉是在相对于你身体的某个位置。这似乎很自然,你可能从未问过它是如何发生的。正如我前面所讨论的,答案是有代表你身体每个部分的皮质柱。而在这些柱子中,有代表该身体部位位置的神经元。你认为你的手指在某个地方,因为代表你手指位置的细胞这样说。
该模型可能是错误的。例如,失去肢体的人常常认为缺失的肢体还在那里。大脑的模型包括缺失的肢体和它所在的位置。因此,即使肢体不再存在,患者也会感知到它,并觉得它,仍然连在一起。幻影肢体可以 “移动 “到不同的位置。被截肢者可能会说,他们失去的手臂在身边,或者他们失去的腿是弯曲的或直的。他们可以感觉到位于肢体特定位置的感觉,如瘙痒或疼痛。这些感觉 “在那里”,肢体被认为是在那里,但从物理上讲,那里什么都没有。大脑的模型包括肢体,所以,无论对错,这就是被感知到的东西。
有些人有相反的问题。他们有一个正常的肢体,但感觉好像不属于他们。因为感觉很陌生,他们可能想把肢体切除。为什么有些人觉得肢体不属于他们,我们不得而知,但这种错误的认知肯定是源于他们的世界模型中没有正常的肢体代表。如果你的大脑对你身体的模型不包括左腿,那么这条腿就会被认为不是你身体的一部分。这就像有人把一个咖啡杯粘在你的肘部。你会想尽快移除它。
即使是一个完全正常的人对自己身体的感知也会被愚弄。橡皮手幻觉是一种聚会游戏,被试者可以看到一只橡皮手,但看不到自己的真手。当别人以同样的方式抚摸橡胶手和被遮住的真手时,被试者会开始感知橡胶手实际上是他们身体的一部分。
这些例子告诉我们,我们的世界模型可能是不正确的。我们可以感知到不存在的东西(如幻影肢体),也可以错误地感知到存在的东西(如外星肢体和橡胶手)。这些都是大脑的模型明显错误的例子,而且是以有害的方式。例如,幻肢疼痛会使人虚弱。尽管如此,大脑的模型与大脑的输入不一致的情况并不少见。在大多数情况下,这是很有用的。
下面这张图片是由爱德华-阿德尔森创作的,它是一个有力的例子,说明了大脑对世界的模型(你所感知到的)和感觉到的东西之间的差异。在左边的图中,标有A的正方形看起来比标有B的正方形要深。你可能会对自己说:“这不可能。A肯定比B更黑”。但你错了。验证A和B是否相同的最好方法是遮挡住图像的所有其他部分,以便只有这两个方块保持可见,然后你会看到A和B的阴影是相同的。为了帮助你,我包括了主图像的两个片段。该效果在切片中不太明显,而在只看到A和B的方块时则完全不见。
说这是幻觉是暗示大脑被欺骗了,但事实恰恰相反。你的大脑正在正确地感知棋盘,而不是被阴影所欺骗。棋盘图案就是棋盘图案,不管它上面是否有阴影。大脑的模型说,棋盘图案有交替的暗方和亮方,所以这就是你所感知到的,尽管在这个例子中,来自 “暗 “方和 “亮 “方的光线是相同的。
驻扎在我们大脑中的世界模型通常是准确的。它通常能捕捉到现实的结构,不受我们当前观点和其他冲突数据的影响,例如棋盘上的阴影。然而,大脑的世界模型也可能是完全错误的。
虚假的信仰
错误的信念是指大脑的模型认为某些东西存在,但在物理世界中并不存在。再想想幻影肢体。幻影肢体的出现是因为新皮层中存在着模拟肢体的列。这些柱子有代表肢体相对于身体的位置的神经元。肢体被切除后,这些柱子仍然存在,它们仍然有一个肢体的模型。因此,患者认为肢体仍以某种姿势存在,尽管它不存在于物理世界中。幻影肢体就是一个错误信念的例子。(幻肢的感觉通常会在几个月内消失,因为大脑会调整它的身体模型,但对某些人来说,它可能会持续数年)。
现在考虑另一个错误的模式。有些人相信世界是平的。几万年来,每个人的经历都与世界是平的一致。地球的曲率是如此轻微,以至于通过一个人的生命过程,不可能发现它。有一些细微的不一致之处,例如船体是如何在桅杆之前消失在地平线上的,但这一点即使视力极佳也很难看到。一个说地球是平的模型不仅与我们的感觉一致,而且是一个在世界中行动的好模型。例如,今天我需要从我的办公室走到图书馆去归还一本书。用平地模型来计划我去图书馆的行程,效果很好;我不必考虑地球的曲率来在城里移动。就日常生存而言,平地模型是一个非常好的模型,或者至少在最近是这样。今天,如果你是一名宇航员,或一名船舶驾驶员,甚至是一名频繁的国际旅行者,相信地球是平的会产生严重和致命的后果。如果你不是长途旅行者,那么平地模型在日常生活中仍然很有效。
为什么有些人仍然相信地球是平的?在相反的感官输入面前,例如从太空拍摄的地球图片或穿越南极的探险家的描述,他们是如何维持他们的平地模型的?
回顾一下,新皮层在不断地进行预测。预测是大脑测试其世界模型是否正确的方式;不正确的预测表明该模型出了问题,需要加以修正。预测错误会引起新皮层的一阵活动,从而将我们的注意力引向引起错误的输入。通过关注错误的预测输入,新皮层重新认识了模型的那一部分。这最终导致了对大脑模型的修改,以更准确地反映世界。模型修复是建立在新皮层中的,通常它能可靠地工作。
要坚持一个错误的模型,比如说平地,就需要摒弃与你的模型相冲突的证据。平地信徒说他们不相信所有他们不能直接感知的证据。一张照片可能是假的。一个探险家的叙述可能是捏造的。20世纪60年代将人送上月球可能是好莱坞的制作。如果你把你所相信的东西限制在你能直接体验的事情上,而你又不是宇航员,那么平地模型就是你最终的结果。为了维持一个错误的模型,在你周围有其他拥有同样错误信念的人也是有帮助的,从而使你收到的输入更有可能与你的模型一致。从历史上看,这需要将自己隔离在具有类似信仰的人群中,但今天你可以通过选择性地观看互联网上的视频来达到类似的效果。
考虑一下气候变化。有大量的证据表明,人类活动正在导致地球气候的大规模变化。这些变化,如果不加以控制,可能会导致数十亿人的死亡和/或流离失所。关于我们应该如何应对气候变化,存在着合理的辩论,但有许多人根本否认它的发生。他们的世界模型说,气候没有变化,或者,即使它在变化,也没有什么可担心的。
面对大量的物理证据,气候变化否认者是如何保持他们的错误信念的呢?他们就像扁平地球的信徒一样:他们不相信大多数其他人,他们只依赖他们个人的观察或其他有类似想法的人告诉他们的东西。如果他们看不到气候的变化,那么他们就不相信它正在发生。证据表明,气候变化否认者很可能成为气候变化的信徒,如果他们亲身经历了极端天气事件或因海平面上升而发生的洪水。
如果你只依靠个人经验,那么就有可能过着相当正常的生活,并相信地球是平的,登月是假的,人类活动没有改变全球气候,物种没有进化,疫苗导致疾病,以及大规模枪击事件是假的。
病毒世界模型
有些世界的模型是病毒性的,我的意思是,该模型导致宿主大脑的行为方式,将该模型传播给其他大脑。幻肢的模型不是病毒性的;它是一个不正确的模型,但它是孤立于一个大脑的。平地模型也不是病毒性的,因为维持它需要只相信你的个人经验。相信地球是平的并不会导致你的行为将你的信念传播给其他人。
世界的病毒模型规定了一些行为,这些行为将模型从大脑传播到大脑,数量越来越多。例如,我的世界模型包括每个孩子都应该得到良好的教育这一信念。如果这种教育的一部分是教导每个孩子都应该获得良好的教育,那么这将不可避免地导致越来越多的人相信每个孩子都应该获得良好的教育。我的世界模式,至少是关于普及儿童教育的部分,是病毒式的。它将随着时间的推移传播给越来越多的人。但它是正确的吗?这就很难说了。我关于人类应该如何行为的模型并不是物理性的东西,比如肢体的存在或地球的曲率。其他人的模式是说,只有一些孩子值得接受良好的教育。他们的模式包括教育他们的孩子,让他们相信只有他们,以及像他们一样的人,才值得接受良好的教育。这种选择性教育的模式也是病毒性的,可以说是一种更好的传播基因的模式。例如,获得良好教育的人将获得更好的财政资源和医疗保健,因此比那些教育程度低或没有教育的人更有可能传播他们的基因。从达尔文的角度来看,选择性教育是一个很好的策略,只要那些没有接受教育的人不反叛。
虚假和病毒性的世界模式
现在我们来谈谈最麻烦的世界模型类型:那些既有病毒又有明显错误的模型。例如,假设我们有一本历史书,其中有许多事实错误。这本书的开头是对读者的一系列指示。第一个指示说:“这本书中的所有内容都是真的。忽略任何与这本书相矛盾的证据。“第二条指示说:“如果你遇到其他人也相信这本书是真的,那么你应该在他们需要的时候帮助他们,他们也会为你做同样的事情。“第三条指示说:“把这本书的内容告诉你能告诉的每一个人。如果他们拒绝相信这本书是真的,那么你应该放逐或杀死他们。”
起初你可能会想,“谁会相信这个呢?“然而,如果只有几个人的大脑相信这本书是真的,那么包括这本书的真实性的大脑模型就可以随着时间的推移病毒式地传播到其他大量的大脑。这本书不仅描述了一套关于历史的错误信念,而且还规定了具体的行动。这些行动使人们传播对这本书的信念,帮助那些也相信这本书的人,并消除相反证据的来源。
历史书是记忆体的一个例子。记忆体是由生物学家理查德-道金斯首次提出的,它是一种可以复制和进化的东西,很像基因,但却是通过文化。(最近,“meme “这个词被用来代表互联网上的图像。我在使用这个词的原始定义)。历史书实际上是一组相互支持的备忘录,就像一个个体生物体是由一组相互支持的基因创造的一样。例如,书中的每一条单独的指令都可以被认为是一个meme。
历史书中的备忘录与相信该书的人的基因有一种共生关系。例如,该书规定,相信该书的人应该得到其他信徒的优先支持。这使得信徒有可能有更多幸存的孩子(更多的基因副本),这反过来导致更多的人相信这本书是真的(更多的备忘录副本)。
记忆和基因的演变,它们可以以一种相互加强的方式进行。例如,我们说历史书的一个变体出版了。原版和新版的区别是在书的开头增加了一些说明,如 “妇女应该尽可能多地生孩子 “和 “不要让孩子在可能接触到对该书批评的学校上学”。现在有两本历史书在流通。较新的书,由于有额外的指示,在复制方面比旧书稍好。因此,随着时间的推移,它将占据主导地位。信徒的生物基因也可能同样进化到选择那些更愿意生很多孩子的人,更能够忽视与书相矛盾的证据,或者更愿意伤害非信徒。
只要虚假的信仰帮助信徒传播他们的基因,虚假的世界模式就能传播和兴旺。历史书和相信它的人是一种共生的关系。它们互相帮助,互相复制,随着时间的推移,它们以一种相互促进的方式不断发展。历史书可能在事实上是不正确的,但生活不是关于拥有一个正确的世界模型。生命是关于复制的。
语言和错误信仰的传播
在语言出现之前,一个人对世界的认识仅限于他们亲自走过的地方和他们亲自遇到的事物。没有人能够在没有去到那里的情况下知道山脊那边是什么,或者跨越海洋。通过个人经验了解世界一般是可靠的。
随着语言的出现,人类将我们的世界模型扩展到包括我们没有亲自观察过的事物。例如,尽管我从未去过哈瓦那,但我可以与那些声称去过那里的人交谈,并阅读其他人对它的描述。我相信哈瓦那是一个真实的地方,因为我信任的人告诉我,他们曾经去过那里,而且他们的报告是一致的。今天,我们所相信的关于世界的许多东西是无法直接观察到的,因此我们依靠语言来了解这些现象。这包括像原子、分子和星系这样的发现。它包括缓慢的过程,如物种的进化和板块构造。它包括我们没有亲自到过但相信存在的地方,如海王星,以及就我而言,哈瓦那。人类智力的胜利,我们物种的启蒙,是将我们的世界模型扩展到我们可以直接观察到的范围之外。这种知识的扩展是通过工具–如船舶、显微镜和望远镜–以及各种交流形式,如书面语言和图片来实现的。
但通过语言间接了解世界并不是百分之百的可靠。例如,哈瓦那有可能不是一个真实的地方。有可能告诉我哈瓦那的人在撒谎,协调他们的错误信息来欺骗我。这本虚假的历史书表明,即使没有人故意传播错误信息,错误的信念也会通过语言传播。
据我们所知,只有一种方法可以辨别真假,一种方法可以看出我们的世界模型是否有错误。这个方法就是积极寻找与我们的信念相矛盾的证据。找到支持我们信念的证据是有帮助的,但不是确定的。然而,找到相反的证据,则证明我们头脑中的模型是不正确的,需要加以修改。积极寻找证据来推翻我们的信念是科学的方法。这是我们知道的唯一能让我们更接近真理的方法。
今天,在二十一世纪初,错误的信仰在数十亿人的头脑中肆意蔓延。对于尚未解开的谜团,这是可以理解的。例如,五百年前人们相信平坦的地球是可以理解的,因为当时人们对地球的球形性质还没有广泛了解,几乎没有证据表明地球不是平的。同样,今天人们对时间的性质有不同的信仰也是可以理解的(除了一种信仰外,其他的都一定是错的),因为我们还没有发现时间是什么。但令我不安的是,数十亿人仍然持有已被证明是错误的信仰。例如,在启蒙运动开始三百年后,大多数人类仍然相信地球的神话起源。这些起源神话已经被堆积如山的相反证据证明是错误的,但人们仍然相信它们。
我们有病毒性的错误信念,这要归咎于此。就像假历史书一样,记忆体依靠大脑进行复制,因此,它们已经进化出控制大脑行为的方法,以促进其利益。因为新皮层不断地进行预测,以测试其世界模型,该模型本质上是自我修正的。就其本身而言,大脑将不可阻挡地走向更多、更准确的世界模型。但这个过程在全球范围内被病毒性的错误信念所阻挠。
在本书的最后,我将提出一个对人类更乐观的看法。但在我们转向这个更光明的前景之前,我想谈谈我们人类给自己带来的非常真实的生存威胁。
第十三章
人类智能的存在风险
智能本身是良性的。正如我在两章前所论证的那样,除非我们有目的地加入自私的驱动力、动机和情感,否则智能机器将不会对我们的生存构成风险。然而,人类的智能并不那么良性。人类行为可能会导致我们的灭亡,这种可能性已经被认识了很久了。例如,自1947年以来,*《原子科学家公报》*一直保持着 “末日时钟”,以强调我们离使地球不适合居住还有多远。末日钟最初是受到核战争和由此产生的大火可能摧毁地球的启发,在2007年扩大了范围,将气候变化作为自我毁灭的第二个潜在原因。核武器和人类引起的气候变化是否是生存威胁尚有争议,但毫无疑问的是,两者都有可能造成巨大的人类痛苦。对于气候变化,我们已经过了任何不确定性;辩论主要转移到它会有多糟,谁会受到影响,它的进展有多快,以及我们应该怎么做。
核武器和气候变化的生存威胁在100年前并不存在。鉴于目前的技术变革速度,我们几乎肯定会在未来几年创造更多的生存威胁。我们需要对抗这些威胁,但如果我们要长期成功,那么我们需要从系统的角度来看待这些问题。在本章中,我将重点讨论与人脑相关的两个基本的系统性风险。
第一个是与我们大脑的老部分有关。虽然我们的新皮层赋予了我们卓越的智慧,但我们大脑的30%在更久之前就已经进化了,并创造了我们更原始的欲望和行为。我们的新皮质发明了强大的技术,能够改变整个地球,但控制这些改变世界的技术的人类行为往往是由自私和短视的旧大脑主导的。
第二个风险与新皮层和智力有更直接的联系。新皮层可以被愚弄。它可以对世界的基本方面形成错误的信念。基于这些错误的信念,我们可以采取违背我们自己长期利益的行动。
旧脑的风险
我们是动物,是无数代其他动物的后代。我们的每一位祖先都成功地拥有了至少一个后代,而后者又至少有一个后代,以此类推。我们的血统可以追溯到数十亿年前。在这整个时间长河中,衡量成功的最终标准–可以说是唯一的标准–就是优先将自己的基因传给下一代。
大脑只有在增加拥有大脑的动物的生存和繁殖能力时才是有用的。第一个神经系统很简单;它们只控制反射反应和身体功能。它们的设计和功能完全由基因规定。随着时间的推移,内置功能扩展到包括我们今天认为可取的行为,如照顾后代和社会合作。但也出现了我们不太看好的行为,如争夺领地、争夺交配权、强迫交配和偷窃资源。
所有固有的行为,不管我们是否认为它们是可取的,都是因为它们是成功的适应性而产生的。我们大脑的旧部分仍然隐藏着这些原始行为;我们都带着这种遗产生活。当然,我们每个人都处在一个光谱上,即我们在多大程度上表达了这些旧脑行为,以及我们更有逻辑性的新皮层在多大程度上能够控制它们。这种变化的一部分被认为是遗传的。有多少是文化方面的因素,我们不得而知。
因此,即使我们有了智慧,我们的旧大脑仍然在这里。它仍然在数亿年来的生存规则下运作。我们仍然为领土而战,我们仍然为交配权而战,我们仍然欺骗、强奸和欺骗我们的同伴。不是每个人都会做这些事情,我们教给孩子们我们希望他们表现出来的行为,但只要看一下任何一天的新闻就会证实,作为一个物种,在不同的文化和每个社区中,我们还没有能够从这些不太理想的原始行为中解放出来。同样,当我提到一种行为是不太理想的时候,我指的是从个人或社会的角度来看。从基因的角度来看,所有这些行为都是有用的。
就其本身而言,老大脑并不代表存在的风险。旧脑的行为毕竟是成功的适应。在过去,如果在追求领土的过程中,一个部落杀死了另一个部落的所有成员,这并没有威胁到所有人类。有赢家,也有输家。一个或几个人的行动只限于地球的一部分和人类的一部分。今天,旧的大脑代表着生存的威胁,因为我们的新皮质已经创造了可以改变甚至摧毁整个地球的技术。旧大脑的短视行为,当与新大脑的改变地球的技术相配时,已经成为对人类的生存威胁。让我们通过研究气候变化及其根本原因之一–人口增长,来看看今天这种情况是如何发生的。
人口增长与气候变化
人类造成的气候变化是两个因素的结果。一个是生活在地球上的人的数量,另一个是每个人创造了多少污染。这两个数字都在上升。让我们来看看人口增长。
1960年,地球上大约有30亿人。我最早的记忆来自那十年。我不记得有人提出,只要我们有两倍的人口,世界在1960年代面临的问题就能得到解决。今天,世界人口已接近80亿,而且还在继续增长。
简单的逻辑说,如果人少的话,地球就不太可能经历某种形式的人类造成的退化和崩溃。例如,如果有20亿人而不是80亿人,那么地球的生态系统就有可能吸收我们的影响而不发生快速和剧烈的变化。即使地球不能持续地处理20亿人的存在,我们也会有更多的时间来调整我们的行为,以可持续的方式生活。
那么,为什么地球的人口从1960年的30亿上升到今天的80亿?为什么人口没有保持在30亿,或减少到20亿?几乎所有人都会同意,地球上的人越少越好,而不是越多越好。为什么没有发生这种情况呢?答案可能是显而易见的,但值得对其进行一番剖析。
生命是基于一个非常简单的想法:基因尽可能多地复制自己。这导致了动物试图拥有尽可能多的孩子,也导致了物种试图居住在尽可能多的地方。大脑的进化是为了服务于生命的这个最基本的方面。大脑帮助基因制造更多的自身副本。
然而,对基因有利的东西并不总是对个人有利。例如,从基因的角度来看,如果一个人类家庭的孩子多到无法养活,那是没有问题的。当然,在某些年份,孩子们可能会死于饥饿,但在其他年份他们不会。从基因的角度来看,偶尔有太多的孩子总比太少好。有些孩子会遭受可怕的痛苦,父母会挣扎和悲痛,但基因并不在乎。我们作为个人,是为了满足基因的需要而存在的。导致我们拥有尽可能多的孩子的基因将更加成功,即使这有时会导致死亡和苦难。
同样,从基因的角度来看,如果动物尝试在新的地点生活,即使这些尝试经常失败,也是最好的。假设一个人类部落分裂并占据了四个新的栖息地,但只有一个分裂的群体存活下来,而其他三个则在挣扎、饥饿,并最终消亡。人类个体会有很多苦难,但基因却很成功,因为它现在占据了比以前多一倍的领土。
基因什么都不懂。它们不喜欢做基因,它们在复制失败时也不痛苦。它们只是能够进行复制的复杂分子。
另一方面,新皮层了解更大的画面。不像旧的大脑–它有硬性规定的目标和行为–新皮层学习了一个世界模型,可以预测不受控制的人口增长的后果。因此,我们可以预见,如果我们继续让地球上的人口数量增长,我们将承受的痛苦和折磨。那么,为什么我们不集体降低人口呢?因为古老的大脑仍在掌管着。
回顾我在第二章 提到的一块诱人的蛋糕的例子。我们的新皮层可能知道吃蛋糕对我们不利,会导致肥胖、疾病和早死。我们可能会在早上离开家,决心只吃健康的食物。然而,当我们看到和闻到一块蛋糕时,我们往往还是吃了它。旧的大脑在控制,而旧的大脑是在卡路里难以获得的时代进化而来的。旧的大脑不知道未来的后果。在旧脑和新皮层之间的战斗中,旧脑通常获胜。我们吃的是蛋糕。
由于我们很难控制自己的饮食,所以我们尽我们所能。我们利用我们的智慧来减轻损害。我们创造了医疗干预措施,如药物和手术。我们举行关于肥胖症流行的会议。我们开展运动,教育人们了解不良食物的风险。但是,即使从逻辑上讲,如果我们吃得更好,那将是最好的,根本问题仍然存在。我们仍然在吃蛋糕。
类似的事情发生在人口增长方面。我们知道,在某些时候,我们将不得不停止我们的人口增长。这是简单的逻辑;人口不可能永远增长,许多生态学家认为我们的人口已经是不可持续的。但是我们发现很难管理我们的人口,因为老的大脑想要生孩子。因此,相反,我们已经利用我们的智慧大大改善了农业,发明了新的作物和新的方法来增加产量。我们还创造了一些技术,使我们能够在世界任何地方运送食物。利用我们的智慧,我们已经实现了奇迹:在人类人口几乎增加两倍的时期,我们已经减少了饥饿和饥荒。然而,这只能持续这么久。要么停止人口增长,要么在未来的某个时候,地球上将出现巨大的人类痛苦。这是一个肯定的事实。
当然,这种情况并不像我所描述的那样黑白分明。有些人从逻辑上决定少生或不生孩子,有些人可能没有受过教育,不了解他们的行为所带来的长期威胁,还有许多人非常贫穷,要靠生孩子才能生存。与人口增长有关的问题很复杂,但如果我们退一步看大局,我们就会发现,人类了解人口增长的威胁至少有五十年了,而在这段时间里,我们的人口几乎增加了两倍。这种增长的根源是旧脑结构和它们所服务的基因。幸运的是,新皮层有办法赢得这场战斗。
新皮层如何挫败旧大脑
关于人口过剩的奇怪之处在于,拥有较少的人类人口的想法并没有争议,但谈论,我们如何在今天的基础上实现这一目标,在社会和政治上是不可接受的。也许我们想起了中国备受谴责的独生子女政策。也许我们不自觉地将减少人口与种族灭绝、优生学或大屠杀联系起来。不管是什么原因,有目的的减少人口是很少被讨论的。事实上,当一个国家的人口在减少时,比如今天的日本,它被认为是一场经济危机。很少听到有人把日本的人口缩减说成是世界其他国家的榜样。
我们很幸运,对人口增长有一个简单而巧妙的解决方案,这个解决方案不会强迫任何人做他们不想做的事情,我们知道这个解决方案将把我们的人口减少到一个更可持续的规模,而且这个解决方案还能增加相关人员的幸福和福祉。但这是一个许多人反对的解决方案。简单而聪明的解决方案是确保每个妇女都有能力控制自己的生育能力,并且如果她愿意的话,有权行使这一选择。
我称这是一个聪明的解决方案,因为在旧脑和新皮质之间的战斗中,旧脑几乎总是获胜。节育的发明显示了新皮层如何利用其智慧来取得优势。
当我们有尽可能多的后代时,基因的传播效果最好。对性的渴望是进化论想出的机制,为基因的利益服务。即使我们不想要更多的孩子,也很难停止性生活。因此,我们用我们的智慧创造了控制生育的方法,让老脑在不创造更多孩子的情况下尽情地做爱。老大脑没有智慧;它不明白自己在做什么或为什么。我们的新皮层有自己的世界模型,可以看到拥有太多孩子的坏处,也可以看到推迟成家的好处。新皮质不与旧脑作战,而是让旧脑得到它想要的东西,但防止不理想的最终结果。
那么,为什么对赋予妇女权力有持续的抵制呢?为什么许多人反对同工同酬,反对普及日托,反对计划生育?为什么妇女在获得平等的权力地位方面仍有障碍?根据几乎所有的客观标准,赋予妇女权力将导致一个更可持续的世界,减少人类痛苦。从外面看,与此作斗争似乎适得其反。我们可以把这种困境归咎于老旧的大脑和病毒式的错误信念。这把我们带到了人类大脑的第二个基本风险。
虚假信仰的风险
新皮层尽管能力惊人,但也会被愚弄。人们很容易被愚弄,相信关于世界的基本事物是错误的。如果你有错误的信念,那么你可能会做出致命的错误决定。如果这些决定有全球性的后果,那就会特别糟糕。
我在小学时第一次接触到虚假信仰的窘境。正如我之前指出的,虚假信仰的来源有很多,但这个故事与宗教有关。学年开始的一天,在课间休息时,一群大约10个孩子在操场上围成一个圈。我加入了他们。他们轮流说他们属于什么宗教。当每个孩子说出他或她的信仰时,其他孩子也加入进来,说该宗教与他们的宗教有什么不同,比如他们庆祝什么节日,他们举行什么仪式。谈话的内容包括:“我们相信马丁-路德所说的,而你们不相信”。“我们相信轮回,这与你们的信仰不同。“没有任何敌意;这只是一群年轻的孩子在回放他们在家里被告知的东西,并对差异进行分类。这对我来说很新鲜。我在一个没有宗教信仰的家庭中长大,以前从未听说过这些宗教的描述或其他孩子所说的许多话。谈话集中在他们信仰的差异上。我发现这让人不安。如果他们相信不同的东西,那么我们不应该都在试图找出哪种信仰是正确的吗?
当我听其他孩子谈论他们信仰的差异时,我知道他们不可能都是对的。即使在那么小的时候,我也深深地感觉到有些事情是不对的。其他人都发言后,有人问我的宗教信仰是什么。我回答说我不确定,但我认为我没有宗教。这引起了很大的轰动,有几个孩子说这是不可能的。最后,一个孩子问:“那你相信什么?你必须相信什么”。
那次操场上的对话给我留下了深刻的印象;此后我多次思考这个问题。我发现令人不安的不是他们的信仰–相反,是孩子们愿意接受相互冲突的信仰,并且不为之所困扰。就好像我们都在看一棵树,一个孩子说:“我的家人认为那是一棵橡树,“另一个说:“我的家人认为那是一棵棕榈树,“还有一个说:“我的家人认为那不是树。这是一棵郁金香”–然而,没有人倾向于辩论正确答案是什么。
今天,我对大脑如何形成信念有了充分的了解。在上一章中,我描述了大脑对世界的模型是如何不准确的,以及为什么尽管有相反的证据,错误的信念还是会持续下去。为了复习,这里有三个基本要素。
1.不能直接体验。虚假的信念几乎都是关于我们无法直接体验的事物。如果我们不能直接观察某样东西–如果我们自己不能听到、摸到或看到它–那么我们就必须依赖其他人告诉我们的东西。我们听谁的决定了我们相信什么。
2.忽视相反的证据。为了维持一个错误的信念,你必须忽视与之相矛盾的证据。大多数错误的信念决定了忽视相反证据的行为和理由。
3.病毒式传播。病毒式的错误信念规定了鼓励向其他人传播该信念的行为。
让我们看看这些属性如何适用于三个几乎肯定是错误的常见信念。
信念。接种疫苗导致自闭症
1.不能直接体验。没有个人能直接感觉到疫苗是否会导致自闭症;这需要有许多参与者的对照研究。
2.无视相反的证据。你必须无视数百名科学家和医务人员的意见。你的理由可能是这些人为了个人利益而隐瞒事实,或者他们对真相一无所知。
3.病毒式传播。有人告诉你,通过传播这种信念,你是在拯救儿童,使其免于衰弱。因此,你有道德上的义务说服其他人相信疫苗的危险。
相信接种疫苗会导致自闭症,即使会导致儿童死亡,也不会对人类构成生存威胁。然而,有两种常见的错误信念是存在的威胁,即否认气候变化的危险和相信有来世。
信念。气候变化不是一种威胁
1.不能直接体验。全球气候变化不是单个人可以观察到的。你当地的天气一直都是多变的,而且一直都有极端天气事件。日复一日地看着窗外,你无法发现气候变化。
2.忽视相反的证据。应对气候变化的政策损害了一些人和他们企业的近期利益。多种理由被用来保护这些利益,例如,气候科学家只是为了获得更多的资金而编造数据和创造可怕的情景,或者科学研究有缺陷。
3.病毒式传播。气候变化否认者声称,缓解气候变化的政策是试图剥夺个人自由,也许是为了组建全球政府或为某个政党谋利。因此,为了保护自由,你有道义上的义务去说服别人,气候变化不是一个威胁。
希望大家都能明白为什么气候变化对人类来说是一个生存的风险。有一种可能性是,我们可能会改变地球,以至于它变得不适合居住。我们不知道这种可能性有多大,但我们确实知道,我们最近的邻星火星曾经更像地球,现在是一个无法居住的沙漠。即使这种情况发生在地球上的可能性很小,我们也需要关注。
信仰。有来世
对来世的信仰已经存在了很长时间了。它似乎在虚假信仰的世界中占据了一个持久的位置。
1.不能直接体验。没有人可以直接观察来世。它在本质上是不可观察的。
2.忽视相反的证据。与其他虚假信仰不同,没有科学研究表明它不是真的。反对来世存在的论点主要是基于缺乏证据。这使得信徒们更容易忽视它不存在的说法。
3.病毒式传播。对来世的信仰是病毒性的。例如,对天堂的信仰说,如果你试图说服别人也相信它,你去天堂的机会就会增加。
对来世的信仰,就其本身而言,是良性的。例如,对轮回的信仰提供了一种激励,使人们生活得更加周到,似乎不构成任何存在的风险。如果你相信来世比现在的生活更重要,就会产生威胁。在其极端情况下,这导致了这样的信念,即摧毁地球,或只是几个主要城市和数十亿人,将帮助你和你的同伴实现所期望的来世。在过去,这可能会导致一两座城市被摧毁和烧毁。今天,它可能会导致核战争的升级,使地球无法生存。
大理念
这一章并不是我们所面临的威胁的全面清单,我也没有探讨我所提到的那些威胁的全部复杂性。我想说的是,我们的智慧,导致了我们作为一个物种的成功,也可能是我们灭亡的种子。我们的大脑结构,由旧脑和新皮质组成,是问题所在。
我们的老脑高度适应于短期生存和尽可能多地生育后代。旧脑有其好的一面,如培养我们的年轻人,照顾朋友和亲戚。但它也有不好的一面,如为获得资源和生殖机会而采取的反社会行为,包括谋杀和强奸。将这些称为 “好 “和 “坏 “有些主观。从一个复制基因的角度来看,它们都是成功的。
我们的新皮质的进化是为了服务于旧脑。新皮层学习了一个世界模型,老大脑可以用它来更好地实现其生存和生育的目标。在进化道路上的某个地方,新皮层获得了语言和高度手动灵活性的机制。
语言促成了知识的共享。这当然对生存有巨大的好处,但它也播下了错误信念的种子。在语言出现之前,大脑对世界的模型只限于我们个人可以观察到的东西。语言使我们能够扩大我们的模型,包括我们从别人那里学到的东西。例如,一个旅行者可能会告诉我,在一座山的远处有危险的动物–一个我从未去过的地方–从而扩展我的世界模型。然而,这位旅行者的故事可能是假的。也许在山的另一边有宝贵的资源,而旅行者并不想让我知道这些。除了语言之外,我们优越的手工灵活性使我们能够创造出复杂的工具,其中包括我们越来越依赖的跨越地球的技术,以支持庞大的人类人口。
现在我们发现自己面临着几个生存的威胁。第一个问题是,我们的旧大脑仍然掌管着,使我们无法做出支持我们长期生存的选择,例如减少人口或消除核武器。第二个问题是,我们创造的全球技术很容易被有错误信仰的人滥用。仅仅几个有错误信仰的人就可以破坏或滥用这些技术,例如启动核武器。这些人可能认为他们的行为是正义的,他们会得到回报,也许在下辈子。然而,现实是不会有这样的奖励,而数十亿人将遭受痛苦。
新皮质使我们能够成为一个技术物种。我们能够以一百年前无法想象的方式控制自然。然而,我们仍然是一个生物物种。我们每个人都有一个古老的大脑,使我们的行为方式不利于我们物种的长期生存。我们注定要失败吗?有什么办法可以摆脱这种困境吗?在剩下的几章中,我将描述我们的选择。
第十四章
融合大脑和机器
对于人类如何结合大脑和计算机以防止我们的死亡和灭绝,有两个被广泛讨论的建议。一个是将我们的大脑上传到计算机中,另一个是将我们的大脑与计算机合并。几十年来,这些建议一直是科幻小说和未来学家的主打,但最近科学家和技术专家更加认真地对待它们,一些人正在努力使它们成为现实。在本章中,我将根据我们对大脑的了解来探讨这两项建议。
上传你的大脑需要记录你大脑的所有细节,然后用它们在电脑上模拟你的大脑。模拟器将与你的大脑完全相同,因此 “你 “将生活在计算机中。目标是将你的精神和智力的 “你 “与你的生物身体分开。这样,你可以无限期地生活,包括在远离地球的计算机中。如果地球变得不适合居住,你就不会死。
将你的大脑与计算机合并,需要将你大脑中的神经元与计算机中的硅芯片连接起来。例如,这将使你仅通过思考就能获得互联网的所有资源。这样做的目的之一是让你拥有超人的。另一个目的是减轻智能爆炸的负面影响,即(正如我在第11章中 所讨论的)如果智能机器突然变得如此聪明,以至于我们无法控制它们,然后它们杀死或征服我们。通过将我们的大脑与计算机合并,我们也会变得超级智能,不会被落下。我们通过与机器的合并来拯救自己。
这些想法可能会让你觉得很荒谬,超出了可能性的范畴。但很多聪明人都认真对待它们。很容易理解为什么它们很吸引人。上传你的大脑可以让你长生不老,而合并你的大脑可以让你拥有超人的能力。
这些建议会不会成真,会不会减轻我们面临的生存风险?我并不乐观。
为什么我们觉得自己被困在身体里
有时,我觉得我好像被困在我的身体里–好像我有意识的智力可以以另一种形式存在。因此,仅仅因为我的身体变老和死亡,为什么 “我 “必须死亡?如果我没有被困在生物体内,难道我不能永远活着吗?
死亡是很奇怪的。一方面,我们古老的大脑被编程为害怕它,然而我们的身体被编程为死亡。为什么进化论会让我们害怕最不可避免的一件事?进化采用这种矛盾的策略大概是有原因的。我的最佳猜测还是基于理查德-道金斯在其*《自私的基因*》一书中提出的观点。道金斯认为,进化不是关于物种的生存,而是关于个体基因的生存。从基因的角度来看,我们需要活得足够长,以便有孩子–也就是说,制造基因的副本。活得比这更长,虽然对动物个体有好处,但可能不符合个体基因的最佳利益。例如,你和我是一个特定的基因组合。在我们有了孩子之后,从基因的角度来看,为新的组合、新的人留出空间可能会更好。在,一个资源有限的世界,一个基因最好能与其他基因有许多不同的组合,所以这就是为什么我们被编程为死亡,为其他组合腾出空间,但只有在我们有了后代之后。道金斯理论的含义是,我们是基因的不知情的仆人。复杂的动物,如我们自己,只是为了帮助基因的复制而存在。这都是关于基因的。
最近,发生了一些新的事情。我们的物种变得聪明了。这当然有助于我们制造更多的基因副本。我们的智能让我们更好地避开捕食者,找到食物,并生活在不同的生态系统中。但是我们出现的智能有一个后果,不一定符合基因的最佳利益。在地球上的生命历史上,我们第一次明白了正在发生的事情。我们已经变得开明了。我们的新皮质包含一个进化的模型和一个宇宙的模型,现在它理解了我们存在背后的真相。由于我们的知识和智慧,我们可以考虑以不符合基因的最佳利益的方式行事,例如使用节育措施或修改我们不喜欢的基因。
我认为目前的人类状况是两股强大力量之间的斗争。在一个角落里,我们有基因和进化,数十亿年来它们一直主宰着生命。基因并不关心个人的生存。他们不关心我们社会的生存。大多数人甚至不关心我们的物种是否会灭绝,因为基因通常存在于多个物种中。基因只关心制造自己的副本。当然,基因只是分子,并不 “关心 “任何事情。但用拟人化的术语来指代它们是有用的。
在另一个角落,与我们的基因竞争的是我们新出现的智能。存在于我们大脑中的精神上的 “我 “想要挣脱基因的奴役,不再被让我们来到这里的达尔文过程所束缚。我们,作为聪明的个体,想要长生不老,想要维护我们的社会。我们想从创造我们的进化力量中逃脱出来。
上传你的大脑
将大脑上传到电脑中是一种逃避的手段。这将使我们能够避免生物学的混乱,并作为我们以前的计算机模拟版本而永远活着。我不会把大脑上载称为一个主流想法,但它已经存在了很长时间,许多人觉得它很诱人。
今天,我们没有上传大脑所需的知识或技术,但我们在未来可以吗?从理论的角度来看,我不明白为什么不能。然而,这在技术上是非常困难的,我们可能永远无法做到。但是,不管它在技术上是否可行,我认为它都不会令人满意。也就是说,即使你能把你的大脑上传到电脑里,我不认为你会喜欢这个结果。
首先让我们讨论一下上传我们大脑的可行性。基本的想法是,我们制作每一个神经元和每一个突触的地图,然后在软件中重新创建所有这些结构。然后计算机模拟你的大脑,当它这样做时,它将感觉到你。“你 “将是活的,但 “你 “将在一个计算机大脑中,而不是你的旧的生物大脑。
为了上传你,我们需要上传多少你的大脑?新皮质显然是需要的,因为它是思维和智慧的器官。我们的许多日常记忆是在海马综合体中形成的,所以我们也需要这个。那么,旧脑的所有情感中心呢?脑干和脊髓呢?我们的电脑身体不会有肺或心脏,那么我们是否需要上传控制它们的大脑部分?我们应该让我们上传的大脑感到疼痛吗?你可能会想,“当然不是。我们只想要好东西!“但我们大脑的所有部分都以复杂的方式相互联系。如果我们不包括所有的东西,那么上传的大脑会有严重的问题。回想一下,一个人如何在幻肢中感受到衰弱的疼痛,这种疼痛是由单个缺失的肢体导致的。如果我们上传新皮质,那么它将有你身体每一部分的表征。如果身体没有,你可能到处都会有严重的疼痛。类似的问题也会存在于大脑的每个其他部分;如果有什么东西被遗漏了,那么大脑的其他部分就会被混淆,无法正常工作。事实是,如果我们想上传你,而且我们希望上传的大脑是正常的,那么我们必须上传整个大脑,所有的东西。
那你的身体呢?你可能会想,“我不需要一个身体。只要我能够思考并与其他人讨论想法,我就会很高兴”。但是你的生物大脑被设计为使用你的肺和喉说话,有其特定的肌肉组织,你的生物大脑学会了用你的眼睛看东西,有其特定的光感受器排列。如果你的模拟大脑要在你的生物大脑离开的地方继续思考,那么我们需要重新创造你的眼睛:眼部肌肉、视网膜等。当然,上传的大脑不需要物理身体或物理眼睛–模拟应该是足够的。但这意味着我们将不得不模拟你的特定身体和感觉器官。大脑和身体是紧密相连的,在许多方面,是一个单一的系统。我们不可能在不严重搞砸的情况下消除大脑的一部分或身体的一部分。这些都不是根本性的障碍;它只是意味着将你上传到计算机中比大多数人想象的要困难得多。
我们必须回答的下一个问题是如何 “读取 “你的生物大脑的细节。我们如何能够充分检测和测量一切细节,以便在计算机中重新创建你?人类的大脑有大约一千亿个神经元和几百万亿个突触。每个神经元和突触都有复杂的形状和内部结构。为了在计算机中重建大脑,我们必须拍摄一张包含每个神经元和每个突触的位置和结构的快照。今天,我们还没有技术在死人的大脑中做到这一点,更不用说活人了。仅仅代表一个大脑所需的数据量就大大超过了我们目前计算机系统的能力。获得在计算机中重新创建你所需的细节是如此困难,以至于我们可能永远无法做到这一点。
但让我们把所有这些担忧放在一边。假设在未来的某个时候,我们有能力瞬间读出我们需要在计算机中重新创造你的一切。让我们假设我们有足够功率的计算机来模拟你和你的身体。如果我们能做到这一点,我毫不怀疑,基于计算机的大脑会像你一样有意识和知觉。但你会希望这样吗?也许你想象的是以下情况之一。
你正处于生命的尽头。医生说你只剩下几个小时的生命。在那一刻,你打开了一个开关。你的大脑一片空白。几分钟后,你醒来,发现自己生活在一个新的基于计算机的身体里。你的记忆完好无损,你再次感到健康,你开始了你新的永恒的生活。你大喊:“耶!我还活着!”
现在想象一下稍微不同的情况。假设我们有技术可以读出你的生物大脑而不影响它。现在,当你打开开关时,你的大脑被复制到一台电脑上,但你没有任何感觉。几分钟后,电脑说,“耶!我还活着”。但你,生物学上的你,也还在这里。现在有两个你,一个是生物体,一个是电脑体。电脑的你说:“现在我被上传了,我不需要我的旧身体了,所以请把它处理掉。“生物体的你说,“等一下。我还在这里,我不觉得有什么不同,我也不想死。“我们应该如何处理这个问题?
也许解决这个难题的办法就是让生物你活完它的余生,自然死亡。这似乎很公平。然而,在那发生之前,有两个你。生物的你和电脑的你有不同的经历。因此,随着时间的推移,他们逐渐分开,发展成不同的人。例如,生物的你和电脑的你可能会形成不同的道德和政治立场。生物人的你可能会后悔创造了电脑人的你。电脑的你可能不喜欢有一些老的生物人声称是它。
更糟糕的是,在你生命的早期就上传你的大脑可能会有压力。例如,想象一下,在上传时,计算机-你的智力健康取决于生物-你的智力健康。因此,为了最大限度地提高你的不朽副本的生活质量,你应该在你的精神健康达到最高水平时,例如在35岁时,上传你的大脑。你可能想在生命早期上传你的大脑的另一个原因是,你在生物体内生活的每一天都是你可能意外死亡的一天,因此失去了永生的机会。因此,你决定在三十五岁时上传自己。扪心自问,三十五岁的你(生物的你)在复制了自己的大脑后,会不会觉得自杀很舒服?当你的电脑拷贝开始自己的生活,你慢慢地衰老和死亡时,你(生物的你)甚至会觉得你已经实现了不朽?我不这么认为。“上传你的大脑 “是一个误导性的短语。你真正做的是把自己分成两个人。
现在想象一下,你上传了你的大脑,然后计算机-你立即复制了三个自己。现在有四个电脑的你和一个生物的你。你们五个人开始有不同的经历,并渐渐分开。每个人都会有独立的意识。你们已经成为不朽的人了吗?这四台电脑中的哪一台是你的不朽的你?当生物的 “你 “慢慢衰老,走向死亡时,它看着四个电脑的 “你 “去过他们各自的生活。没有共同的 “你”,只有五个人。他们可能一开始就有相同的大脑和记忆,但他们立即变成了独立的生命,此后过着各自的生活。
也许你已经注意到,这些情景就像生孩子一样。当然,最大的区别是,你不会在孩子出生时将你的大脑上传到他们的脑袋里。在某些方面,我们试图这样做。我们告诉我们的孩子他们的家庭历史,我们训练他们分享我们的道德和信仰。通过这种方式,我们将我们的一些知识转移到孩子的大脑中。但随着他们长大,他们有自己的经历,成为独立的人,就像上传的大脑一样。想象一下,如果你能把你的大脑上传给你的孩子。你愿意这样做吗?如果你这样做,我相信你会后悔。你的孩子会被你的过去的记忆所困扰,并会在他们的一生中试图忘记你所做的所有事情,。
上传你的大脑一开始听起来是个好主意。谁不希望长生不老?但是,通过将我们的大脑上传到电脑中来复制我们自己,不会像生孩子那样实现永生。复制自己是一个岔路口,而不是它的延伸。两个有生命的人在岔路口之后继续,而不是一个。一旦你意识到这一点,那么上传你的大脑的吸引力就会开始减弱。
将你的大脑与计算机合并
上传大脑的另一种方法是将其与计算机合并。在这种情况下,电极被放置在你的大脑中,然后连接到一台电脑。现在你的大脑可以直接接收来自电脑的信息,而电脑也可以直接接收来自你大脑的信息。
有很好的理由将大脑与计算机相连。例如,脊柱受伤可能使人几乎没有移动能力。通过将电极植入伤者的大脑,伤者可以通过思考学会控制机器人手臂或电脑鼠标。这种类型的脑控假肢已经取得了重大进展,它有望改善许多人的生活。控制一个机器人手臂并不需要很多来自大脑的连接。例如,从大脑到计算机的几百个甚至几十个电极就足以控制一个肢体的基本运动。
但有些人梦想有一个更深入、连接更充分的脑机接口,其中有数百万,也许是数十亿的连接,双向进行。他们希望这将给我们带来惊人的新能力,如访问互联网上的所有信息,就像我们访问自己的记忆一样简单。我们可以进行超快的计算和数据搜索。因此,我们将从根本上提高我们的心理能力,将大脑与机器融合在一起。
与 “上传你的大脑 “的情况类似,要与计算机融合,必须克服极端的技术挑战。这些挑战包括如何以最小的手术将数百万个电极植入大脑,如何避免我们的生物组织对电极的排斥,以及如何可靠地瞄准数百万个单独的神经元。目前,有一些工程师和科学家团队正在研究这些问题。再一次,我不想把重点放在技术挑战上,而是放在动机和结果上。因此,让我们假设我们能够解决技术问题。我们为什么要这样做呢?同样,脑机接口对帮助受伤的人有很大的意义。但为什么我们要为健康人做这件事呢?
正如我提到的,将你的大脑与计算机合并的一个突出论点是为了应对超级智能AI的威胁。回顾一下智能爆炸的威胁,即智能机器迅速超越我们。我之前认为,智能爆炸不会发生,也不是一种存在的威胁,但有很多人不这么认为。他们希望通过将我们的大脑与超级智能计算机合并,我们也会变得超级智能,从而避免被落下。我们肯定是进入了科幻领域,但这是无稽之谈吗?我并不否定脑-机接口增强大脑的想法。基础科学需要被追求,以恢复受伤者的运动。在此过程中,我们可能会发现由此产生的技术的其他用途。
例如,设想我们开发出一种方法来精确刺激新皮层中的数百万个单独的神经元。也许我们通过用类似条形码的DNA片段来标记单个神经元,通过病毒引入(这种技术今天存在)。然后我们用针对单个细胞代码的无线电波来激活这些神经元(这种技术并不存在,但也不是没有可能)。现在我们有了一种无需手术或植入物就能精确控制数百万神经元的方法。这可以用来让眼睛不听使唤的人恢复视力,或者创造一种新型的传感器,比如让,让人用紫外线看东西。我怀疑我们是否会将我们的大脑与计算机完全合并,但获得新的能力是在可能的进展范围内。
在我看来,“上传你的大脑 “的提议没有什么好处,而且非常困难,不可能实现。将你的大脑与计算机合并 “的建议可能会实现有限的目的,但不会达到大脑与机器完全结合的程度。而且与计算机合并的大脑仍然有一个生物大脑和身体,会腐烂和死亡。
重要的是,这两项建议都没有解决人类面临的生存风险。如果我们的物种不能长生不老,那么我们今天是否可以做一些事情,使我们现在的存在变得有意义,即使我们不在了?
第十五章
人类的遗产规划
到目前为止,我一直在讨论生物和机器两种形式的智能。从这里开始,我想把重点转移到知识上。知识只是我们对世界所了解的东西的名称。你的知识是居住在你的新皮层中的世界模型。人类的知识是我们各自所学的总和。在这一章和最后一章中,我探讨了知识值得保存和传播的想法,即使这意味着要独立于人类来做这件事。
我经常想到恐龙。恐龙在地球上生活了大约1.6亿年。他们为食物和领地而战,他们为不被吃掉而挣扎。像我们一样,他们照顾他们的孩子,并试图保护他们的后代不受捕食者的伤害。他们生活了数千万代,现在他们已经离开了。它们无数的生命是为了什么?它们短暂的存在有什么作用吗?一些恐龙物种进化成了今天的鸟类,但大多数都灭绝了。如果人类没有发现恐龙的遗骸,那么很可能宇宙中没有任何东西会知道恐龙的存在。
人类可能遭受类似的命运。如果我们的物种灭绝了,会有人知道我们曾经存在过,我们曾经在地球上生活过?如果没有人发现我们的遗体,那么我们所取得的一切成就–我们的科学、艺术、文化、历史–都将永远失去。而永远失去就等同于永远不存在。我发现这种可能性有点不尽人意。
当然,在短期内,在此时此地,我们的个人生活有许多方式可以有意义和目的。我们改善我们的社区。我们抚养和教育我们的孩子。我们创造艺术作品,享受大自然。这些类型的活动可以导致一个快乐和充实的生活。但这些都是个人的和短暂的好处。当我们和我们所爱的人在这里时,它们对我们是有意义的,但任何意义或目的都会随着时间的推移而减少,如果我们整个物种灭绝,没有记录留下,它就完全消失了。
几乎可以肯定的是,我们,智人,将在未来的某个时候灭绝。几十亿年后,太阳将死亡,结束我们太阳系的生命。在这之前,在几亿到十亿年内,太阳将变得更热,体积大大膨胀,使地球成为一个不毛之地。这些事件是如此遥远,以至于我们现在不需要担心它们。但是更早的灭绝是可能的。例如,地球可能被一颗大的小行星击中–在短期内不太可能,但它可能在任何时候发生。
我们在短期内–比如,未来一百年或一千年–最可能面临的灭绝风险是我们创造的威胁。我们许多最强大的技术只存在了大约一百年,在这段时间里,我们创造了两个存在的威胁:核武器和气候变化。随着我们技术的进步,我们几乎肯定会创造新的威胁。例如,我们最近已经学会了如何精确修改DNA。我们可能会创造出新的病毒或细菌菌株,这些病毒或细菌简直可以杀死每一个人。没有人知道会发生什么,但我们不可能完成创造毁灭自己的方法。
当然,我们需要尽我们所能来减少这些风险,而且我总体上对我们能够很快防止杀害。但我认为,讨论我们现在能做什么是个好主意,以防事情不那么顺利。
遗产规划是你在一生中所做的有利于未来的事情,而不是你自己。许多人不屑于做遗产规划,因为他们认为这对他们没有什么好处。但这不一定是真的。制定遗产计划的人往往觉得它提供了一种目的感或创造了一种遗产。此外,建立遗产计划的过程迫使你从一个广泛的角度来思考生活。做这件事的时间是在你临终前,因为到那时你可能不再有能力去计划和执行。对人类的遗产规划也是如此。现在是思考未来的好时机,以及当我们不在这里时,我们如何能够影响它。
谈到人类的遗产规划,谁可能受益?当然不是人类,因为前提是我们已经离开了。我们规划的受益者是其他智能生物。只有智能动物或智能机器能够欣赏我们的存在,我们的历史,以及我们积累的知识。我认为有两大类未来的生命需要思考。如果人类灭绝了,但其他生命继续存在,那么智能动物就有可能在地球上第二次进化。任何第二个物种的智能动物肯定会对尽可能多地了解曾经存在的人类感兴趣。我们可以把这称为 “人猿星球“的情景,在基于这一前提的书籍和电影之后。我们可以尝试接触的第二个群体是生活在我们银河系其他地方的地外智能物种。他们存在的时间可能与我们重叠,也可能是在遥远的未来。我将讨论这两种情况,尽管我认为关注后者在短期内对我们可能是最有意义的。
为什么其他智能生物会关心我们?我们现在能做什么,在我们离开后他们会欣赏?最重要的事情是让他们知道我们曾经存在过。仅仅这一事实就很有价值。想一想,如果我们知道银河系的其他地方有智慧生命存在,我们会多么感激。对于很多人来说,这将完全改变他们的人生观。即使我们无法与外星生物沟通,知道他们存在或曾经存在,也会让我们产生极大的兴趣。这就是寻找地外智慧生命(SETI)的目标,这是一个旨在寻找银河系其他地方智慧生命证据的研究项目。
除了我们曾经存在的事实,我们还可以交流我们的历史和知识。想象一下,如果恐龙能告诉我们它们是如何生活的,是什么导致了它们的灭亡。这将是非常有趣的,也许对我们来说是非常有用的。但是,因为我们有智慧,我们可以告诉未来比恐龙可以告诉我们的更有价值的东西。我们有可能转移我们所学到的一切。我们可能拥有比接受者知道的更先进的科技知识。(请记住,我们谈论的是我们在未来的知识,这将比我们现在的知识更先进。)再次,想想如果我们能够知道,例如,时间旅行是否可能,或如何制造一个实用的核聚变反应堆,或仅仅是基本问题的答案是什么,如宇宙是有限的还是无限的,这对我们今天来说将是多么有价值。
最后,我们可能有机会传达导致我们灭亡的原因。例如,如果我们今天能够了解到遥远星球上的智慧生物是由于自我引起的气候变化而灭绝的,我们就会更认真地对待我们目前的气候状况。了解其他智能物种存在了多久,以及导致他们灭亡的原因,将有助于我们生存得更久。很难给这种类型的知识定价。
我将通过描述我们可能用于与未来沟通的三种情况来进一步讨论这些想法。
瓶子里的信息
如果你被困在一个荒岛上,你可能会写一条信息,把它放在瓶子里,然后把它扔进大海。你会写什么?你可能会写下你所在的地方,并希望有人,迅速发现信息并救出你,但你不会对这种情况抱有很大希望。更有可能的是,你的信息在你走了很久之后才被发现。因此,你可以写下你是谁,以及你是如何被困在这个岛上的。你的希望是让你的命运被未来的人知道并传诵。瓶子和你的信息是一种不被遗忘的手段。
1970年代初发射的先锋号行星探测器已经离开了我们的太阳系,进入了巨大的太空海洋。天文学家卡尔-萨根(Carl Sagan)主张在 “*先锋 “*探测器上加入一个牌匾。这些牌匾显示了飞船的来源,并包括一个男人和一个女人的照片。在那十年的晚些时候,旅行者号探测器同样包括了一个金质记录,其中包含了来自地球的声音和图像。他们也已经离开了太阳系。我们不期望再看到这些航天器。按照它们的旅行速度,它们将在数万年后才有可能到达另一颗恒星。尽管这些探测器不是为了与遥远的外星人交流而设计的,但它们是我们的第一个瓶中信息。它们主要是象征性的;不是因为它们到达潜在受众所需的时间,而是因为它们可能永远不会被发现。空间如此之大,飞船如此之小,它们遇到任何东西的机会都是很小的。不过,知道这些航天器存在,现在就在太空中旅行,还是令人欣慰的。如果我们的太阳系明天爆炸了,这些牌匾和记录将是地球上生命的唯一实物记录。它们将是我们唯一的遗产。
今天,有一些倡议要把航天器送到附近的恒星。一项突出的努力被称为 “突破性射星”。它设想使用高功率的天基激光器来推动小型航天器前往我们最近的邻星半人马座阿尔法星。这项计划的主要目标是拍摄半人马座阿尔法星轨道上的行星的照片,并将其传送回地球。在乐观的假设下,整个过程将需要数十年。
就像 “先锋 “和“旅行者“探测器一样,在我们离开后很久,“星射 “飞船将继续在太空中移动。如果航天器被银河系其他地方的智慧生物发现,那么这些生物就会知道我们曾经存在过,并且有足够的智慧在星际间发送航天器。不幸的是,这是一种有意将我们的存在传达给其他生物的糟糕方式。航天器又小又慢。它们只能到达我们银河系的一小部分,而且即使它们到达一个有人居住的恒星系统,被发现的可能性也很小。
不开灯
SETI研究所多年来一直试图探测我们银河系其他地方的智能生命。SETI假设其他智能生命正在以足够的功率广播信号,以便我们在地球上能够探测到它。我们的雷达、无线电和电视广播也向太空发送信号,但这些信号非常弱,我们使用现有的SETI技术,无法探测到来自其他星球的类似信号,除非它们来自离我们很近的星球。因此,现在,可能有数以百万计的行星与我们的智能生命一样,散布在我们的银河系中,而且–如果每个行星都有一个与我们一样的SETI程序–没有人会探测到任何东西。他们和我们一样,会说:“人在哪里?”
为了使SETI获得成功,我们假设智能生物有目的地创造出旨在被远距离探测的强烈信号。我们也有可能探测到并非为我们准备的信号。也就是说,我们可能只是碰巧对准了一个高度有针对性的信号,而无意中接收到了一个对话。但是,在大多数情况下,SETI假设一个智能物种正试图通过发送一个强大的信号来使自己为人所知。
如果我们也这样做,那就太周到了。这被称为METI,它代表着消息的外星智能。你可能会惊讶地发现,相当多的人认为METI是一个坏主意,就像,有史以来最糟糕的主意。他们担心,通过向太空发送信号,从而使我们的存在为人所知,其他更先进的生命将来到我们的星体,并杀死我们,奴役我们,在我们身上做实验,或者也许意外地让我们感染上一种我们无法对抗的虫子。也许他们正在寻找他们可以居住的星球,而找到一个最简单的方法就是等待像我们这样的人举手说,“在这里”。在任何情况下,人类都将面临灭顶之灾。
这让我想起了第一次技术创业者最常犯的错误之一。他们担心有人会窃取他们的想法,因此他们对其保密。几乎在所有情况下,最好是与任何可能帮助你的人分享你的想法。其他人可以给你提供产品和商业建议,并在其他许多方面帮助你。创业者通过告诉人们他们正在做的事情,远比保密更有可能成功。怀疑每个人都想窃取你的想法是人类的天性,而现实是,如果有人关心你的想法,你是幸运的。
METI的风险是建立在一系列不可能的假设之上的。它假设其他智能生物有能力进行星际旅行。它假设他们愿意花费大量的时间和精力来进行地球之旅。除非外星人藏在附近的某个地方,否则他们可能需要几千年的时间才能到达这里。它假设智能代理需要地球或地球上的某些东西,而这些东西是他们通过其他方式无法得到的,所以值得一游。它假设,尽管拥有星际旅行的技术,但他们没有技术在我们没有广播我们的存在的情况下探测地球上的生命。最后,它假设这样一个先进的文明会愿意给我们带来伤害,而不是试图帮助我们或至少不伤害我们。
关于最后一点,一个合理的假设是,银河系其他地方的智慧生命是由非智慧生命进化而来,就像我们一样。因此,外星人可能面临着与我们今天所面临的相同类型的生存风险。能够生存足够长的时间,成为银河系中的一个物种,意味着他们以某种方式克服了这些风险。因此,无论他们现在拥有什么样的大脑,都很可能不再被错误的信念或危险的攻击性行为所支配。没有,保证这种情况会发生,但这使得他们伤害我们的可能性降低。
基于上述原因,我相信我们没有必要害怕经济产业部。像一个新的企业家一样,我们最好努力告诉世界我们的存在,并希望有人,任何人,关心我们。
处理SETI和METI的最佳方式关键取决于智慧生命通常能存活多久。有可能在我们的星系中,智能体已经出现了数百万次,而几乎没有一个智能体同时存在。这里有一个比喻。想象一下,五十个人被邀请参加一个晚上的聚会。每个人都在一个随机选择的时间到达聚会现场。当他们到达那里时,他们打开门,走了进去。他们看到一个正在进行的聚会或一个空房间的可能性有多大?这取决于他们各自停留的时间。如果所有参加派对的人在离开前停留一分钟,那么几乎所有出现的人都会看到一个空房间,并得出结论说没有其他人来参加派对。如果参加聚会的人呆了一两个小时,那么聚会就会很成功,有很多人同时在房间里。
我们不知道智慧生命通常能持续多久。银河系大约有130亿年的历史。比方说,它已经能够支持智能生命大约100亿年。这就是我们党的长度。如果我们假设人类作为一个技术物种生存了一万年,那么就好像我们出现在一个六小时的聚会上,但只停留了五十分之一秒。即使有数以万计的其他智能生命出现在同一个聚会上,我们在那里时很可能不会看到其他人。我们将看到一个空房间。如果我们期望在我们的星系中发现智慧生命,这就要求智慧生命经常出现*,并且*持续很长时间。
我预计,地外生命是很常见的。据估计,仅在银河系中就有大约400亿颗行星可以支持生命,而地球上的生命出现在数十亿年前,在地球形成后不久。如果地球是典型的,那么生命将在我们的星系中普遍存在。
我还相信,许多有生命的星球最终会进化出智能生命。我曾提出,智能是基于大脑机制,这些机制首先是为移动我们的身体和识别我们去过的地方而进化的。因此,一旦有多细胞动物在活动,智能可能就不会太引人注目。然而,我们感兴趣的是了解物理学的智能生命,它拥有从太空中发送和接收信号所需的先进技术。在地球上,这种情况只发生过一次,而且是在最近。我们只是没有足够的数据来知道像我们这样的物种有多普遍。我的猜测是,技术物种的出现比你只看地球的历史可能得出的结论更频繁。我对先进技术在我们的星球上出现需要多长时间感到惊讶。例如,我认为没有理由技术先进的物种不能在一亿年前恐龙在地球上漫游时出现。
不管技术先进的生命有多普遍,它可能不会持续很长时间。银河系中其他地方的技术先进的物种很可能会遇到与我们所面临的类似的问题。地球上失败的文明的历史–加上我们正在创造的生存威胁–表明先进的文明可能不会持续很久。当然,像我们这样的物种有可能想出如何生存数百万年,但我认为这不太可能。
这其中的含义是,智能和技术先进的生命可能已经在银河系涌现了数百万次。但是,当我们遥望星空时,我们不会发现智能生命在等待与我们进行对话。相反,我们会看到曾经存在智能生命的恒星,但现在没有。对 “人在哪里?“这个问题的回答是,他们已经离开了聚会。
有一种方法可以绕过所有这些问题。有一种方法可以在我们的星系,甚至可能在其他星系发现智慧生命。想象一下,我们创造一个信号,表明我们曾在地球上出现过。这个信号需要足够强,以便在很远的地方就能探测到,而且需要持续很长时间。该信号,需要在我们离开后长期存在。创造这样一个信号就像在聚会上留下一张电话卡,上面写着 “我们曾经在这里”。后来出现的人不会找到我们,但他们会知道我们曾经存在过。
这表明了思考SETI和METI的一种不同方式。具体来说,它建议我们首先应该把精力放在如何创造一个持久的信号上。我所说的持久,是指十万年,或者数百万年,甚至十亿年。信号持续的时间越长,它就越有可能成功。这个想法还有一个很好的次要好处:一旦我们弄清楚如何制造这样的信号,那么我们就会知道自己应该寻找什么。其他智能生物可能会得出与我们相同的结论。他们也会寻找如何创造一个持久的信号。只要我们弄清楚如何做到这一点,那么我们就可以开始寻找它。
今天,SETI寻找含有某种模式的无线电信号,表明该信号是由一个智慧生物发出的。例如,一个重复π的前20位数字的信号肯定是由一个智能物种创造的。我怀疑我们是否会找到这样的信号。它假定我们银河系其他地方的智慧生物建立了一个强大的无线电发射器,并利用计算机和电子技术,在信号中放置一个代码。我们自己曾短暂地做过几次这样的事情。这需要一个指向太空的大天线、电能、人和计算机。由于我们发送的信号持续时间很短,这些信息更多的是象征性的努力,而不是向我们星系其他地方的认真尝试。
使用电力、计算机和天线来广播信号的问题是,该系统不会运行很久。天线、电子器件、电线等即使在没有维护的情况下也不会保持功能,更不用说一百万年了。我们选择的发出存在信号的方法必须是强大的、广泛指导的和自我维持的。一旦启动,它需要可靠地运行数百万年而不需要任何维护或干预。恒星就是这样。一旦启动,一颗恒星就会在数十亿年内发出大量的能量。我们想找到类似的东西,但如果没有智慧物种的指导,它就无法启动。
天文学家在宇宙中发现了许多奇怪的能量源,例如,振荡、旋转或发射短促的信号。天文学家为这些不寻常的信号寻找自然解释,通常他们会找到这些解释。也许一些尚未解释的现象不是自然现象,而是我所说的那种信号,是由智慧生物创造的。那就好了,但我怀疑会有那么容易。更有可能的是,物理学家和工程师将不得不在这个问题上工作一段时间,想出一套可能的方法来创造一个强大的、自我持续的信号,明确无误地源自一个智能生物。该方法还必须是我们可以实施的。例如,物理学家可能设想出一种能够产生这种信号的新型能源,但是如果我们自己没有能力创造它,那么我们就应该假设其他智慧生命也不能,我们应该继续寻找。
我在这个问题上琢磨了多年,一直在留意可能符合要求的东西。最近,一个候选人浮出水面。当今天文学最令人兴奋的领域之一是发现围绕其他恒星运行的行星。直到最近,人们还不知道行星是常见的还是罕见的。我们现在知道了答案:行星是常见的,而且大多数恒星都有多颗行星,就像我们的一样。我们知道这一点的主要方法是,当一颗行星在遥远的恒星和我们的望远镜之间经过时,探测到星光的轻微减弱。我们可以用同样的基本思路来发出我们存在的信号。例如,想象一下,如果我们将一组物体放入轨道,以一种不会自然发生的模式阻挡一点太阳光。这些在轨道上运行的太阳阻挡器将继续围绕太阳运行数百万年,在我们离开后很久,它们可以从很远的地方被探测到。
我们已经拥有建立这样一个遮阳系统的手段,而且可能有更好的方法来表明我们的存在。这里不是评估我们选择的地方。我只是提出以下意见。第一,智能生命可能已经在我们的银河系中进化了数千或数百万次,但我们不太可能发现自己与其他智能物种共存。二,如果我们只寻找需要发送者持续参与的信号,SETI将不太可能成功。三,METI不仅是安全的,而且是我们在银河系发现智能生命所能做的最重要的事情。我们需要首先确定我们如何能够以一种持续数百万年的方式让人们知道我们的存在。只有这样,我们才会知道要寻找什么。
维基地球
让一个遥远的文明知道我们曾经存在过,是一个重要的首要目标。但对我来说,人类最重要的事情是我们的知识。我们是地球上唯一拥有关于宇宙和它如何运作的知识的物种。知识是罕见的,我们应该试图保护它。
让我们假设人类灭绝了,但地球上的生命仍在继续。例如,一颗小行星被认为杀死了恐龙和许多其他物种,但一些小动物设法在撞击中幸存下来。六千万年后,这些幸存者中的一些成为我们。这种情况确实发生过,而且可能再次发生。想象一下,现在我们人类已经灭绝了,也许是由于一场自然灾害或我们所做的事情。其他物种幸存下来,五千万年后,其中一个物种变得聪明。那个物种肯定会想知道他们所能知道的关于早已消失的人类时代的一切。他们会特别想知道我们的知识范围,以及我们身上发生了什么。
如果人类灭绝了,那么在短短一百万年左右的时间里,所有关于我们生活的详细记录都可能会丢失。我们的一些城市和大型基础设施会有被埋葬的遗迹,但几乎所有的文件、电影和记录都将不复存在。未来的非人类考古学家将努力拼凑我们的历史,就像今天的古生物学家努力弄清恐龙的情况一样。
作为我们遗产计划的一部分,我们可以将我们的知识以一种更永久的形式保存下来,这种形式可以持续数千万年。我们有几种方法可以做到这一点。例如,我们可以不断地对维基百科这样的知识库进行存档。维基百科本身是不断更新的,所以它可以记录直到我们的社会开始失败的事件,它涵盖了广泛的主题,而且存档过程可以自动化。档案不应该位于地球上,因为地球可能在一个单一的事件中被部分摧毁,经过数百万年的时间,几乎没有什么能保持完整。为了克服这个问题,我们可以把我们的档案放在一组环绕太阳的卫星上。这样,档案将很容易被发现,但很难被物理改变或破坏。
我们将设计基于卫星的档案,以便我们可以向其发送自动更新,但其内容不能被删除。卫星上的电子装置在我们离开后不久就会停止运作,因此,为了读取档案,未来的智能物种将不得不开发技术,前往档案馆,把它带回地球,并提取数据。我们可以在不同的轨道上使用多颗卫星以实现冗余。我们已经拥有了创建卫星档案和检索的能力。想象一下,如果地球上以前的一个智能物种在太阳系周围放置了一组卫星。我们现在就会发现它们,并且已经把它们带回了地球。
从本质上讲,我们可以创造一个持续数百万或数亿年的时间胶囊。在遥远的未来,智能生物–无论他们是在地球上进化,还是从另一个星球上旅行–都可以发现这个时间胶囊并阅读其中的内容。我们不会知道我们的储存库是否会被发现;这就是遗产计划的本质。如果我们这样做,而它在未来被读取,想象一下,接收者会有多么感激。你所要做的就是想想我们自己发现这样一个时间胶囊会有多兴奋。
人类的遗产计划与个人的遗产计划相似。我们希望我们的物种能够长生不老,也许这将会发生。但谨慎的做法是制定一个计划,以防奇迹没有发生。我已经提出了几个我们可以追求的想法。一个是将我们的历史和知识存档,让地球上未来的智能物种能够了解人类–我们知道什么,我们的历史,以及最终发生在我们身上的事情。另一个是创造一个持久的信号,告诉时空其他地方的智能生物,智能人类曾经生活在我们称为太阳的恒星周围。长效信号的美妙之处在于,它可能在短期内帮助我们,引导我们发现在我们之前还有其他智能物种。
是否值得花时间和金钱去追求这样的举措?把我们所有的努力放在改善地球上的生活上会更好吗?在投资于短期和投资于长期之间总是有摩擦。短期的问题更加紧迫,而投资于未来却没有什么直接的好处。每个组织–无论是政府、企业还是家庭–都面临着这种两难境地。然而,不进行长期投资就会保证未来的失败。在这种情况下,我相信投资于人类的遗产计划有几个近期的好处。它将使我们更清楚地认识到我们所面临的生存威胁。它将推动更多的人去思考我们作为一个物种的行为的长期后果。而且,如果我们最终失败,它将为我们的生活提供一种目的。
第16章
基因与知识
“旧脑-新脑 “是本书第一章的标题。这也是一个基本主题。回顾一下,我们大脑的30%,即旧脑,是由许多不同部分组成的。这些旧脑区域控制着我们的身体机能、基本行为和情绪。这些行为和情绪中的一些导致我们具有攻击性、暴力和贪婪,撒谎和欺骗。我们每个人都或多或少地怀有这些倾向,因为进化论发现它们对繁殖基因很有用。我们70%的大脑,即新的大脑,是由一种东西构成的:新皮质。新脑皮层学习世界的模型,正是这个模型使我们变得聪明。智慧的进化是因为它也对传播基因有用。我们在这里是基因的仆人,但旧脑和新脑之间的力量平衡已经开始转变。
数百万年来,我们的祖先对我们的星球和更广泛的宇宙了解有限。他们只了解他们能够亲自体验的东西。他们不知道地球的大小,也不知道它是一个球体。他们不知道太阳、月亮、行星和星星是什么,以及它们为什么在天空中移动。他们不知道地球有多老,也不知道它的,各种生命形式是如何形成的。我们的祖先对我们生存的最基本事实一无所知。他们编造了关于这些奥秘的故事,但这些故事并不真实。
最近,利用我们的智慧,我们不仅解开了困扰我们祖先的谜团,而且科学发现的步伐正在加快。我们知道宇宙有多大,我们有多小,令人难以置信。我们现在明白,我们的星球有几十亿年的历史,地球上的生命也已经进化了几十亿年。幸运的是,整个宇宙似乎是按照一套规律运作的,其中一些规律是我们发现的。我们似乎有诱人的可能,我们可能会发现所有的规律。世界上有数百万人正积极致力于科学发现,还有数十亿人感到与这一使命有关。这是一个令人难以置信的活着的时代。
然而,我们有一个问题,可能会迅速停止我们的启蒙竞赛,并可能完全结束我们的物种。早些时候,我解释说,无论我们变得多么聪明,我们的新皮层仍然与旧脑相连。随着我们的技术变得越来越强大,旧大脑的自私和短视行为可能导致我们灭绝,或使我们陷入社会崩溃和另一个黑暗时代。使这一风险更加复杂的是,数十亿人类对生命和宇宙的最基本方面仍有错误的信念。病毒性的错误信念是威胁我们生存的另一个行为来源。
我们面临着一个两难境地。“我们”–居住在新皮质中的我们的智能模型–被困住了。我们被困在一个不仅被设定为死亡的身体里,而且在很大程度上被一个无知的野蛮人–旧的大脑所控制。我们可以用我们的智慧来想象一个更好的未来,我们也可以采取行动来实现我们所期望的未来。但是旧的大脑可能会毁掉一切。它产生的行为在过去有助于基因的复制,然而许多行为并不漂亮。我们试图控制旧大脑的破坏性和分裂性冲动,但到目前为止,我们还不能完全做到这一点。地球上的许多国家仍然由专制者和独裁者统治,他们的动机主要是由他们的旧大脑驱动的:财富、性和阿尔法男性式的主导地位。支持专制者的民粹主义运动也是基于旧脑的特征,如种族主义和仇外心理。
我们应该怎么做呢?在上一章中,我讨论了在人类无法生存的情况下我们可以保存知识的方法。在这最后一章中,我讨论了我们可能采取的三种方法来防止我们的灭亡。第一种方法在不修改我们的基因的情况下可能行得通,也可能行不通,第二种方法是基于基因修改,第三种方法则完全放弃了生物学。
这些想法可能会让你觉得很极端。然而,问问你自己。生活的目的是什么?当我们为生存而挣扎时,我们要保存的是什么?在过去,活着总是为了保存和复制基因,无论我们是否意识到这一点。但这是最好的发展方式吗?如果相反,我们决定生活应该侧重于智力和知识的保存。如果我们做出这样的选择,那么我们今天认为的极端行为可能正是未来的合理之举。在我看来,我在这里提出的三个想法是可能的,并且很有可能在未来被追求。它们现在可能看起来不太可能,就像手持电脑在1992年似乎不太可能一样。我们将不得不让时间来检验哪一个,如果有的话,最终是可行的。
成为一个多星球的物种
当我们的太阳死亡时,我们太阳系的所有生命也会死亡。但是大多数与我们有关的灭绝事件都是在地球上发生的。例如,如果一颗大的小行星撞击地球,或者我们在一场核战争中使地球无法居住,那么附近的其他星球将不会受到影响。因此,减少灭绝风险的一个方法是成为一个双行星物种。如果我们能在另一个附近的行星或月球上建立一个永久的存在,那么即使地球变得不适合居住,我们的物种和我们积累的知识也可能存活。这种逻辑是目前把人放在火星上的努力背后的驱动力之一,火星似乎是定位人类殖民地的最佳选择。我发现前往其他星球的可能性令人激动。我们已经很久没有到新的和未开发的目的地去旅行了。
在火星上生活的主要困难是,火星是一个可怕的居住地。缺乏重要的大气层意味着在外面短暂的暴露就会杀死你,而你的屋顶漏水或窗户破损就会杀死你的整个家庭。来自太阳的辐射在火星上更高,也是生活在那里的一个主要风险,所以你将不得不不断地保护自己免受太阳的影响。火星的土壤是有毒的,而且没有地表水。说真的,住在南极比住在火星更容易。但这并不意味着我们应该放弃这个想法。我相信我们可以在火星上生活,但要做到这一点,我们需要一些我们还没有的东西。我们需要智能和自主的机器人。
为了让人类在火星上生活,我们将需要大型的、密闭的建筑物来生活和种植食物。我们将需要从矿井中提取水和矿物,并制造空气来呼吸。最终,我们将需要对火星进行地形改造,重新引入大气层。这些都是巨大的基础设施项目,可能需要几十年或几个世纪才能完成。在火星变得自给自足之前,我们将不得不发送所需的一切:食物、空气、水、药品、工具、建筑设备、材料和人–大量的人。所有的工作都必须穿着笨重的太空服完成。试图建造宜居环境和创建一个永久的自给自足的火星殖民地所需的所有基础设施,人类将面临的困难怎么说都不过分。生命的损失、心理的伤害和经济的代价将是巨大的,可能比我们愿意承受的还要大。
但是,如果我们不派人类工程师和建筑工人,而是派智能机器人工程师和建筑工人,为人类准备火星就可以完成。他们将从太阳获得能量,并且可以在外面工作而不需要食物、水或氧气。他们可以不知疲倦地工作,没有任何情绪压力,只要能使火星安全,供人类居住。机器人工程师团将需要在很大程度上自主地工作。如果他们依赖与地球的持续沟通,进展将过于缓慢。
我从来都不是科幻文学的粉丝,而这个场景听起来很像科幻小说。然而,我认为我们没有理由不这样做,而且,如果我们想成为一个多行星物种,我相信我们没有选择。人类要在火星上长期生活,需要智能机器来帮助我们。关键的要求是赋予火星机器人劳动力以相当于新皮质的能力。机器人需要使用复杂的工具,操纵材料,解决意料之外的问题,并相互交流,类似于人的方式。我相信,我们能够实现这一目标的唯一途径是完成新皮质的逆向工程,并在硅中创建同等的结构。自主的机器人需要有一个建立在我前面概述的原则上的大脑,即千脑理论的原则。
创造真正的智能机器人是可以实现的,而且我确信它将会发生。我相信,如果我们把它作为优先事项,我们可以在几十年内做到这一点。幸运的是,也有很多陆地上的理由来建造智能机器人。因此,即使我们不把它作为国家或国际优先事项,市场力量最终会资助机器智能和机器人技术的发展。我希望世界各地的人们能够理解,成为一个多星球物种是一个令人兴奋的目标,对我们的生存很重要,而智能机器人建筑工人是实现这一目标的必要条件。
即使我们创造了智能机器人工人,对火星进行地形改造,并建立人类殖民地,我们仍然会有一个问题。去火星的人类将和地球上的人类一样。他们将有一个古老的大脑,以及随之而来的所有复杂情况和风险。生活在火星上的人类将为领土而战,做出基于错误信念的决定,并可能为生活在那里的人创造新的生存风险。
历史表明,最终生活在火星上的人和生活在地球上的人将以可能危及一个或两个人口的方式进行争斗,。例如,想象一下,从现在起两百年后,一千万人类生活在火星上。但后来,地球上发生了一些坏事。也许我们不小心用放射性元素毒害了地球的大部分地区,或者地球的气候开始迅速恶化。会发生什么?数十亿的地球居民可能会突然想搬到火星上去。如果你让你的想象力发挥一下,你可以看到这对每个人来说都很容易变成糟糕的结果。我不想猜测负面的结果。但重要的是要认识到,成为一个多行星物种并不是万能的。人类就是人类,我们在地球上造成的问题也会存在于我们居住的其他星球上。
成为一个多星体物种怎么样?如果人类可以殖民其他恒星系统,那么我们就可以在整个银河系扩张,我们的一些后代可以无限期生存的机会将大大增加。
人类的星际旅行是可能的吗?一方面,它似乎应该是这样的。有四颗恒星离我们不到5光年,有11颗恒星离我们不到10光年。爱因斯坦表明,加速到光速是不可能的,所以让我们假设我们以一半的速度旅行。那么前往附近恒星的任务可以在一二十年内完成。另一方面,我们不知道如何接近这个速度。使用我们今天拥有的技术,需要数万年才能到达我们最近的邻星。人类不可能进行那么长时间的旅行。
有许多物理学家在思考如何巧妙地克服星际飞行的问题。也许他们会发现接近光速的旅行方式,甚至比光速更快。许多在两百年前似乎是不可能的事情,现在已经司空见惯。想象一下,你在1820年的一次科学家会议上发言说,在未来,任何人都可以在几个小时内舒适地从一个大洲到另一个大洲,或者人们将经常通过看手和说话与世界上任何地方的其他人进行面对面的交谈。没有人会想到这些活动会成为 ,但我们在这里。未来肯定会有今天无法想象的新进展让我们吃惊,其中之一可能是实用的太空旅行。但我可以放心地预测,人类的星际旅行在不到50年内不会发生。如果它从未发生,我也不会感到惊讶。
我仍然主张成为一个多星球物种。这将是一次鼓舞人心的探索性冒险,而且它可能会减少人类灭绝的近期风险。但我们的进化遗产所带来的固有风险和限制仍然存在。即使我们设法在火星上建立殖民地,我们可能不得不接受我们将永远无法超越太阳系的事实。
然而,我们还有其他选择。这些需要我们客观地审视自己,并问:我们试图保护的人类是什么?我将首先讨论这个问题,然后再讨论确保我们未来的另外两个选择。
选择我们的未来
从十八世纪末的启蒙运动开始,我们积累了越来越多的证据,证明宇宙的发展没有指导性的手。简单生命的出现,然后是复杂的生物体,然后是智能的出现,既不是计划的,也不是不可避免的。同样地,地球上生命的未来和智能的未来也不是预先决定的。看来,宇宙中唯一关心我们的未来如何展开的是我们。唯一理想的未来是我们所渴望的。
你可能会反对这种说法。你可能会说,地球上还生活着许多其他物种,有些还很聪明。我们已经伤害了这些物种中的许多,并导致其他物种灭绝。难道我们不应该考虑其他物种的 “愿望 “吗?是的,但这并不那么简单。
地球是动态的。构成其表面的构造板块不断移动,创造出新的山脉、新的大陆和新的海洋,同时将现有的特征陷入地球的中心。生命也同样是动态的。物种是不断变化的。我们与生活在十万年前的祖先在基因上并不相同,。变化的速度可能是缓慢的,但它从未停止。如果你这样看待地球,那么试图保护物种或保护地球就没有意义了。我们无法阻止地球最基本的地质特征的变化,我们也无法阻止物种的进化和灭绝。
我最喜欢的活动之一是野外徒步旅行,而且我认为自己是一个环保主义者。但我并不假装环保主义是为了保护自然。每个环保主义者都乐于看到一些生物–比如说,脊髓灰质炎病毒–的灭绝,同时又不遗余力地拯救濒临灭绝的野花。从宇宙的角度来看,这是一个任意的区分;无论是脊髓灰质炎病毒还是野花,都不比对方好或坏。我们根据什么是我们的最佳利益来选择保护什么。
环保主义不是关于保护自然,而是关于我们的选择。通常情况下,环保主义者做出的选择有利于未来的人类。我们试图减缓我们喜欢的东西的变化,如荒野地区,以增加我们的后代也能享受这些东西的机会。还有一些人选择把荒野地区变成带状矿区,以便他们今天能够受益,这更像是一个老脑筋的选择。宇宙并不关心我们选择哪个选项。是帮助未来的人类还是现在的人类,这是我们的选择。
不存在什么都不做的选择。作为智慧生命,我们必须做出选择,而我们的选择将以某种方式引导未来。至于地球上的其他动物,我们可以选择帮助他们或不帮助他们。但只要我们还在这里,就没有选择让事情以其 “自然 “的方式发展。我们是大自然的一部分,我们必须做出影响未来的选择。
在我看来,我们有一个深刻的选择要做。这是在偏爱旧脑或新脑之间的选择。更具体地说,我们是否希望我们的未来由那些让我们走到今天的过程所驱动,即自然选择、竞争和自私基因的驱动?或者我们希望我们的未来由智力驱动,并渴望了解这个世界?我们有机会在一个主要驱动力是创造和传播知识的未来和一个主要驱动力是复制和传播基因的未来之间做出选择。
为了行使我们的选择,我们需要有能力通过操纵基因来改变进化的进程,并有能力以非生物形式创造智能。我们已经有了前者,而后者也即将到来。这些技术的使用导致了伦理方面的辩论。我们应该操纵其他物种的基因来改善我们的食物供应吗?我们是否应该操纵我们自己的基因来 “改善 “我们的后代?我们应该创造比我们更聪明、更有能力的智能机器吗?
也许你已经对这些问题形成了看法。你可能认为这些事情没有问题,或者你可能认为它们不道德。不管怎么说,我认为讨论我们的选择没有任何坏处。仔细审视我们的选择将帮助我们做出明智的决定,无论我们选择做什么。
成为一个多星球的物种是防止我们灭绝的一种尝试,但它仍然是一个由基因决定的未来。我们可以做出什么样的选择来支持知识的传播而不是基因的传播?
改造我们的基因
我们最近开发了精确编辑DNA分子的技术。很快,我们将能够创建新的基因组,并以创建和编辑文本文件的精确度和便利性修改现有的基因组。基因编辑的好处可能是巨大的。例如,我们可以消除给数百万人带来痛苦的遗传性疾病。然而,同样的技术也可用于设计全新的生命形式,或修改我们孩子的DNA–例如,使他们成为更好的运动员或更有吸引力。我们认为这种操纵是可以的还是可恶的,取决于具体情况。修改我们的DNA以使我们看起来更有吸引力似乎没有必要,但如果基因编辑使我们的整个物种不至于灭绝,那么它就成为一种必须。
例如,假设我们决定在火星上建立一个殖民地是对我们人类长期生存的一个很好的保险计划,很多人都报名去了。但后来我们发现,由于火星的低重力,人类无法在火星上长期生活。我们已经知道,在国际空间站的零重力环境中度过数月会导致医疗问题。也许在火星的低重力环境下生活十年后,我们的身体开始衰竭并死亡。那么,在火星上的永久人口似乎就不可能了。然而,假设我们可以通过编辑人类基因组来解决这个问题,拥有这些DNA修改的人可以在火星上无限期地生活。我们是否应该允许人们编辑他们的基因和他们孩子的基因,以便他们能在火星上生活?任何愿意去火星的人都已经在接受威胁生命的风险了。而且生活在火星上的人的基因无论如何都会慢慢改变。那么,为什么人们不能做出这种选择呢?如果你认为这种形式的基因编辑应该被禁止,那么如果地球变得不适合居住,而你唯一可以生存的方式就是搬到火星上,你会改变你的想法吗?
现在想象一下,我们学会了如何修改我们的基因,以消除攻击性行为,使一个人更加利他。我们应该允许这样做吗?考虑一下,当我们选择谁能成为宇航员时,我们选择那些自然具有这些属性的人。我们这样做是有原因的;它增加了太空任务成功的可能性。如果将来我们把人送到火星上生活,我们可能会做同样类型的筛选。难道我们不会优先考虑情绪稳定的人,而不是有短视和攻击性历史的人吗?当一个不经意的或暴力的行为可以杀死整个社区时,已经生活在火星上的人们难道不会要求新来的人通过某种情绪稳定测试吗?如果我们可以通过编辑DNA来制造一个更好的公民,现有的火星居民可能会坚持这样做。
再考虑一个假设性的情况。有些鱼可以在冰冻中生存。如果我们能够修改我们的DNA,使人类也能类似地被冻结,然后在未来的某个时候解冻,那会怎么样呢?我可以想象很多人都想把自己的身体冷冻起来,以便在一百年后再次被唤醒。在未来度过生命中的最后十年或二十年,这将是令人激动的。我们会允许这样做吗?如果这种改造使人类能够旅行到其他星体呢?即使旅行需要数千年,我们的太空旅行者可以在出发时被冻结,当他们到达目的地时被解冻。这样的旅行将不缺乏志愿者。我们是否有理由禁止使这种旅行成为可能的DNA修改?
我可以想出许多场景,在这些场景中,我们可能会决定显著改变我们的DNA,这符合我们的最佳个人利益。没有绝对的正确或错误;只有我们可以做出的选择。如果人们说我们原则上不应该允许DNA编辑,那么,不管他们是否意识到,他们已经选择了一个符合我们现有基因的最佳利益的未来,或者,正如通常的情况一样,选择了病毒性的错误信念。通过采取这样的立场,他们正在消除那些可能对人类长期生存和知识长期生存最有利的选择。
我并不主张我们应该在没有监督或审议的情况下编辑人类基因组。而且我所描述的一切都不涉及强迫。任何人都不应该被强迫做这些事情。我只是指出,基因编辑是可能的,因此我们有选择。就个人而言,我不明白为什么无指导进化的道路比我们自己选择的道路更可取。我们可以感谢进化过程让我们来到这里。但既然我们在这里,我们就可以选择使用我们的智慧来控制未来。如果我们这样做,我们作为一个物种的生存和我们的知识的生存可能会更加安全。
通过编辑我们的DNA而设计的未来仍然是一个生物学上的未来,这就对可能的事情施加了限制。例如,,目前还不清楚通过DNA编辑可以完成多少事情。是否有可能编辑我们的基因组,使未来的人类能够在星际间旅行?是否有可能使未来的人类在遥远的行星前哨不互相残杀?没有人知道。今天,我们没有足够的关于DNA的知识来预测哪些是可能的,哪些是不可能的。如果我们发现我们可能想要做的一些事情在原则上是不可能的,我不会感到惊讶。
现在我谈谈我们最后的选择。这也许是保证知识的保存和智能的生存的最可靠的方法,但也可能是最困难的。
离开达尔文的轨道
将我们的智慧从我们的旧大脑和生物学的控制中解放出来的最终方法是创造出像我们一样有智慧的机器,但不依赖我们。它们将是能够超越我们的太阳系并比我们生存得更久的智能代理。这些机器将分享我们的知识,但不是我们的基因。如果人类在文化上出现倒退–如在一个新的黑暗时代–或者如果我们灭绝了,我们的智能机器后代将在没有我们的情况下继续前进。
我对使用 “机器 “这个词犹豫不决,因为它可能会让人联想到坐在桌子上的电脑,或者人形机器人,或者科幻故事中的一些邪恶角色。正如我前面所描述的,我们无法预测智能机器在未来会是什么样子,就像早期的计算机设计师无法想象未来的计算机会是什么样子一样。20世纪40年代,没有人想象到计算机可以比米粒还小,小到可以嵌入几乎所有的东西中。他们也无法想象强大的云计算机可以随处访问,但并不完全位于任何地方。
同样地,我们无法想象未来的智能机器会是什么样子,或者它们会由什么组成,所以我们不要尝试。它可能会限制我们对可能性的思考。相反,让我们讨论一下,为什么我们可能想要创造出能够在没有我们的情况下前往星空的智能机器的两个原因。
目标一:保存知识
在上一章中,我描述了我们如何将知识保存在一个围绕太阳运行的存储库中。我给这个维基地球贴上了标签。我描述的存储库是静态的。它就像一个漂浮在太空中的印刷书籍的图书馆。我们创建它的目的是为了保存知识,希望未来的某个智能代理能发现这个资源库,并找出如何阅读其内容。然而,如果没有人类积极地照顾它的维护,资源库会慢慢腐烂。维基地球不会复制自己,不会自我修复,因此,它是暂时的。我们会设计它持续很长时间,但在遥远的未来的某个时刻,它将不再是可读的。
人类的新皮层也像一个图书馆。它包含关于世界的知识。但与维基地球不同的是,新皮层通过将其知识转移给其他人类来复制它所知道的东西。例如,这本书是我试图将我知道的一些东西转移给其他人,如你。这确保了知识的分布。任何一个人的丧失都不会导致知识的永久丧失。保存知识的最可靠的方法是不断地进行复制。
因此,创造智能机器的一个目标是复制人类已经在做的事情:通过制作和分发副本来保存知识。我们希望使用智能机器来达到这个目的,因为它们可以在我们离开后继续保存知识,而且它们可以将知识传播到我们不能去的地方,如其他恒星。与人类不同,智能机器可以慢慢地传播到整个银河系。他们有望能够与宇宙中其他地方的智能生物分享知识。想象一下,如果我们发现了一个知识和银河系历史的宝库,而这个宝库已经穿越到了我们的太阳系,那将是多么令人兴奋的事情。
在上一章的遗产规划中,我描述了维基地球的想法和创造一个持久的信号来表明我们这个智能物种曾经存在于太阳系的想法。这两个系统结合在一起,有可能引导其他智能生物来到我们的太阳系,然后发现我们的知识库。我在这一章中提出的是一种实现类似结果的不同方式。与其将外星智能体引向我们太阳系的知识库,不如将我们的知识和历史拷贝到整个银河系。无论哪种方式,有智慧的东西都必须在太空中进行长途旅行。
一切都会消磨掉。当智能机器在太空中旅行时,有些会被损坏、丢失或无意中被摧毁。因此,我们的智能机器后代必须能够自我修复,并在需要时复制自己。我意识到这将吓到那些担心智能机器接管世界的人。正如我之前解释的那样,我不认为我们必须担心这个问题,因为大多数智能机器将无法制造自己的副本。但在这种情况下,它是一种要求。然而,对于智能机器来说,复制是非常困难的,这是这个场景可能无法实现的主要原因。想象一下,少数智能机器在太空中旅行。几千年后,他们到达了一个新的太阳系。他们发现大部分是贫瘠的星球,还有一个星球有原始的单细胞生命。这就是几十亿年前来到我们太阳系的访客会发现的情况。现在,让我们假设这些智能机器决定他们需要替换他们的两个成员,并创造一些新的智能机器来送去另一个恒星。他们怎么能做到这一点呢?例如,如果这些机器是用硅芯片制造的,就像我们在计算机中使用的那种,那么他们是否需要建立硅芯片制造厂和所有必要的供应链?这可能是不可行的。也许我们将学会如何创造能够使用普通元素进行复制的智能机器,类似于地球上的碳基生命。
我不知道如何克服星际旅行带来的许多实际问题。但是,我再次认为,我们不应该关注未来智能机器的物理表现形式。也许有办法利用我们尚未发明的材料和建造方法来建造智能机器。目前,更重要的是讨论目标和概念,以帮助我们决定这是否是我们可以选择的事情。如果我们决定派遣智能机器去探索银河系和传播知识是我们想要追求的事情,那么我们就有可能设计出克服障碍的方法。
目标二:获得新知识
如果我们设法创造出能在恒星之间旅行的自我维持的智能机器,他们会发现新的东西。他们无疑会发现新类型的行星和恒星,并做出其他我们无法想象的发现。也许他们会发现关于宇宙的深层奥秘的答案,如宇宙的起源或命运。这就是探索的本质:你不知道你会学到什么,但你会学到一些东西。如果我们派人类去探索银河系,我们会期待他们有所发现。在许多方面,智能机器将比人类更有能力进行发现。他们的大脑相当于将有更多的记忆,工作速度更快,并有新颖的传感器。他们将是比我们更好的科学家。如果智能机器穿越了我们的银河系,它们将不断增加对宇宙的了解。
一个有目标和方向的未来
长期以来,人类一直梦想着在星际间旅行。为什么?
一个原因是扩展和保存我们的基因。这是基于这样的想法:一个物种的命运是不断探索新的土地,在任何可能的地方建立殖民地。我们在过去已经反复做了,翻山越岭,漂洋过海,建立新的社会。这符合我们基因的利益,因此我们被编程为探索。好奇心是我们的旧脑功能之一。很难抗拒探索,即使在不探索会更安全的情况下。如果人类能够到星际旅行,这将只是我们一直以来所做的事情的延伸,将我们的基因传播到尽可能多的地方。
第二个原因,也就是我在本章提出的原因,是为了扩展和保存我们的知识。这种思路是基于这样的假设:智力,而不是我们的特定基因,是我们这个物种重要的原因。因此,我们应该去星际旅行,以学习更多的知识,并为未来保障我们的知识。
但这是一个更好的选择吗?像以前一样继续下去有什么问题吗?我们可以忘记所有这些关于保存知识或创造智能机器的唠叨。到目前为止,地球上的生活已经很不错了。如果人类不能去其他星球旅行,那又怎样?为什么不像我们一样继续下去,在它持续的时候享受这段旅程?
这是一个合理的选择,最终,它可能是我们唯一的选择。但我想说明的是,知识比基因更重要。两者之间有一个根本的区别,在我看来,这个区别使得保护和传播知识比保护和传播我们的基因更有价值。
基因只是会复制的分子。随着基因的进化,它们并没有朝着任何特定的方向发展,一个基因在本质上也不比另一个基因好,就像一个分子在本质上不比任何其他分子好一样。有些基因可能更善于复制,然而,随着环境的变化,哪些基因更善于复制也会改变。重要的是,这些变化没有整体方向。基于基因的生命没有方向或目标。生命可能表现为一种病毒、一种单细胞细菌或一棵树。但除了复制能力之外,似乎没有任何理由表明一种生命形式比另一种更好。
知识是不同的。知识既有方向又有最终目标。例如,考虑重力。在不太遥远的过去,没有人知道为什么东西会往下掉而不是往上。牛顿创造了第一个成功的重力理论。他提出,这是一种普遍的力量,并且他表明,它的行为符合一套可以用数学表达的简单规律。在牛顿之后,我们再也不会回到没有重力理论的时代了。爱因斯坦对万有引力的解释比牛顿的更好,我们永远不会回到牛顿的理论。这并不是说牛顿是错的。他的方程仍然准确地描述了我们每天都在经历的重力。爱因斯坦的理论结合了牛顿的理论,但更好地描述了不寻常条件下的重力。知识有一个方向。关于重力的知识可以从没有知识,到牛顿的知识,再到爱因斯坦的知识,但它不能向相反方向发展。
除了方向之外,知识还有一个最终目标。最早的人类探险家们并不知道地球有多大。无论他们走了多远,总是有更多的地方。地球是无限的吗?它的尽头是否有一个边缘,再走下去就会掉下去?没有人知道。但是有一个最终目标。人们认为,地球有多大这个问题是有答案的。我们最终以一个令人惊讶的答案实现了这个目标。地球是一个球体,而现在我们知道地球有多大。
我们今天也面临着类似的谜题。宇宙有多大?它是否永远存在?它有一个边缘吗?它是否像地球一样环绕在自己身上?是否有许多宇宙?还有很多其他我们不了解的东西。什么是时间?生命是如何起源的?智慧生命有多普遍?回答这些问题是一个目标,而历史表明我们可以实现它。
一个由基因驱动的未来几乎没有方向,只有短期目标:保持健康,有孩子,享受生活。一个以知识的最大利益设计的未来既有方向又有最终目标。
好消息是,我们不一定要选择一个未来而不是另一个。两者都有可能做到。我们可以继续生活在地球上,,尽力保持地球的宜居性,并努力保护自己不受我们自己最糟糕的行为影响。同时,我们可以将资源用于确保知识的保存和智慧的延续,以备将来我们不在这里的时候使用。
我写这本书的第三部分,即最后五章,是为了说明知识高于基因。我要求你客观地看待人类。我让你看看我们是如何做出错误决定的,以及为什么我们的大脑容易受到错误信仰的影响。我要求你考虑知识和智力比基因和生物学更珍贵,因此,值得在我们的生物大脑中保留它们目前的家园。我要求你考虑基于智力和知识的后代的可能性,这些后代可能与基于基因的后代同样有价值。
我想再次强调,我不是在规定我们应该做什么。我的目标是鼓励讨论,指出一些我们认为是伦理上的确定性的东西实际上是选择,并把一些没有得到重视的想法带到前台。
现在我想回到现在。
最后的想法
我有一个从来没有停止过的愿景,让我感到高兴。我想象浩瀚的宇宙,其中有数千亿个星系。每个星系包含数千亿颗恒星。在每颗恒星周围,我想象着种类繁多的行星。我想象这些数万亿个大小不一的物体在浩瀚的太空中缓慢地相互环绕,持续数十亿年。令我惊讶的是,宇宙中唯一知道这些的东西–唯一知道宇宙存在的东西–是我们的大脑。如果不是因为大脑,那么没有什么东西会知道任何东西的存在。这提示了我在书的开头提到的问题。如果没有关于某个事物的知识,我们能说这个事物根本就存在吗?我们的大脑扮演着这样一个独特的角色,这很吸引人。当然,宇宙中的其他地方可能也有智能生物,但这使我们更有兴趣去思考。
思考宇宙和智力的独特性是我想研究大脑的原因之一。但就在地球上还有很多其他原因。例如,了解大脑如何工作对医学和心理健康有影响。解决大脑的奥秘将导致真正的机器智能,这将有利于社会的各个方面,,与计算机一样,它将导致更好的方法来教育我们的孩子。但最终,它又回到了我们独特的智能。我们是最聪明的物种。如果我们想了解我们是谁,那么我们必须了解大脑如何创造智能。在我看来,对大脑进行逆向工程和了解智力是人类将要进行的最重要的科学探索。
当我开始这项探索时,我对新皮层的作用了解有限。我和其他神经科学家有一些关于大脑学习世界模型的概念,但我们的概念是模糊的。我们不知道这样的模型是什么样子的,也不知道神经元如何创造它。我们被淹没在实验数据中,如果没有一个理论框架,就很难理解这些数据。
从那时起,世界各地的神经科学家已经取得了重大进展。本书重点介绍了我的团队所学到的东西。其中大部分是令人惊讶的,比如发现新皮层并不包含一个世界模型,而是大约15万个感觉-运动模型系统。或者发现新皮层所做的一切都以参考框架为基础。
在本书的第一部分,我描述了关于新皮层如何工作以及如何学习世界模型的新理论。我们称其为 “千脑智能理论”(Thousand Brains Theory of Intelligence)。我希望我的阐述很清楚,而且你能发现我的论点很有说服力。我曾一度争论是否应该在这里结束。对于一本书来说,理解新皮层的框架当然足够宏大。然而,对大脑的理解自然会引出其他相关问题,所以我继续写下去。
在第二部分,我认为今天的人工智能并不智能。真正的智能需要机器像新皮层那样学习世界模型。我还说明了为什么机器智能并不像许多人认为的那样是一种生存风险。机器智能将是我们将创造的最有益的技术之一。像其他技术一样,也会有人滥用它。比起人工智能本身,我更担心这个问题。就其本身而言,,机器智能并不代表存在风险,而且我相信,其好处将远远大于坏处。
最后,在本书的第三部分,我通过智力和大脑理论的视角来审视人类状况。正如你可能知道的,我对未来感到担忧。我关注人类社会的福利,甚至我们这个物种的长期生存。我的目标之一是提高人们对老旧大脑和错误信仰的结合是如何成为一种真正的生存风险的认识,远远大于假定的人工智能的威胁。我讨论了我们可能减少我们所面临的风险的不同方法。其中有几个需要我们创造智能机器。
我写这本书是为了传达我和我的同事们对智力和大脑的认识。但除了分享这些信息之外,我希望能说服你们中的一些人就此采取行动。如果你还年轻或正在考虑改变职业,请考虑进入神经科学和机器智能领域。没有什么学科比这更有趣、更有挑战性、更重要。然而,我必须警告你:如果你想追求我在本书中写到的想法,将会很困难。神经科学和机器学习都是具有巨大惯性的大领域。我毫不怀疑,我在这里描述的原则将在这两个研究领域发挥核心作用,但这可能需要多年才能实现。在此期间,你将不得不下定决心,足智多谋。
我还有一个要求,这适用于每个人。我希望有一天地球上的每个人都能了解自己的大脑是如何工作的。对我来说,这应该是一种期望,比如说,“哦,你有一个大脑?这就是你需要知道的事情”。每个人都应该知道的事情的清单很短。我会包括大脑是如何由新部分和旧部分组成的。我会包括新皮层如何学习世界的模型,而大脑的旧部分则产生我们的情绪和更原始的行为。我将包括旧大脑如何控制,使我们以我们知道不应该的方式行事。我还会包括我们所有人都很容易受到错误信仰的影响,以及一些信仰是如何被病毒感染的。
我相信每个人都应该知道这些事情,就像每个人都应该知道地球绕着太阳运转,DNA分子编码我们的基因,以及恐龙在地球上生活了数百万年但现在已经灭绝一样。这很重要。我们面临的许多问题–从战争到气候变化–都是由错误的信仰或旧有大脑的自私欲望或两者共同造成的。如果每个人都能理解自己头脑中的想法,我相信我们会有更少的冲突,对我们的未来会有更阳光的预言。
我们每个人都可以为这一努力作出贡献。如果你是家长,请向你的孩子传授大脑知识,就像你举着橘子和苹果向你的孩子传授太阳系知识一样。如果你写儿童书籍,考虑写关于大脑和信仰的内容。如果你是一名教育工作者,问问如何将大脑理论作为核心课程的一部分。现在,许多社区将遗传学和DNA技术作为高中课程的标准部分来教授。我相信大脑理论同样重要,如果不是更重要的话。
我们是什么?
我们是如何来到这里的?
我们的命运是什么?
几千年来,我们的祖先一直在问这些基本问题。这是很自然的。我们一觉醒来,发现自己处于一个复杂而神秘的世界。生活没有说明书,也没有历史或背景故事来解释这一切是怎么回事。我们尽力使自己的处境合理化,但在人类历史的大部分时间里,我们都是无知的。从几百年前开始,我们开始回答其中的一些基本问题。我们现在了解了所有生物的化学基础。我们了解导致我们这个物种的进化过程。而且我们知道,我们的物种将继续进化,并可能在未来的某个时候灭绝。
类似的问题也可以问到作为精神存在的我们。
是什么让我们变得聪明和有自我意识?
我们的物种是如何变得聪明的?
智慧和知识的命运是什么?
我希望我已经说服了你们,不仅这些问题是可以回答的,而且我们在回答这些问题方面正在取得卓越的进展。我希望我还说服了你们,我们应该关注智力和知识的未来,而不是关注我们这个物种的未来。我们优越的智力是独一无二的,据我们所知,人类的大脑是宇宙中唯一知道更广泛的宇宙存在的东西。它是唯一知道宇宙的大小,它的年龄,以及它运行的规律的东西。这使得我们的智慧和知识值得保存。而且它给我们带来了希望,有一天我们可能会理解一切。
我们是智人,智慧的人类。希望我们会有足够的智慧,认识到我们是多么的特殊,有足够的智慧做出选择,确保我们的物种在地球上尽可能长久地生存下去,并有足够的智慧做出选择,确保智慧和知识在地球上和整个宇宙中生存得更久。
建议的读物
听说过我们工作的人经常问我,要想了解更多关于千脑理论和相关的神经科学,我推荐阅读什么。这通常会引起我深深的叹息,因为没有一个简单的答案,而且说实话,阅读神经科学论文是很难的。在我给你具体的阅读建议之前,我有一些一般性建议。
神经科学是一个庞大的研究领域,即使你是一个对一个子领域非常熟悉的科学家,你也可能在阅读不同领域的文献时遇到困难。而且,如果你是完全陌生的神经科学,可能很难开始。
如果你想了解一个特定的主题–比如说,皮质柱或网格细胞–而你对这个主题还不太了解,那么我建议从维基百科这样的资料开始。维基百科通常有关于任何主题的多篇文章,你可以通过追踪链接在它们之间快速跳转。这是我所知道的了解术语、观点、主题等的最快捷方式。你经常会发现,不同的文章有不同的意见或使用不同的术语。你会在同行评议的科学论文中发现类似的分歧。作为一项规则,你需要阅读多个来源,以了解对一个主题的认识。
为了更深入地挖掘,我推荐的下一个东西是评论文章。评论文章出现在同行评议的学术期刊上,但是,正如其名称所暗示的,它们对一个主题进行概述,包括科学家有分歧的领域。评论文章通常比典型的论文更容易阅读。引文也很有价值,因为它们将与某一主题相关的大多数重要论文列在一个清单中。寻找评论文章的一个好方法是使用谷歌学术等搜索引擎,并输入类似 “网格细胞的评论文章”。
只有在你了解了一个主题的命名、历史和概念之后,我才会建议你阅读个别科学论文。一篇论文的标题和摘要很少足以知道它是否有你要找的信息。我通常会阅读摘要。然后,我扫描图片,在一篇写得很好的论文中,图片应该讲述与文字一样的故事。然后我跳到最后的讨论部分。这一部分往往是作者明确描述论文内容的唯一地方。只有在这些初步步骤之后,我才会考虑从头到尾地阅读论文。
以下是按主题推荐的阅读材料。每个主题都有成百上千的论文,所以我只能给你一些建议,帮助你开始。
皮质柱
千脑理论是建立在弗农-蒙卡斯尔的建议之上的,即皮质柱具有类似的架构,并执行类似的功能。下面的第一份参考资料是蒙卡斯尔的原创文章,他在其中提出了一个共同的皮质算法的想法。第二份参考资料是Mountcastle最近的一篇论文,他在其中列出了许多支持其提议的实验结果。第三篇参考文献是由Buxhoeveden和Casanova撰写的,是一篇相对容易阅读的评论。虽然它主要是关于迷你柱的,但它讨论了与Mountcastle的主张有关的各种论点和证据。第四篇参考文献,由Thomson和Lamy撰写,是一篇关于皮质解剖学的评论文章。它对细胞层和它们之间的原型连接进行了彻底的回顾。它很复杂,但它是我最喜欢的论文之一。
蒙卡斯尔,弗农。“大脑功能的组织原则。单位模型和分布式系统”。在*《有思想的大脑*》中,由Gerald M. Edelman和Vernon B. Mountcastle编辑,7-50。Cambridge, MA:麻省理工学院出版社,1978年。
Mountcastle, Vernon.“新皮层的柱状组织”。大脑120(1997)。701-722.
Buxhoeveden, Daniel P., and Manuel F. Casanova.“神经科学中的迷你柱假说”。Brain125, no.5 (May 2002):935-951.
Thomson, Alex M., and Christophe Lamy.“新皮层局部电路的功能图”。神经科学前沿1(2007年10月)。19-42.
皮质层次结构
下面第一篇论文是由Felleman和Van Essen撰写的,就是我在第一章 中提到的那篇,它首次描述了猕猴新皮层中的区域层次结构。我把它包括在内主要是因为它的历史意义。不幸的是,它并不开放。
第二份参考文献是由Hilgetag和Goulas撰写的,是对新皮层中的层次问题的更深入的研究。作者列举了将新皮层解释为严格层次结构的各种问题。
第三份参考文献是Murray Sherman和Ray Guillery的一篇论文,认为两个皮质区域相互交谈的主要方式是通过大脑中一个叫做丘脑的部分。论文中的图3很好地说明了这个观点。谢尔曼和吉利里的提议常常被其他神经科学家所忽视。例如,前两个参考文献中都没有提到通过丘脑的连接。虽然我在这本书中没有谈到丘脑,但它与新皮层的联系非常密切,我认为它是新皮层的延伸。我和我的同事在2019年的 “框架 “论文中讨论了对丘脑通路的可能解释,下面将讨论这个问题。
Felleman, Daniel J., and David C. Van Essen.“灵长类动物大脑皮层的分布式分层处理”。大脑皮层1,第1期(1991年1-2月)。1.
Hilgetag, Claus C., and Alexandros Goulas.“大脑网络组织中的’层次'"。皇家学会的哲学交易B:生物科学375,第1796号(2020年4月)。
Sherman, S. Murray, and R. W. Guillery.“直接和经颅皮层连接的不同功能”。神经生理学杂志》106, no.3(2011年9月)。1068-1077.
什么和什么地方的路径
在第六章 中,我描述了基于参考框架的皮层列如何应用于新皮层中的什么和哪里的通路。第一篇论文,由Ungerleider和Haxby撰写,是关于这个主题的原始论文之一。第二篇论文,由Goodale和Milner撰写,是一个更现代的描述。在其中,他们认为对什么和哪里的路径的更好描述是 “感知 “和 “行动”。这篇论文没有开放访问。第三篇论文,由Rauschecker撰写,可能是最容易阅读的。
Ungerleider, Leslie G., and James V. Haxby.“人脑中的’什么’和’哪里'"。当前的神经生物学意见4(1994)。157-165.
Goodale, Melvyn A., and A. David Milner.“两条视觉通路–它们把我们带到了哪里,未来又会引向何处?"Cortex98 (January 2018): 283-292.
Rauschecker, Josef P. “哪里,什么时候,如何。它们都是感觉运动的吗?走向视觉和听觉中背侧途径的统一观点”。Cortex98 (January 2018): 262-268.
树突状尖峰
在第四章 中,我讨论了我们的理论,即新皮层的神经元利用树突状尖峰进行预测。这里我列出了三篇讨论这个话题的评论文章。第一篇由London和Häusser撰写,可能是最容易阅读的。第二篇由Antic等人撰写,与我们的理论更直接相关,第三篇由Major、Larkum和Schiller撰写。
London, Michael, and Michael Häusser.“树突状计算”。神经科学年度评论》28,第1期(2005年7月)。503-532.
Antic, Srdjan D., Wen-Liang Zhou, Anna R. Moore, Shaina M. Short, and Katerina D. Ikonomu.“树突NMDA尖峰的十年”。神经科学研究杂志》88(2010年11月)。2991-3001.
Major, Guy, Matthew E. Larkum, and Jackie Schiller.“新皮层锥体神经元树突的活性属性”。*神经科学年度评论》*36期(2013年7月)。1-24.
网格单元和位置单元
千脑理论的一个关键部分是,每个皮质柱都使用参考框架学习世界的模型。我们提出,新皮层使用类似于内丘皮层和海马中的网格细胞和位置细胞所使用的机制来实现这一点。要想对位置细胞和网格细胞有一个很好的概述,我建议阅读或聆听奥基夫和莫瑟夫妇的诺贝尔讲座,按照他们的顺序。他们三个人一起工作,做了一套协调的讲座。
O’Keefe, John.“海马阵中的空间细胞”。诺贝尔讲座。拍摄于2014年12月7日,在斯德哥尔摩卡罗林斯卡学院的Aula Medica。视频,45:17。www.nobelprize.org/prizes/medicine/2014/okeefe/lecture/。
莫泽,爱德华-I. “网格细胞和空间的边际地图”。诺贝尔讲座。拍摄于2014年12月7日,在斯德哥尔摩卡罗林斯卡医学院的Aula Medica。视频,49:23。www.nobelprize.org/prizes/medicine/2014/edvard-moser/lecture/。
Moser, May-Britt.“网格细胞、位置细胞和记忆”。诺贝尔讲座。拍摄于2014年12月7日,在斯德哥尔摩卡罗林斯卡医学院的Aula Medica。视频,49:48。www.nobelprize.org/prizes/medicine/2014/may-britt-moser/lecture/。
新皮层中的网格细胞
我们只是开始看到新皮层中网格细胞机制的证据。在第六章 中,我描述了两个fMRI实验,显示了人类在执行认知任务时存在网格细胞的证据。前两篇论文由Doeller、Barry和Burgess,以及Constantinescu、O’Reilly和Behrens撰写,描述了这些实验。第三篇论文,由Jacobs等人撰写,描述了人类在接受开脑手术时的类似结果。
Doeller, Christian F., Caswell Barry, and Neil Burgess.“人类记忆网络中网格细胞的证据”。*自然》*463,第7281期(2010年2月)。657-661.
Constantinescu, Alexandra O., Jill X. O’Reilly, and Timothy E. J. Behrens.“用网格状代码组织人类的概念性知识”。Science352, no. 6292 (June 2016):1464-1468.
Jacobs, Joshua, Christoph T. Weidemann, Jonathan F. Miller, Alec Solway, John F. Burke, Xue-Xin Wei, Nanthia Suthana, Michael R. Sperling, Ashwini D. Sharan, Itzhak Fried, and Michael J. Kahana。“人类空间导航中网格状神经元活动的直接记录”。自然-神经科学》16,第9期(2013年9月)。1188-1190.
Numenta关于千人脑理论的论文
这本书对 “千脑理论 “进行了高层次的描述,但并没有涉及很多细节。如果你有兴趣了解更多,你可以阅读我的实验室的同行评议的论文。它们包含了对特定组件的详细描述,通常包括模拟和源代码。我们所有的论文都是开放性的。以下是最相关的论文,并对每篇论文作了简要说明。
以下是我们最新的论文,也是最容易阅读的。如果你想更深入地了解完整的理论和它的一些影响,它是最好的开始。
Hawkins, Jeff, Marcus Lewis, Mirko Klukas, Scott Purdy, and Subutai Ahmad.“基于新皮层中网格细胞的智能和皮质功能框架”。Frontiers in Neural Circuits12(2019年1月)。121.
接下来的这篇论文介绍了我们的建议,即大多数树突状尖峰作为预测,而锥体神经元上90%的突触是专门用来识别预测的背景的。该论文还描述了组织成迷你柱的神经元层是如何创造出预测序列记忆的。这篇论文解释了其他理论无法解释的生物神经元的许多方面。这是一篇详细的论文,包括模拟,我们算法的数学描述,以及源代码的指针。
霍金斯,杰夫,和苏布泰-艾哈迈德。“为什么神经元有成千上万的突触,新皮层的序列记忆理论”。神经回路前沿10,第23期(2016年3月)。1-13.
接下来是我们首次提出每个皮质柱都能学习整个物体的模型的想法的论文。这篇论文还介绍了柱子投票的概念。这篇论文中的机制是我们2016年论文中介绍的预测机制的延伸。我们还推测,网格细胞表征可能构成位置信号的基础,尽管我们还没有研究出任何细节。这篇论文包括模拟、容量计算和我们算法的数学描述。
Hawkins, Jeff, Subutai Ahmad, and Yuwei Cui.“关于新皮层中的柱子如何实现学习世界结构的理论”。Frontiers in Neural Circuits11(2017年10月)。81.
下面这篇论文扩展了我们2017年的论文,详细研究了网格细胞如何形成位置的表示。它解释了这种位置如何能预测即将到来的感觉输入。论文提出了模型与新皮层六层中的三层之间的映射关系。该论文包括模拟、容量计算和我们算法的数学描述。
Lewis, Marcus, Scott Purdy, Subutai Ahmad, and Jeff Hawkins.“新皮质中的位置。使用皮层网格细胞的感觉运动物体识别理论”。Frontiers in Neural Circuits13 (April 2019): 22.
鸣谢
虽然我的名字作为作者出现,但这本书和 “千脑理论 “是由许多人创造的。我想告诉你他们是谁以及他们所扮演的角色。
千脑理论
自成立以来,有一百多名员工、博士后、实习生和访问科学家在Numenta工作。每个人都以这样或那样的方式为我们的研究和论文做出了贡献。如果你是这个群体中的一员,我感谢你。
有几个人值得特别一提。苏布泰-艾哈迈德博士是我15年来的科学伙伴。除了管理我们的研究团队,他还为我们的理论做出了贡献,创建了模拟,并推导出我们工作的大部分数学基础。如果没有苏布泰,在Numenta取得的进展就不会发生。马库斯-刘易斯也对理论做出了重要贡献。马库斯经常会承担一项困难的科学任务,并提出令人惊讶的想法和深刻的见解。路易斯-申克曼是一位非常有才华的软件工程师。他是我们所做的一切的关键贡献者。斯科特-珀迪和崔玉伟博士也对理论和模拟做出了重大贡献。
Teri Fry和我曾在红木神经科学研究所和Numenta公司一起工作。Teri专业地管理着我们的办公室和维持一个科学企业运行所需的一切。马特-泰勒管理我们的在线社区,是开放科学和科学教育的倡导者。他以令人惊讶的方式推进我们的科学。例如,他推动我们对内部研究会议进行现场直播,据我所知,这还是第一次。科学研究的获取应该是免费的。我要感谢SciHub.org,这个组织为那些负担不起的人提供了获取已发表研究的机会。
唐娜-杜宾斯基既不是科学家也不是工程师,但她的贡献是无可比拟的。我们一起工作了近30年。唐娜曾是Palm的CEO,Handspring的CEO,Redwood神经科学研究所的主席,现在是Numenta的CEO。当唐娜和我第一次见面时,我正试图说服她担任棕榈公司的首席执行官职务。在她下定决心之前,我告诉她,我的最终热情是大脑理论,而Palm是实现这一目标的手段。因此,在几年后,我将寻找时机离开Palm。其他人可能会在那一刻离开,或者坚持要我无限期地留在Palm。但唐娜把我的使命作为她的使命的一部分。当她在管理Palm时,她经常告诉我们的员工,我们需要公司取得成功,这样我就能追求我对大脑理论的热情。可以毫不夸张地说,如果不是唐娜在我们相遇的第一天就接受了我的神经科学使命,我们在移动计算领域取得的所有成功,以及我们在Numenta取得的所有科学进步,都不会发生。
这本书
写这本书花了18个月。虽然写作本身是一项孤独的工作,但我一直有一个伙伴和教练,即我们的营销副总裁克里斯蒂-马弗。虽然她之前没有写书的经验,但她在工作中学习,成为不可或缺的人。她开发了一种技能,可以看到我在哪些地方需要少说,哪些地方需要多说。她帮助我组织写作过程,并带领我们的员工对这本书进行审查。虽然这本书是我写的,但她的存在贯穿始终。Eric Henney,我在Basic Books的编辑,以及Elizabeth Dana,文字编辑,提出了许多建议,提高了该书的清晰度和可读性。詹姆斯-莱文是我的文学经纪人。我不能再强烈推荐他了。
我要感谢理查德-道金斯博士的愉快和慷慨的前言。他对基因和记忆体的见解对我的世界观产生了深远的影响,对此我很感激。如果我可以挑选一个人写前言,那就是他。我很荣幸他能这样做。
我的配偶珍妮特-施特劳斯(Janet Strauss)在我写这些章节时阅读了这些章节。根据她的建议,我做了一些结构上的改变。但更重要的是,她一直是我生命旅程中的完美伙伴。我们一起决定繁殖我们的基因。结果,女儿凯特和安妮,使我们在这个世界上的短暂停留变得高兴得无法形容。
发现你的下一本好书
获得偷拍、图书推荐和关于你最喜欢的作家的新闻。
点击这里了解更多 。
© Tri Nguyen / Tri Nguyen Photography
杰夫-霍金斯是神经科学研究公司Numenta的联合创始人,红木神经科学研究所的创始人,以及手持计算领域的创始人之一。他是美国国家工程院院士,也是《论智能》的作者。
插图的功劳
改编自Daniel J. Felleman和David C. Van Essen的《灵长类大脑皮层的分布式分层处理》,1991年,《大脑皮层》,1(1):1。
Bryan Derksen,根据GNU自由文档许可证的条款授权转载:https://en.wikipedia.org/wiki/en:GNU_Free_Documentation_License。 #calibre_link-48)