谷歌发布史上最强人类大脑「地图」，在线可视3D神经元「森林」！

08月

3163 0

来源：机器学习研究组订阅

突触，是神经网络的「桥梁」。我们知道，人类大脑有860亿个神经元，因为有了突触，才可以把神经元上的电信号传递到下一个神经元。

长久以来，科学家们一直梦想通过绘制完整的大脑神经网络的结构，以了解神经系统是如何工作的。不知你是否看过高分辨自动重建的3D大脑皮层地图？近日，谷歌与哈佛大学的Lichtman实验室合作，发布了最新的「H01」数据集，这是一个 1.4 PB 的人类脑组织小样本渲染图。 H01 样本通过连续切片电子显微镜以 4nm 分辨率成像，再通过自动计算技术重建和注释，最后可以看到初步的人类大脑皮层结构。（警告：密集恐惧者请绕行）

该数据集包括覆盖大约一立方毫米的皮质组织，带有数万个神经元、数个神经重建元片段、1.3 亿个带注释的突触、104个校对细胞以及许多其他亚细胞注释和结构。

△ 左：数据的小子| 右：数据集中 5000 个神经元，以及兴奋性（绿色）和抑制性（红色）连接的子图所有的数据都可以通过Neuroglencer进行访问。

H01是迄今为止所有生物中对大脑皮层进行这种程度的成像和重建的「最大样本」。也是「第一个大规模」研究人类大脑皮层的「突触连接性」的样本，这种连接性跨越了大脑皮层中所有层面的多种细胞类型。

这个项目的主要目标是为研究人类大脑提供一种新的资源，并改进和扩展连接组学的基础技术。目前，这项研究的最新成果「A connectomic study of a petascale fragment of human cerebral cortex」已经发表在bioRxiv上：

△ 论文地址：https://www.biorxiv.org/content/10.1101/2021.05.29.446289v1 大脑皮层「地图」：1.3亿个突触，数万个神经元

首先，你必须先了解下神奇的大脑皮层（cerebral cortex）。

大脑皮层是脊椎动物大脑的薄表层，属于脑和整个神经系统演化史上最晚出现、功能上最为高阶的一部分，在不同的哺乳动物中显示出「最大的尺寸差异」(尤其是人类)。大脑皮层的每一部分分为6层，每层有不同种类的神经细胞(例如刺星状神经细胞)。大脑皮层在大多数「高级认知功能」中起着关键作用，如思考、记忆、计划、感知、语言和注意力。

虽然在理解这种非常复杂的组织的宏观结构方面已经取得了一些进展，但是它在单个神经细胞水平上的结构及其相互连接的突触在很大程度上还是未知的。 人脑连接组学: 从外科活检到3D数据库 根据单个突触的分辨率绘制大脑结构图需要高分辨率的显微技术，这种技术可以对生物化学稳定(固定) 的组织进行成像。

研究团队与马萨诸塞州综合医院（Massachusetts General Hospital，MGH）的脑外科医生合作，他们在进行治疗癫痫的手术时，有时会切除正常人类大脑皮层的一部分，以便进入大脑深处癫痫正在发作的位置。切除的组织通常会被丢弃的，研究团队得到了病人的匿名捐赠，供Lichtman实验室的同事做研究。

哈佛大学的研究人员使用自动化磁带收集超微切片机，将组织切割成大约5300个30纳米的切片，将这些切片放置在硅晶片上，然后在一个定制的61束平行扫描电子显微镜下以4纳米的分辨率对大脑组织成像，快速获取图像。对5300个物理切片进行成像，产生了2.25亿张独立的二维图像。然后，研究团队通过计算将这些数据拼接（stitch）和对齐（align）产生一个单一的3D体积。虽然数据的质量总体上是很好的，但这些对齐通道必须强健，这样才能应对一些挑战，包括成像伪影（imaging artifacts）、缺失部分、显微镜参数的变化以及组织的物理拉伸和压缩。一旦对齐，一个使用了数以千计的谷歌云TPU、多尺度的flood-filling Network（FNN）管道就会被应用于生成组织中每个单独细胞的3D分割。 FFN是第一种自动分割技术，能够产生足够精确的重建。其他的机器学习管道被用来识别和描述「1.3亿个突触」，将每个3D片段分成不同的「子区域」(例如轴突、树突或细胞体) ，并识别其他感兴趣的结构，例如髓磷脂和纤毛。自动重建的结果并不完美，所以还需要人工来「校对」数据中的大约100个细胞。随着时间的推移，研究团队希望通过额外的人工努力和自动化的进一步发展，在这个经过验证的集合中添加额外的细胞。

△ H01: 大约1立方毫米的人脑组织在1.4petabytes的图像捕获 Neuroglancer：大脑皮层可视化工具

图像数据、重建结果和注释可以通过一个交互式的基于网络的3D可视化界面进行显示，这个界面叫做Neuroglancer，最初是为了可视化果蝇的大脑而开发的。 Neuroglancer是一种开源软件，广泛应用于连接组学领域。为了支持 H01数据集的分析，引入了一些新的特性，特别是支持基于数据集的类型或其他属性搜索特定的神经元。 △ 连接H01和注释的Neuroglancer接口。用户可以根据细胞的层次和类型选择特定的细胞，可以查看输入和输出的突触。 继最大果蝇大脑地图和神经元3D模型之后

2019年，谷歌与霍华德 • 休斯医学研究所以及剑桥大学合作，通过Flood-Filling Network算法和TPU芯片，将果蝇大脑切分成数千个40纳米的超薄切片，并且使用透射电子显微镜生成每个切片的图像，产生了40万亿像素以上的果蝇大脑影像，然后将2D图像排列对齐形成完整果蝇大脑的3D图像。首次成功重建了果蝇大脑神经元的3D模型，但并未揭示有关果蝇大脑神经元「连接性」的信息。

△ 40 万亿像素下的果蝇大脑重建 2020年，谷歌发布有史以来最大、最详尽的果蝇大脑地图，对果蝇大脑中神经元连接的高度详细的绘制。去年年初，谷歌与霍华德 • 休斯医学研究所（HHMI）的FlyEM团队等，发布了「半脑」连接组（「hemibrain」 connectome），绘制的图像涵盖了25000个神经元，按体积计算，大约占果蝇大脑的三分之一。目前的研究中，谷歌研究人员依然面临的技术难题。因为，H01 是一个PB级的数据集，但只有整个人类大脑容量的百万分之一。将突触级别的大脑映射到整个老鼠大脑 (比 H01 大500倍) 仍然存在严重的技术挑战，更不用说整个人类大脑了。其中一个挑战就是数据存储: 老鼠的大脑可以产生价值 1EB 的数据，而存储这些数据的成本很高。为了解决这个问题，谷歌研究人员使用基于机器学习的去噪策略来压缩至少17倍的数据。未来，数据集的庞大规模要求研究人员开发新的策略来组织和访问连接数据中固有的丰富信息。这将是谷歌研究者未来依然努力的方向。

来源: 机器学习研究组

标签：人工智能