接近实际情况的全脑神经元群体的密集重建外文翻译资料

 2022-01-02 10:01

接近实际情况的全脑神经元群体的密集重建

摘要

我们的工具提供了一个特定的误差筛选系统, 用于快速定位密集的神经元中的亚微米误差, 并沿整个大脑的长投射, 从而实现接近真实情况的重建。我们的工具提供的算法可显著减少手动操作造成的干扰并实现高级自动化, 与半自动工具相比, 速度提高了5倍。我们还花费了较少的时间演示了在老鼠大脑的一个注射部位35个长程投射神经元的重建。我们的工具适用于各种光学显微镜的 10 tb 或更高的数据集, 并为重建神经元群提供了一个起点, 以便在单细胞水平上进行神经科学研究。

引言

在单细胞水平上绘制神经元组织形态图将缩短微观尺度和宏观尺度研究之间的差距, 并在细胞类型、神经回路和神经计算研究中发挥重要作用。成像和分子标记技术的最新突破提供了万亿字节大小的数据集,我们可以从该数据集以单轴分辨率测量神经元群体几乎完整的形态。一种特有的数据格式和数据分割模式以及被开发出来,用于浏览或可视化TB乃至PB的数据集然而,追踪这些大脑范围内的神经元投射非常具有挑战性。自动追踪工具适用于局部神经元群 (千兆字节大小) 不能延伸到整个大脑。就像 '雪球效应' 一样, 对于一个具有树状结构的神经元来说,微米级的追踪误差会导致巨大的误差,即后续的追踪出现误差就有可能将误差延伸到整个大脑。密集的神经突触使这种情况更加糟糕,因为密集的神经突触追踪仍然是一个未决问题,通常会导致追踪精度降低。实际上,半自动工具已经被应用于大数据集中的神经元追踪,其精度得到了广泛认可。然而,由于这些工具通常工作在非常低的自动级别,因此进行全脑重建非常费力和耗时。在大脑范围内重建大量的神经元将需要数千小时的手工劳动。

在此,我们建立了一个用于全脑范围群落重建的全局树重建系统(GTree)。在GTree中,我们开发了一种选择性显示模式来提高局部稠密重建的精度,并且获得了比用半自动软件重建精度更高的精度。此外,我们还引入了全脑误差筛选系统,以提高整个大脑的精度。此外,我们引入了算法,大大减少了密集的人工干扰,从而实现高层次的自动化重建。通过这些努力,我们展示了一个全脑范围的群落重建,其精确度接近实际情况,速度比半自动工具快至少5倍。

我们仅花费了较少的时间演示了在小鼠大脑的一个注射部位周围成功完成了35个长程投射神经元的重建。

GTree设计

除了局部神经元群重建,GTree可以实现全脑范围的重建(在线联机方法)。在进行全脑范围的GTree设计中,我们设计函数用来解决重建的关键步骤,包括树突重建、轴突重建和检查全脑范围的重建。此外,需要对于TB大小数据集进行多分辨率显示的技术也尤为重要。我们用多分辨率表示技术将全脑数据集分成许多子块,并选择第一子块(例如,包括目标神经元(soma)的3D兴奋区(ROI))开始跟踪(图1a)。一般来说,第一ROI主要含有胞体和树突。在第一个ROI中,我们使用NeuroGPS-Tree来自动重建目标神经元和其他神经元。我们在选择性显示模式(图1b)中修正了目标神经元的自动重建,其中重建误差很容易被发现。GTree可以同时自动记录被跟踪的树突接触第一ROI边界的位置。这些位置提供了选择后续ROI以跟踪目标神经元突触的线索。

在完成突触重建后,我们定位轴突的初始部分进行轴突追踪。类似于树突的追踪,实施了人工监督的检查程序,用于值得信赖的重建(图1c)。注意,除了第一个ROI(通常包括致密的神经突起)之外,所有ROI的神经突起在我们的分析中是稀疏分布的。因此,我们用NeuroGPS-Tree跟踪第一ROI中的神经突起,用SparseTracer27跟踪其他ROI中的神经突起,因为当神经突起稀疏分布时,SparseTracer比NeuroGPS-Tree具有更快的重建速度。如上述步骤所述(图。1b-c)在每个子块中进行人监督的重建。全脑神经元重建需要分析数百个子块,重建误差仍然不可避免。GTree使用重建导航(补充注2)来识别全脑范围的重建误差(图1d)。通过这种导航,我们可以极大地浏览重建和邻近的图像区域。浏览信息的目的是为了检查重建效果。通过使用这个导航模块,人们可以在1.5-2小时内大量检查大脑范围的重建。此外,为了生成接近实际情况的重建效果,一般策略是以实际情况为原则,不同的注解者重建相同的神经元。在这个过程中,确定重建之间的差异(图1e)是必不可少的步骤。基于散列查询方法(补充注释3),GTree在一秒钟内定位全脑重构之间的差异,这比普通方法快几百倍(补充图2)。

基于整个重建过程,我们证明了,除了选择性显示模式(联机方法)之外,GTree还提供了一个在大脑范围内彻底检查重建误差的系统(联机方法)。该系统贯穿整个重建的过程,保证了高精度的重建。

密集重建

我们使用了来自大脑新皮层的电信数据集评估了GTree的密集重建性能。数据集包含具有宽范围信号强度的密集神经突起(图2a和Video2),因此挑战了当前的自动重建方法(补充图3)。为了实现高精度的密集重建,我们在GTree(Online.)中设计了选择性显示模式。这种模式使我们能够通过移除其他不相关的信号来集中精力检查目标重构及其相关信号(图2b)。如果没有选择性显示模式,熟练地注释者会发现由于来自其他信号(图2b中的上面板)的干扰而引起的重建误差是非常费时和费力的。选择性显示模式消除了这种干扰,并能够有效地检查重建误差(图2b中的底板)。在选择性显示模式的设计中,我们考虑了这样的情况,即重构的神经元可以被映射为树形图,其中节点表示跟踪的神经突起(补充图4)。由于这种映射,在选择树形图的子结构时,相应的重建及其邻域图像可以被可视化(图2c)。在选择显示模式下,我们修正了用NeuroGPS-Tree生成的数据集群(图2a)的自动重建。我们提出了修改后的重建,其中单个神经元用不同的颜色显示(图2d和视频2)。为了量化由GTree和半自动软件驱动的重构的性能,我们设计了一个减少不同注释者之间重建分歧的操作。两个注释者被分成一组。一个提出重建,另一个检查提出的重建。GTree和半自动软件(Amira26)的总时间分别设置为4小时(通过检查重构占用三分之一的时间)或每个神经元12小时。使用此过程,GTree生成了相同种群的两个重构(GTree-a和-b)。我们提出了从GTree-a重建一个神经元,它显示出与NeuroGPS-Tree提供的重建有明显的差别,但接近实际情况的重建(图2e)。

我们对群落数据集(图2a)的重建进行了量化,包括5个具有回忆和精确率recall and precision rates的神经元(图2f)。为了计算这两个评价指标,接近实际情况的重建是必要的,并且可以通过采用投票策略来实现,从而对三个注解者进行的重构之间的差异达成共识28。我们发现gtree可以提供比神经GPS树更高的重建精度(图2f)。GTREE(GTREE-A)的召回率和准确率分别为96%和97%,而我们先前开发的软件NeuroGPS Tree的召回率和准确率分别为70%和69%。重建中的这一差异是显著的。我们还发现,用gtree生成的两组重建物(Kolmogorov-Smirnov检验,精确度:pgt;0.2;回忆:pgt;0.69)之间没有显著差异,说明gtree可以提供稳健的重建。

此外,我们证明了GTREE提供的重建比半自动软件更精确,这呈现出了能被广泛接受的高精度。考虑到一些带有错误的重建,我们使用加权回忆来量化由gtree和半自动软件驱动的群落重建。加权回忆指单个神经元重建的加权平均回忆率。权重与通过实际情况重建识别的单个神经元的轴突总长度成比例。gtree重建了神经元群,整体程度为96%(图2g)。每个神经元的时间成本在4小时内。相比之下,半自动软件的重建精度为88%,时间成本设置为每个神经元12小时。此外,增加重建时间(从8到12小时)并不能提高重建精度(图2g)。这一现象表明,对于半自动软件来说,要稍微提高神经突高度密集的群体数据集的准确性是一项极其困难的任务(图2h)。

全脑高精度重建

我们用10TB大小的图像评估了GTree在全脑重建中的表现。该数据集包含特殊标记的神经元,其形态跨越不同的大脑区域甚至整个大脑。该成像数据集为可信赖的重建提供了足够的信息,包括树突和远端轴突。我们在该数据集中随机选择了五个神经元,并生成了他们的地面实况重建(在线方法),以评估GTree和半自动软件之间的重建性能。我们提出了用GTree获得的这五个神经元的重建(图3a)。结果表明,重建的神经元表现出许多神经突,这些神经突分布在不同的脑区。我们还使用半自动工具(Amira)手动重建这五个神经元。当我们将神经元的半自动重建与GTree提供的重建进行比较时,我们发现这两个重建之间的差异可以忽略不计(图3b和补充图5)。我们基于回忆和精确率进一步量化了这五个神经元的重建(图3c和d)。结果表明,GTree的加权平均召回率和准确率分别为96%和98%,半自动软件的加权平均召回率和准确率分别为95%和94%。权重与地面实况重建中确定的神经突的总长度成比例。

GTree和半自动软件之间的重建结果相似。 我们得出结论,与半自动软件一样,GTree可以提供接近真实情况的全脑重建。 此外,我们使用GTree和半自动软件量化了这五个神经元重建的时间成本。 结果显示,GTree在重建单个神经元上花费了大约9个小时,这比半自动软件至少快5倍(图3e)。 在这个比较中,我们选择了训练有素的注释器(在线方法),并且这些注释器在具有独立磁盘冗余阵列(RAID)的相同计算平台设备上获得了重建。

高级自动化重建

在GTree中,我们为那些需要大量手工劳动的重建步骤开发了一系列算法。这里提供两种算法作为示例。一个用于检测神经突的最佳骨架,另一个用于识别具有弱信号的神经突。我们基于Lasso模型29将重建的骨架点(包括分叉点)校正到其最佳位置。最佳位置通常位于神经突的中心线处并且表现出最大信号强度。我们使用轴突数据集评估了基于Lasso的模型(补充图6a)。在重建过程中,共有19个子块需要对扭曲神经突的重建骨骼进行修复。利用lasso模型,自动修正17个子块中重建的骨架,避免了相应的人工编辑。我们给出了两个典型的检测示例(补充图6b-e)显示了基于lasso的模型的有效性。我们还建立了一种识别神经突弱信号的机器学习方法30。我们证明,识别方法可以大大减少使用3个子数据集块重建的人类编辑(补充图7a)。在对这些选定数据集的分析中,当配备了识别方法时,人类编辑的总数减少到18,而没有识别方法的编辑总数则减少到136(补充图)。7b-d)。此外,我们还计算了重建骨架中各点的信号背景比(补充图7e)。SBRlt;1.3的点占所有骨架点的80%,这可以解释为什么不使用识别方法就需要大量的人工编辑。

全脑范围的群落重建

我们使用gtree从整个小鼠脑成像数据集中重建了一组神经元。成像数据集包括35个锥体神经元,它们来自一个注射部位。尽管标记稀疏,但在影像数据集中仍常见致密的神经突。使用gtree,可以彻底重建成像数据集中的所有标记神经元(图4a和b,视频3,补充图8)。一个典型的神经元可以几乎完全重建,这样树突、局部轴突和远端轴突就很容易被识别出来(图4c)。重建允许应用定量形态测量,如每个神经元的轴突总长度(图4d)和冲击分析31(图4e)。根据重建速度(图3e)和重建测量(图4d)的信息,我们粗略估计用半自动软件重建所有35个神经元需要1300多小时(神经突总长396.7cm;速度3.4h/cm)。gtree将时间成本降低到250小时以下(速度,每厘米0.6小时)。这些结果表明,用半自动软件进行全脑人口重建需要极为繁重的劳动,利用GTREE可以改变目前的重建状态。

适用性

除了fmost数据集之外,我们还演示了gtree对其他类型的数据集的适用性。这些数据集是用不同的成像方式收集的,如连续双光子断层扫描8、光片32-34、双光子显微镜35等。STP数据集的轴向分辨率在10mu;m处较低。在这种情况下,gtree重建了跨越不同脑区的所有四个标记神经元。重建结果与实际情况36一致(补充图9)。我们进一步使用GTree重建通过光片显微镜收集的5组数据集33(补充图10和补充图11)。结果表明,GTree可以从具有低光学空间分辨率的数据集提供高精度重建。此外,使用两种类型的公共数据集,即使用宽视场,共焦或双光子显微镜获得的Diadem和BigNeuron数据集来测试GTree。在Diadem数据集37中,我们选择了Neocortical Layer 1 Axons(补充图12)和Hippocampal CA3 Interneuron图像堆栈(补充图13),并使用GTree对它们进行分析。重建表明,GTree在密集重建和极弱信号的情况下表现良好。使用BigNeuron数据集6,38,我们证明了GTree可以在强噪声点存在的情况下检测到弱信号(补充图14),并且还可以检测到曲折的神经突(补充图15)。从上述测试结果可以看出,GTree可以广泛应用于神经元重建。

讨论

在这项研究中,我们构建了软件工具GTree,以实现全脑神经元群体的密集重建,挑战半自动软件的半自动重建。与半自动软件相比,GTree实现了神经元群体的全脑重建,速度增益至少为5倍。除了包含了我们已经建立的工作,例如数据集15的多分辨率表示、神经突追踪27、局部神经元群的自动重建18和弱信号识别30,我们还设计了一套新的技术来克服全脑重建中的一系列挑战,包括识别压迫性神经突的形成,检查结核大小的数据集中的重建误差,以及重

全文共19303字,剩余内容已隐藏,支付完成后下载完整资料


英语原文共 30 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[2380]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。