研究背景:脑认知与人工智能
如果你想要理解大脑认知的原理、想要突破人工智能,或者说想要构建一个物理系统,使之能像大脑一样感知和思考,应该从哪里入手呢?
广义上讲,大脑是一个计算系统,它大概是由不太复杂但数量庞大的计算单元(神经元)组成的。虽然在发育关键期,外部刺激对大脑神经网络布线有重要影响,但外部刺激和学习记忆应该不是决定性的因素。通过复杂的刺激训练,并不能使一个规模庞大、但结构简单的神经网络自动产生多少智能。事实上,亿万年缓慢的生物演化,使大脑具有复杂的网络初值,这应该才是智能的关键。如果我们还没有能力设计出一种比自然演化更高效的算法,自动搜索出智能系统,也没有足够高的智慧或者足够好的运气,直接设定智能系统的初值,那么,从神经生理层面,研究真实大脑的神经线路,将是值得考虑的做法。
视觉认知
最初级的智能起始于感觉系统,人脑信息输入有超过80%来自视觉,脑认知的内部运作也主要基于视觉概念。视觉认知主要功能是识别,另一个则是空间定位,这对应于生理学上的What和Where通路。视觉系统的智能体现在视觉不变性,偏离注视点或者大小不同的同一个客体,均能被视觉系统准确快速地识别,而这些视觉客体在视网膜甚至是初级视皮层上的激活区都发生了很大的变化,这也是理解视觉识别的最大障碍之一。知觉不变性对应了思维的基本元素——概念,进而也是大脑构建知识系统及产生智能的基石,就像是底层的操作系统和汇编语言,虽然艰涩难懂,但却是最终理解脑认知不能回避的问题。
研究方向
1960年代Hubel和Wiesel的发现或许已经解答了一条简单的线段是如何被识别出来的,即:对于可能出现在各个位置的、不同朝向的线段,大脑都预制了对应的检测细胞。这种简单策略在识别稍微复杂的图形的时候就会遇到困难,我们或许可以设想大脑预制了针对两条线段组合的细胞,那么三条线段或者更为复杂的图形又该怎么办呢?不幸的是,现实中的图形大多都比线段复杂,识别轮廓中局部线段的朝向,那只是个开始。真正的挑战在于,视觉系统是如何利用这些分散的朝向信息,识别出一个完整的图形。
我们研究那些比bar稍微复杂一点的图形,例如一条比bar长一点的线段,是如何被大脑识别出来的,进而了解视觉认知最基本的原理。为此,我们建立了先进的视觉认知行为和神经生理学实验平台,采用电极阵列、光学成像、分子生化、双光子等研究技术,探测视觉皮层复杂的神经线路,研究视觉系统如何同时产生形状识别的选择性和不变性。