香港理工大学ACS Nano:铁电调制下通过可重构神经形态视觉传感器实现目标运动检测

文摘   2024-10-08 17:19   美国  
点击蓝字
 
关注我们
为了方便各位同学交流学习,解决讨论问题,我们建立了一些微信群,作为互助交流的平台。
加微信交流群方式:
1.添加编辑微信:13162018291;
2.告知:姓名-课题组-研究方向,由编辑审核后邀请至对应交流群(生长,物性,器件);
欢迎投稿欢迎课题组投递中文宣传稿,免费宣传成果,发布招聘广告,具体联系人:13162018291(微信同号)

         

 

研究背景

静态图像预处理,包括降噪、亮度增强和识别,已经在不同的视觉架构中得到了广泛的应用。相比之下,物体运动检测(OMD)已成为各种应用(如健康监测、虚拟现实和智能交通系统)中至关重要且迅速发展的必需品。基于动态视觉系统的传统运动检测架构将传感器、存储器和计算单元分开,导致大量冗余数据和高功耗。在感知阶段,人类视网膜具有有效地感知和处理动态信息的固有能力。这种特性可以减少数据量,最大限度地降低功耗,从而提高信息处理的效率。神经形态视觉传感器,从生物神经系统得到灵感,已经开发来复制人类的视觉感知。在干扰和学习应用的背景下,具有高精度和高能效的神经网络起着举足轻重的作用。高度线性的、具有多个可区分层次的突触权重和良好的对称性极大地影响了视觉传感器系统的均匀性和精度。上述功能已成为图像识别、自动驾驶和虚拟现实运动学习等专业任务的基本要求。同时,提高整体能效和建立自供电系统对视觉传感器至关重要。通过降低功率要求,器件可以无缝连续地工作,这对于长期监控特别有价值。此外,神经形态视觉传感器在各种便携式硬件应用中表现出潜力,其中最小化功耗有效地减轻了散热问题。然而,开发一种包含上述优点的运动检测视觉传感器仍然是一个挑战,这些优点包括消除数据冗余,具有离散和稳定的多突触权重水平,以及降低功耗。在这方面,2D材料与铁电体的集成有希望。    

         

 

成果介绍

有鉴于此,近日,香港理工大学郝建华教授团队从物体运动敏感神经节细胞中获得灵感,提出了一种由铁电共聚物调制的WSe2同质结简单器件结构的OMD视觉传感器。在光学模式和中间铁电调制下,视觉传感器可以在零功耗下产生具有离散多态的渐进和双向光电流。该设计使可重构器件能够模拟突触权重更新的长时程增强和抑制,其具有82个状态(超过6位),均匀步长为6 pA。这种OMD器件还具有非易失性、可逆性、对称性和超高线性,拟合R2为0.999,非线性值为0.01/-0.01。因此,视觉传感器可以根据帧之间的亮度差异仅感知动态信息来实现运动检测,同时消除静态场景中的冗余数据。此外,利用线性结果的神经网络可以识别出基本的运动信息,识别准确率达到96.8%。本文还通过统一的3×3神经形态视觉传感器阵列展示了可扩展的潜力。本文的工作为实现基于可控和节能铁电可编程性的运动检测提供了一个平台。文章以“Object Motion Detection Enabled by Reconfigurable Neuromorphic Vision Sensor under Ferroelectric Modulation”为题发表在著名期刊ACS Nano上。

         

 

图文导读    

图1. 用于OMD的神经形态视觉传感器。(a&b)部分人视网膜的示意图,强调双极细胞、无长突细胞和神经节细胞,同时说明对局部和全局运动检测信息的不同反应。(c)具有PN和NP结构的神经形态视觉传感器,促进非易失性和中间负、正光电流的产生。(d)OMD功能说明,强调运动对象同时消除静态信息。

         

 

人类视觉系统具有准确感知运动和动作的能力,能够在复杂和不确定的环境中做出高速反应。在图1a中,本文说明了局部运动检测的实现,它依赖于人类视网膜复杂的细胞结构。在视网膜内,双极细胞作为整合中心,接受来自上游感光细胞(视杆细胞和视锥细胞)和横向无长突细胞的输入。无长突细胞有助于产生中心-周围拮抗作用,这是一种调节神经节细胞活动的环境效应。值得注意的是,这些神经节细胞对不同的运动表现出选择性反应,通过视神经向视觉皮层传递信息。具体来说,这些细胞对自我诱导的运动(如眼球运动)保持不活跃,但当有相对于整体背景的运动时,这些细胞表现出强烈的放电(图1b)。这些特性使得能够从静态场景中识别真实的运动,从而提高信息分析和计算效率。从人类视网膜中获得灵感,本文提出了一种具有双极性光电流特性的OMD。图1c显示了铁电体和2D材料在神经形态视觉传感器中的集成。在零偏置电压下,通过不同的脉冲使铁电栅极电介质沿相反方向极化,实现了PN和NP结的形成,具有较高的能效。当受到光照时,会产生自供电的正和负光电流。这些多功能的中间光电流状态能够实现具有非易失性特性的长时程增强(LTP)和长时程抑制(LTD)过程。此外,神经形态视觉传感器可以被制作成传感器阵列,以方便大规模集成。利用帧间差分计算,可以根据亮度差异从连续帧中检测出运动主体,同时消除固定亮度的静态或全局部分(图1d)。因此,单个神经形态视觉传感器晶体管可以执行多种功能,包括感知光学刺激,将其转换为多电平电信号,并最终执行类似于专门神经节细胞的OMD处理。    

         

 

图2. 铁电调制下的可重构WSe2器件。(a)WSe2/P(VDF-TrFE)晶体管的三维图像。(b)两个栅极等效电压下的转移曲线。(c)Ig-Vg曲线显示两个分离的铁电开关峰位于±14 V左右,测量方向为顺时针方向。(d&e)WSe2/P(VDF-TrFE)器件的铁电迟滞回线为p型和n型。(f)输出曲线对应于四种配置,P(VDF-TrFE)被±20 V栅电压脉冲极化。    

         

 

图2a显示了铁电调制的WSe2可重构晶体管的三维图像。选择WSe2作为沟道是因为其固有的双极性特性、高效的载流子可调性、强大的光-物质耦合和有效的吸收,其带隙范围约为1.35−1.64 eV。这些本征特性有助于通过铁电极化调制WSe2沟道内的载流子。此外,使用稳定的有机铁电材料,即P(VDF-TrFE)作为栅极电介质材料,确保了低温退火,并有利于与后端线的兼容性。通过在P(VDF-TrFE)层下使用两个分离的栅极,形成了独立的铁电极化畴。图2b说明了在两个不同区域施加相等的局部栅极电压来诱导完全极化。在这方面,WSe2/P(VDF-TrFE)器件是典型具有对称铁电迟滞的铁电场效应晶体管。在极化上(Pup)或极化向下(Pdown)状态下,电子和空穴可以在WSe2沟道内积累。这种结构有效地表现了WSe2的双极性性质,分别为n型和p型分支的明显逆时针和顺时针迟滞回线。此外,正和负铁电开关电流(Ig)具有接近相等的幅度和相似的特性(图2c)。这些发现验证了P(VDF-TrFE)共聚物的高质量以及P(VDF-TrFE)与WSe2之间良好的界面,从而有助于提高光伏性能。在非对称或单极性模式下,如图2d和e所示,铁电器件呈现p型或n型转移曲线。通过固定一个栅极并扫描另一个端子,分别在完全Pdown或Pup状态下观察到顺时针或逆时针的迟滞。在不同栅极设置模式下获得的这些转移曲线证明了超过107的高开关比和超过10 V的大存储窗口。所获得的转移特性强调了铁电调制的WSe2晶体管在各种电子应用(如逻辑电路)中的先进性能。此外,通过独立定义两个栅极,WSe2/P(VDF-TrFE)晶体管具有四条不同的输出曲线,如图2f所示。具体来说,当对两个栅极施加相反的栅极脉冲(±20 V,1 ms)时,器件表现出NP和PN结特性。输出曲线的特征包括整流比超过103和不显著的反向电流(Vds=±1.5 V),这与先前的发现一致。此外,WSe2沟道内的栅控区域可以精确调谐,当两个栅极被设置为相等时,显示具有准线性特性的NN或PP状态。 

         

 

图3. 可编程WSe2/P(VDF-TrFE)同质结。(a)通过铁电极化调制,描述同结逐渐转变的PFM相位图像。(b&d)PN和NP结的输出曲线,显示了器件在增加脉冲强度下的响应。(c&e)在Vds=±1.5时,PN和NP的源-漏电流随脉冲数的连续变化。(f)PN和NP配置不同输入强度下的Ids-Vds曲线。(g)PN和NP构型下Isc与光强度的线性关系。

         

 

通过多种极化条件下的相图,可以研究中间铁电极化态。图3a说明了这些过程,突出了在过渡过程中铁电调制多态的可能性。P(VDF-TrFE)完全极化,形成NP态,其相位差为-180°,如图3a的PFM相位图像(1)所示。在没有施加电压的情况下,P(VDF-TrFE)畴也可以被操控成具有中性相位差的混合构型,如图3a(2)所示。通过逐渐施加与NP态相反的电压,铁电畴经历了一个反向开关过程,如图3a的(3)~(5)所示。最终,PN结完全极化,相位差变为180°,如图3a(6)所示。PFM分析结果表明,通过对两个栅极施加相同绝对值的相反栅极电压脉冲,可以有效地切换铁电极化区,减小原有的内建电场,形成相反的内建电场。这允许PN和NP连接的微妙调节。从电子学的角度来看,电子和空穴的逐渐积累发生在内建场形成过程中。这种现象的动态过程如图3b和d所示。在脉冲振幅增强引起的渐进极化过程中,PN结和NP结的绝对沟道电流均呈逐渐增大的趋势。这种行为在Vds=1.5 V时提取的源-漏电流的持续上升中可以清楚地观察到(图3c和e)。值得注意的是,这种模拟电流调制行为突出了精细操控器件性能的能力。重要的是,在读取过程中,由于非易失性,栅极脉冲被去除。这种非易失性确保了存储的电荷和产生的电流保持稳定和持久。在450 nm光照下,随着功率强度增加,PN和NP光电二极管表现出短路光电流(Isc)(图3f)。这种光电流的产生源于p-n结,可以归因于光伏效应。具体来说,当器件被光照时,光敏WSe2层产生光生电子-空穴对,这些电子-空穴对被同质结的内建电场有效地分离。因此,在零偏置电压下诱导自驱动Isc,显示出很高的功率效率。值得注意的是,PN和NP结的光电流大小几乎相等。这种平衡的响应对于OMD的功能至关重要。此外,图3g显示了PN和NP光电二极管的Isc与输入功率强度之间的线性关系。这种线性响应意味着在光强度范围内具有一致和稳定的光探测性能。与光电晶体管相比,光电二极管的线性响应使其特别适合于传感器内计算应用的实现。    

         

 

   

图4. 非易失性WSe2/P(VDF-TrFE)晶体管的多光电流状态。(a&b)分别从NP和PN配置启动时产生的正和负光电流。(c&d)多个正和负光电流的稳定台阶。(e)具有高线性和对称性的双向LTP和LTD过程的两个循环。(f&g)循环1中部分LTP和LTD过程的放大图。(h)多光电流电平的非易失性。    

         

 

WSe2/P(VDF-TrFE)晶体管的可编程和非易失性允许在PN和NP结中实现中间光电流状态。通过施加一系列栅极电压脉冲并在一致的光强度下进行监测,可以获得不同的正和负光电流。以图4a设置为例,在栅极1(栅极 2)上初始施加持续时间为1 ms的20 V(-20 V)栅极电压脉冲,产生-180°相位差,形成NP结。这种结构在光照下产生正光电流。随后,在栅极1(栅极2)上施加一个-10 V(10 V)具有相同持续时间的栅极电压脉冲,然后是均匀步长为0.125 V的栅极脉冲。施加一系列栅极电压脉冲,逐渐减小正光电流,导致NP结的内建电场减小。从具有负光电流的PN结出发时,在图4b中观察到类似的现象。这种基于两个分离栅极的可重构架构为实现反向符号的可逆光电流可调性提供了一个自由方便的平台。写入过程包括设置与栅极1和栅极2相反的电压,而不需要任何额外的偏置电压。在读取过程中,只施加光脉冲,而由于非易失性,栅极电压和偏置电压被定义为零。图4c和d分别提供了放大视图。值得注意的是,正负光电流的变化表现出台阶状的行为,其特征是在每个光脉冲后持续增加或减少6 pA的变化。这种均匀的台阶模式由精确的铁电可编程性促进,标志着光电流的对称和非易失性调制,为随后的高精度运动识别任务提供了潜力。随着脉冲数逐渐增加,光电流从负值逐渐转变为正值,如图4e所示。根据光电流与有效光强度的关系,同样可以用双信号值调制WSe2光电二极管对应的光响应率。这种转变对应于从初始PN到最终NP结构的转变,从而实现了大约82个大于6位的离散状态分辨率。相反,通过在栅极1上施加负脉冲并在栅极2上施加正脉冲,诱导从NP到PN结构的转变,导致光电流返回负值。这种行为也产生了82种不同的状态,表明了高度对称的性质。为了获得更高的编程能力,可以通过扩大脉冲范围和减少脉冲步长来进一步扩大状态的数量。重要的是,多级正和负光电流都可以重复观察到,如图4e的循环2所示。P(VDF-TrFE)铁电材料提供了可重复的写入和擦除过程,使这种重现成为可能。    

这些以双向跃迁为特征的多能级光电流状态可以解释为LTP和LTD过程,类似于人工神经网络中的突触权值。对于每个单独的LTP和LTD过程,所有的渐进光电流都表现出线性,R2系数约为0.999。与以往的研究相比,0.01/-0.01的非线性值进一步凸显了高性能神经网络计算的潜力。为了证明多功能LTP和LTD状态响应光脉冲的线性和均匀性,本文研究了单个周期内部分LTP和LTD的特定突触过程。图4f和g中描述了这些详细的演示,它们相应地说明了图4e中LTP和LTD过程的放大视图。因此,铁电极化的逐渐切换有利于突触功能的模拟,并产生了观察到的突触权重更新的线性。与其他离子迁移和空位生成机制相比,上述铁电控制的多态为神经网络训练过程中的精确性能提供了稳定和可预测的方式。此外,图4h显示了21种不同的光电流状态的长期稳定性,包括正、负和近零状态,通过两个分离的栅极精细调节铁电极化可以扩展到更多的状态。这些状态在150 s内表现出稳定性。可重构WSe2/P(VDF-TrFE)器件将光信号传感、计算和内存存储功能融合在一个器件内。这种全面的组合使得产生线性、均匀、双向和多重光电流响应,从而促进物体运动敏感操作,其功能与视网膜神经节细胞的功能非常相似。

         

 

   

图5. 基于可重构WSe2/P(VDF-TrFE)神经形态视觉传感器的OMD操作。(a)不同帧时刻的亮度像素乘以相应的正和负光电流矩阵。(b)原始图像的亮度分布,由921600像素组成。(c-e)运动检测后,静态图像、td处动态图像、te处动态图像的输出亮度分布。(f)通过神经网络识别动态目标。(g)40个周期的识别准确率结果,训练时准确率达到96.8%。

         

 

神经形态视觉传感器可以利用双向光电流的对称性和线性多态,在一个硬件中复制视网膜的功能。这些器件可以模仿运动敏感神经节细胞的功能,有效地从周围背景中识别和收集运动目标信息。OMD的工作机理和操作流程如图5a所示。根据从开始时刻到结束时刻的时间序列,可以将动态视频分割成许多独立的帧。随着时间线,客厅在初始时刻是空的,为随后的比较提供了一个静态的全局背景。在一个确定的时间间隔内,例如从tb到tj,一个人进入客厅,在不同的时刻展示不同的手势,然后离开房间。个体充当了与原始静态环境形成对比的元素。为了验证运动检测的结果,以第1帧和第2帧为例。假设每帧图像由M×N个亮度像素组成,其原始亮度分布如图5b所示,亮度值归一化在0到1之间。另一方面,2D WSe2/P(VDF-TrFE)神经形态视觉传感器的光电流态可以组装成正和负M×N光电流矩阵,由于其对称性和线性,其绝对值近似相等。为了进行帧差分计算,将M×N正电导矩阵和M×N负电导矩阵分别与ta和td不同时刻的图像亮度像素相乘。然后将两个相乘的分量相加以映射输出像素的亮度结果,从而可以检测客厅中移动的人。由于神经形态视觉传感器的非易失性,这些结果在相应时刻存储在像素内。本文还进行了不同手势的演示,例如分别在td和te时刻挥手和竖起大拇指。处理后的亮度输出可以有效地捕捉到这种微小的差异。在特定时间段内,当背景保持静态且没有移动物体存在时,输出像素的亮度接近于零,如图5c所示。这种现象是由于正负M×N光电流矩阵的绝对值相等。相比之下,当个体在特定时间范围内出现时,与移动的人相关的亮度像素显示高于零的值(图5d和e),服从正态分布,而静止背景像素的亮度仍然为零。此外,与移动对象相关的重要信息被输入到一个人工神经网络中,如图5f所示,利用WSe2/P(VDF-TrFE)的高线性LTP和LTD行为。为了模拟目的,本文利用修改的MNIST手写数字数据集和三层网络。超过40个周期的精度如图5g所示。在初始阶段,识别准确率显著提高,峰值达到96.8%。高精度源于基于可控铁电极化的线性、对称、可分辨权重更新。因此,WSe2/P(VDF-TrFE)神经形态视觉传感器展示了OMD过程,类似于某些神经节细胞,这种仿生方法通过节能的预处理平台强调运动物体,减少了冗余数据的产生和传输。    

         

 

总结与展望

本文采用了一种可重构的2D WSe2/P(VDF-TrFE)神经形态视觉传感器,具有简单的器件结构和方便的构造策略,用于运动检测。高精度编程能力是运动信息处理的重要组成部分。以往各状态的波动没有可区分和统一的台阶,阻碍了各种神经形态的应用。本文的神经形态视觉传感器通过渐进的铁电极化展示了可编程的可调性,能够产生超过6位和均匀步长为6 pA的自供电双向光电流。这些光电流具有非易失性、对称性、可逆性和高线性等特性(R2=0.999)。本文实现了高效的运动检测,通过仅从运动物体收集信息,同时通过双向光电流状态最小化冗余数据,就像人类视网膜中的神经节细胞一样。此外,构建的人工神经网络识别基本运动信息的准确率达到96.8%。神经形态视觉传感器集成了光信号感知、多状态记忆和节能调制能力,为其他人工视觉硬件带来了巨大的前景。本文还展示了一个可扩展应用的3×3神经形态视觉传感器阵列。由于大规模集成的限制,本文提出的仿生视觉传感器在超视觉和自动驾驶等实际应用方面仍处于起步阶段。此外,P(VDF-TrFE)作为一种典型的铁电共聚物,具有柔软、轻盈、制造工艺简单等特点,可用于高性能柔性电子器件。具有柔性的铁电/半导体异质结可以完整地转移到任意衬底上。探索自供电和可重构的视觉传感器芯片以及集成和柔性的硬件对智能视觉系统的发展具有重要的潜力。

         

 

文献信息

Object Motion Detection Enabled by Reconfigurable Neuromorphic Vision Sensor under Ferroelectric Modulation

ACS Nano, 2024, DOI:10.1021/acsnano.4c10231)

文献链接:https://pubs.acs.org/doi/10.1021/acsnano.4c10231


,以及各种测试分析,


h-BN

低维 昂维
分享最前沿二维材料动态。
 最新文章