美国南加州大学电气与计算机工程系的研究人员提出了一种光学神经网络( ONN) 架构,该架构利用奇偶校验时间 (PT) 对称耦合器作为其构建块。与传统的 ONN 相比,PT-ONN 实现了相当的准确度(67% 对 71%),同时避免了与改变相位相关的问题。相关研究发表在《Optica》上。
采用 冯·诺依曼(Von-Neumann) 架构的现代电子产品计算能力在本质上受到处理和存储单元之间数据传输速率的限制。新兴的计算架构,例如神经形态方法,通过将逻辑与内存交织在一起,代表了更有效的计算方案。近年来,光学平台再次被提议作为完全/部分取代基于电子的计算机器的有希望的候选者。光计算尤其令人感兴趣,因为它需要更低的每比特能量和更少的延迟。 2017 年,麻省理工学院的一组研究人员通过级联多个 Mach-Zehnder 干涉仪 (MZI) 在硅芯片上展示了一个突破性的、完全集成的光学神经网络 (ONN) 。通过计算每个 MZI 的相应相位,可以将任意矩阵有效地映射到该 ONN 硬件上。对于此类网络,所需的非线性可以通过各种方法来实现,这些方法利用比如强度调制器、相机的饱和效应、光电二极管的二次非线性、半导体放大器的饱和和可饱和吸收器。从那时起,人们提出了许多方案来进一步优化这些阵列的实现及其片上训练过程。
虽然 ONN 在学术和工业环境中都受到了相当大的关注,但现在很明显,改变芯片上的相位是不可取的,并且会显着掩盖光子加速器的潜在优势。在这些布置中,相变通常由热光移相器完成,其中施加偏置电流以通过热光效应改变光波导的折射率。然而,由于大多数光电材料的热光系数相对较小,将其转换为相变通常需要为数十至数百微米的路径长度。假设要处理N位数据,O (N^2) 由于需要移相器,随着数据量的增加,这种方案可能会导致非常大的结构。此外,相变生效所需的时间相对较长,约为数十微秒,这会限制片上训练过程的速度,其中需要频繁地改变相位来计算梯度。最近的一些工作旨在通过提出利用光学快速傅立叶变换 (OFFT) 、环形谐振器、声光调制器和 3D 打印的替代架构来解决这些问题。其他基于相变材料、电吸收和电光效应的方法也可以解决其中的一些问题,但该技术仍在成熟中。
这里,研究人员提出了一种基于奇偶校验时间 (PT) 对称耦合器的新架构,该架构可以通过使用 III-V 族半导体或其他增益材料中的光学增益损耗来部分解决当前 ONN 的一些问题,他们将这种架构称为 PT 对称 ONN (PT-ONN) 。它借用了文献《深度学习相干纳米光子电路》中的级联结构,以确保有大量的自由参数可用,并且网络具有足够的表现力来区分模式。研究表明,即使在低/中等增益损失对比度水平下,该网络也可以提供与具有移相器的无源光学系统相媲美的性能。研究人员还讨论了有关这些网络的物理实现的一些实际考虑。比如,他们用 PT 对称耦合器替换移相器的方法有可能显着降低能耗、提高训练速度并降低片上 ONN 的占用空间;可以使用更新颖实用的 PT 配置来进一步改进 ONN 的运行。
图注,两层 PT-ONN 的整体结构。
PT-ONN 的主要构建块是一个两级 PT 对称定向耦合器,其增益-损耗因子可以单独或一起调整。通常,如果结构在 P(空间)和 T(时间)反演算子的同时作用下不变,则该结构被认为是 PT 对称的。尽管具有非厄米表示,但这些系统可能仍然支持完全真实的谱(特征值)。虽然最初是在量子力学的背景下发展起来的,但 PT 对称概念最近在不同的光学领域引起了相当大的关注,包括光子晶格、微谐振器、光栅、传感器、无线电力传输和激光器,仅举几例。在光学设置中,如果折射率的实部是空间的偶函数,则结构是 PT 对称的,而虚部(代表增益和损耗)呈现奇数分布。在这里,PT 耦合器是指一种耦合波导系统,其中一个通道获得增益,而另一个通道具有等量的损耗。因此,传播常数是特征值,而电磁模式代表系统的特征向量。增益-损耗对比与耦合的比率作为一个参数,在很大程度上决定了结构的响应。事实上,当这个比值等于 1 时,可以证明结构的特征值和特征向量合并。这个代表自发对称破缺的点被称为例外点。这项研究中,研究人员在 PT 不间断状态下运行 PT 耦合器,其中控制参数小于 1,并且系统在异常点以下工作。证明了使用增益-损失对比度作为训练参数的 PT-ONN 架构可以实现与由带移相器的 MZI 设备组成的 ONN 中报告的精度相当的片上训练和测试精度。PT-ONN 还表现出对其参数(θ′ s)变化的鲁棒性,此外还具有占用空间更小、功耗更低以及训练速度可能更高的优势。
这种方法的另一个好处是可以以单片方式使用 III-V 族半导体材料实现整个 PT-ONN。所需的增益-损耗可以通过泵浦来实现,实现非线性的一种可能候选者是 III-V 族可饱和吸收器。可以使用量子阱混合 (QWI) 方法 来实现波导,该方法通过诱导缺陷或选择性区域再生长来改变 III-V 族材料的折射率。最后,检测器可以通过外延再生长工艺在芯片上实现。随着异构集成的进步,人们还可以设想一个多材料平台来实现所需的功能。
虽然在这项研究中,研究人员仍然忠实于精确的 PT 对称耦合器,但众所周知,如果其中一个波导名义上是无损耗的(例如,通过混合)并且应用了增益损耗,则该设备的功能基本上不会受到影响专用于另一个波导,可以在未来的工作中探索允许更易于制造的布置的 PT 耦合器的新颖设计。
需要注意的是,与基于 MZI 的 ONN相比,所提出的PT-ONN 无法通过算法计算相应的片上参数轻松地将现有的权重矩阵映射到硬件上。一些量子神经网络也是如此,虽然由于硬件差异(或组件不精确),这种映射几乎不会导致平台正常运行,但它提供了一个很好的起点,可以使用片上训练方法对网络进行微调。找到更好的策略来初始化 PT-ONN 的片上参数可能会在未来引起人们的兴趣。