当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

来源:机器之心 2024-03-31 21:09:33 0浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用
编辑 | X

在光复用中,通道之间的正交性扮演着至关重要的角色。这种正交性确保了不同通道之间的信号不会相互干扰,从而实现了高效的数据传输。光复用系统能够同时传输多个通道的数据,有效提高了光纤的利用率。然而,这种系统也不可避免地会施加复用容量的上限。

在此,广东工业大学通感融合光子技术教育部重点实验室开发一种基于深度神经网络的多模光纤(MMF)上的非正交光复用,称为散斑光场检索网络(Speckle light field retrieval network,SLRnet),它可以学习包含信息编码的多个非正交输入光场与其对应的单强度输出之间的复杂映射关系。

通过原理验证实验,SLRnet成功解决了MMF上非正交光复用的不适定问题。它能够利用单发散斑输出明确地检索由相同偏振、波长和空间位置介导的多个非正交输入信号,保真度高达98%。这项研究为实现高容量光复用利用非正交通道铺平了道路,是迈向这一目标的重要一步。

这项研究将推动光学和光子学领域的潜在应用,并为信息科学与技术等更广泛学科的探索提供新的启示。

相关研究以《Non-orthogonal optical multiplexing empowered by deep learning》为题,于 2024 年 2 月 21 日发表在《Nature Communications》上。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

论文链接:https://www.nature.com/articles/s41467-024-45845-4

光复用问题

复用(Multiplexing)是光通信的基石,其中复用通道之间的物理正交性是大规模编码信息传输的先决条件。

考虑到多个正交信号的解复用(Demultiplexing),传输矩阵方法(例如 MMF)甚至可以在强散射介质上解决这个问题。

最近,深度学习已广泛应用于光学和光子学领域,用于光学器件和计算光学的逆向设计。具体来说,深度神经网络已被用来提高多重散射介质上正交复用的性能。

然而,迄今为止,所有报道的复用场景都严格依赖于多路复用通道之间的物理正交性。目前还没有尝试利用深度学习的非线性建模能力来实现 MMF 上的非正交光复用。

不幸的是,即使在单模光纤中由相同偏振或波长介导的非正交信道的复用仍然非常具有挑战性,这是由于缺乏有效的解复用方法或数字信号处理负担过重。因此,开发一种新的方法来解码非正交输入通道中编码的信息对于最终的光复用至关重要。

基于深度神经网络的 MMF 上的非正交光复用

在此,研究人员证明了在 SLRnet 的支持下可以通过 MMF 实现初步的非正交光复用。

作为概念验证演示,可以利用非正交输入通道实现通过 MMF 的信息复用传输,包括一般自然场景图像、不相关的随机二进制数据和不属于同一类型训练数据集的图像,有利于实现光信息的非正交复用传输。

通过数据驱动技术在非正交输入通道和输出之间建立复杂的关系,训练有素的深度神经网络只需使用单次输出强度即可检索非正交通道的编码信息。即使是共享相同偏振、波长和输入空间区域的非正交复用通道也可以被有效地解码。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 1:MMF 上的非正交光复用示意图。(来源:论文)

神经网络架构

深度神经网络能够从 MMF 的单个散斑输出中检索非正交光复用信号。由任意偏振组合介导的多个幅度和相位编码信息在 MMF 中传播后可以被 SLRnet 有效地检索。

如图 2a 所示,即使是具有相同偏振、波长和输入空间区域的非正交输入通道的典型场景也可以被显式解码。这是通过深度神经网络实现的,其架构如图 2b 所示,它是根据 MMF 独特的多重散射过程的 Unet 的变体。它由全连接(FC)层和 ResUnet 组成。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 2:通过深度学习实现 MMF 上的非正交光复用。(来源:论文)

实验结果

首先考虑 MMF 长度为 1m 的情况。图 3a 展示了 SLRnet 训练过程中具有任意偏振态组合的两个复用光场通道的检索保真度的演变。总的来说,在幅度和相位维度上将有四个编码通道,根据偏振状态,它们可以是非正交的。检索到的保真度是通过皮尔逊相关系数(PCC)来衡量的。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 3:使用 SLRnet 的非正交复用性能。(来源:论文)

从图中可以看出,使用相同的 SLRnet 训练配置检索到的 PCC 在 100 个 epoch 后的演化大于 0.97。同时,十二个复用场景的检索保真度的演变基本相同,这展示了非正交复用对于任意偏振组合的出色稳健性。

此外,图 3b 提供了分别使用不同的偏振组合在每个幅度和相位复用通道中检索到的保真度。幅度和相位维度上的平均检索保真度几乎相同( ~ 0.98),这凸显了 SLRnet 对多个非正交输入通道中编码的信息进行解复用的能力。

为了对波前编码的检索信息进行 sensory 评估,四种偏振组合(0° 和 0°、0° 和 10°、0° 和 90° 以及 0° 和椭圆)的典型解复用结果如图 4 所示。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 4:1 m MMF 上的非正交复用结果。(来源:论文)

可以看出,使用相同偏振在输入波前的幅度和相位上复用的四个灰度图像可以利用单次散斑输出有效地解复用。在不同偏振组合下检索到的其他结果的保真度相似,这表明即使编码波前被 MMF 扰乱,SLRnet 也能够实现前所未有的非正交输入通道复用。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 5:50 m MMF 上的非正交复用结果。(来源:论文)

为了进一步巩固 SLRnet 在更现实的场景中的优越性,提出了在 50 m MMF 上使用相同偏振态的非正交光复用结果,如图 5 所示。从图 4 和图 5 可以看出,1 m MMF 的解复用结果比 50 m 情况要好,这是因为较长的 MMF 的散射特性更容易受到环境的影响。通过优化网络结构可以进一步提高解复用性能。研究表明,SLRnet 是 MMF 中复用非正交信道的有效手段。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 6:一般自然场景图像和不属于 ImageNet 数据库的图像在 1 m MMF 上非正交复用的结果。(来源:论文)

最后,展示 SLRnet 对于不同图像集的通用性,研究表明 SLRnet 具有良好的泛化性。

尽管现阶段所提出的基于 MMF 的非正交光复用概念不能直接用于通常需要统一保真度的医疗诊断,但高精度的非相关二进制数字信息的非正交复用表明,通过 MMF 实现光信息的非正交复用传输向前迈进了一步。

该研究不仅可以为利用高吞吐量 MMF 进行通信和信息处理铺平道路,而且还可能为光学及其他领域的光复用提供范式转变,这可以大大提高光学系统的自由度和容量。

今天关于《保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于深度学习,理论,AI+光学的内容请关注golang学习网公众号!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
WIN10隐藏搜索框的操作流程WIN10隐藏搜索框的操作流程
上一篇
WIN10隐藏搜索框的操作流程
win11双击文件夹转圈圈卡死怎么办?
下一篇
win11双击文件夹转圈圈卡死怎么办?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    86次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    107次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    99次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    243次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    249次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码