智能光计算领域再获突破-科技-人报融媒

记者从清华大学获悉，继构建智能光计算的通用传播模型、研制全球首款大规模干涉—衍射异构集成芯片“太极”后，该校电子工程系方璐教授课题组、自动化系戴琼海教授课题组在智能光计算领域获得新突破：首创全前向智能光计算训练架构，成功研制“太极-II”通用光训练芯片。该芯片填补了智能光计算在大规模训练这一核心拼图中的空白，将与初代“太极”一起合力为AI大模型的训练、推理注入算力发展的新动力，构建光算力的新基座。相关成果以“光神经网络全前向训练”为题，于近日发表于《自然》期刊。

人工智能大模型的迅猛发展与广泛应用，使得算力成为重大的战略抓手与基础设施。长期以来电子计算芯片的算力增长支撑着AI模型规模的不断发展，然而其高能耗亦带来了前所未有的能源挑战，新兴智能计算范式的建立与发展迫在眉睫。光具有干涉、衍射等多维计算模态，以光为计算媒介，以光的可控传播构建计算模型，光计算以其高算力低能耗特性打开了智能光计算的新赛道，展现出了巨大潜力。

研究组介绍，训练和推理是AI大模型核心能力的两大基石，缺一不可。通用智能光计算芯片“太极”的问世首次将光计算从原理验证推向了大规模实验应用，为复杂智能任务的推理带来了曙光。然而，初代“太极”尚未释放智能光计算的“训练之能”。

据悉，“太极-II”光训练芯片以物理光学特性为启发建立了新型的光训练架构，克服了计算精度差、训练速度慢、能量效率低的瓶颈，支撑多尺度复杂光学系统的高效高精度在线训练。

系统实测结果表明，“太极-II”智能光训练架构在大规模神经网络训练、计算成像等方面均表现出卓越性能。它突破了计算精度与效率的矛盾，将数百万参数的光网络训练速度提升了1个数量级，代表性智能分类任务的准确率提升40%。在非视域等复杂场景成像应用中，实现了千赫兹帧率的计算成像，成像效率提升2个数量级。这些成果表明，在同等参数规模下，相较于图形处理器（GPU），“太极-II”有望能以十分之一的时间完成AI大模型等大规模网络的训练进程，大幅节省时间与能源开销；并能实时解析复杂场景，为医疗诊断、工业检测、环境监测等领域提供高速精准的解决方案。

据悉，在原理样片的基础上，研究团队正积极地向智能光芯片产业化迈进，在多种端侧智能系统上进行应用部署。

“智能光计算平台将逐步登上AI算力舞台，将能以更低的资源消耗和更小的边际成本，为人工智能大模型、通用人工智能、复杂智能系统的高速高能效计算开辟新路径。”戴琼海说。（记者邓晖）