记者从清华大学获悉,继构建智能光计算的通用传播模型、研制全球首款大规模干涉—衍射异构集成芯片“太极”后,该校电子工程系方璐教授课题组、自动化系戴琼海教授课题组在智能光计算领域获得新突破:首创全前向智能光计算训练架构,成功研制“太极-II”通用光训练芯片。该芯片填补了智能光计算在大规模训练这一核心拼图中的空白,将与初代“太极”一起合力为AI大模型的训练、推理注入算力发展的新动力,构建光算力的新基座。相关成果以“光神经网络全前向训练”为题,于近日发表于《自然》期刊。
人工智能大模型的迅猛发展与广泛应用,使得算力成为重大的战略抓手与基础设施。长期以来电子计算芯片的算力增长支撑着AI模型规模的不断发展,然而其高能耗亦带来了前所未有的能源挑战,新兴智能计算范式的建立与发展迫在眉睫。光具有干涉、衍射等多维计算模态,以光为计算媒介,以光的可控传播构建计算模型,光计算以其高算力低能耗特性打开了智能光计算的新赛道,展现出了巨大潜力。
研究组介绍,训练和推理是AI大模型核心能力的两大基石,缺一不可。通用智能光计算芯片“太极”的问世首次将光计算从原理验证推向了大规模实验应用,为复杂智能任务的推理带来了曙光。然而,初代“太极”尚未释放智能光计算的“训练之能”。
据悉,“太极-II”光训练芯片以物理光学特性为启发建立了新型的光训练架构,克服了计算精度差、训练速度慢、能量效率低的瓶颈,支撑多尺度复杂光学系统的高效高精度在线训练。
系统实测结果表明,“太极-II”智能光训练架构在大规模神经网络训练、计算成像等方面均表现出卓越性能。它突破了计算精度与效率的矛盾,将数百万参数的光网络训练速度提升了1个数量级,代表性智能分类任务的准确率提升40%。在非视域等复杂场景成像应用中,实现了千赫兹帧率的计算成像,成像效率提升2个数量级。这些成果表明,在同等参数规模下,相较于图形处理器(GPU),“太极-II”有望能以十分之一的时间完成AI大模型等大规模网络的训练进程,大幅节省时间与能源开销;并能实时解析复杂场景,为医疗诊断、工业检测、环境监测等领域提供高速精准的解决方案。
据悉,在原理样片的基础上,研究团队正积极地向智能光芯片产业化迈进,在多种端侧智能系统上进行应用部署。
“智能光计算平台将逐步登上AI算力舞台,将能以更低的资源消耗和更小的边际成本,为人工智能大模型、通用人工智能、复杂智能系统的高速高能效计算开辟新路径。”戴琼海说。(记者邓晖)