一、带头人及团队介绍
团队成员构成多元复合:来自清华大学的算法研究员与博士研究生负责核心算法架构;聘用自航空电子产业界的资深工程师负责芯片级适配与工程化落地。
团队长期深耕智能决策与博弈对抗领域,在强化学习、蒙特卡洛树搜索(MCTS)、神经网络加速等方向形成技术积累。研究成果已完成从算法理论到航空级芯片适配的闭环验证,实现了在航空电子、智能博弈训练系统等领域的应用对接。团队先后承担航空电子预研、智能算法攻关等项目,在国产NPU(HKN201等)算法适配、异构计算优化等方面形成专有技术能力,授权发明专利及软件著作权多项。
二、研究内容
1.智能博弈算法体系:包括强化学习、深度神经网络、专家系统、蒙特卡洛树搜索(MCTS)、熵权法等多类算法的理论分析、复杂度评估与场景适配研究。面向航空级实时决策需求,开展算法-芯片协同优化
2.国产加速芯片适配技术:针对HKN201NPU等国产神经网络处理单元,开展算子适配性分析、量化压缩、性能调优与精度保持研究。涵盖CPU/NPU异构计算架构下的资源调度与实时性保障
3.智能决策系统应用:发展以博弈算法为核心的决策引擎、推演训练平台与验证系统,提供在航空电子模拟训练、高壁垒行业智能决策支持等场景中的应用方法与系统解决方案。
三、科技成果及产品展示
1.发展和深化了面向实时约束的强化学习决策理论、MCTS并行搜索优化、神经网络轻量化等新型智能决策方法;
2.探索并开发了适配国产NPU架构的算法优化技术,包括算子映射、INT8量化、模型剪枝与异构调度机制;构建Agent OS三级算力架构(L1本地超保密算力/L2混合云私有算力/L3公有云算力),实现数据物理级隔离与知识资产沉淀;
3.提出了面向博弈对抗的混合架构决策系统、Agent Swarm智能体集群(五大集群二十余款核心智能体)、端-边-云协同推理框架等新型系统设计;
4.实现了高可靠算法验证、硬件在环仿真、对抗场景生成等新型测试与评估方法;构建四级技能(Skill)迭代体系(优选→定制→自进化→工具化),实现算法能力从通用工具向企业资产的质变。
四、应用场景及典型应用案例
1.智能博弈算法分析平台:已完成多类算法(强化学习、神经网络、专家系统、MCTS、熵权法)的理论分析、硬件适配验证与性能基准测试,形成标准化算法选型决策支持工具,支持CPU与HKN201NPU双平台部署。
2.Agent OS智能决策操作系统:包括面向航空级实时决策的算法组件库、国产NPU算子库、性能分析工具链,以及L1级本地超保密算力一体机;支持多智能体协同、全链路合规审计与知识资产自进化,关键指标满足实时性与精度要求。
3.行业级智能决策应用矩阵:基于Agent OS构建的Service服务集群(专家问诊助理、IVD报告解读、私域AI客服、临床思维数字人等),已在高壁垒行业完成实战验证,实现专家产能10倍级释放与解读效率20倍提升。