高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多智能体强化学习的反应堆功率协调控制方法研究

牛振锋 李桐 李江宽 刘永超 吕为 谭思超 田瑞峰

牛振锋, 李桐, 李江宽, 刘永超, 吕为, 谭思超, 田瑞峰. 基于多智能体强化学习的反应堆功率协调控制方法研究[J]. 核动力工程. doi: 10.13832/j.jnpe.2024.080030
引用本文: 牛振锋, 李桐, 李江宽, 刘永超, 吕为, 谭思超, 田瑞峰. 基于多智能体强化学习的反应堆功率协调控制方法研究[J]. 核动力工程. doi: 10.13832/j.jnpe.2024.080030
Study On Coordinated Control Method Of Reactor Power Based On Multi-Agent Reinforcement Learning[J]. Nuclear Power Engineering. doi: 10.13832/j.jnpe.2024.080030
Citation: Study On Coordinated Control Method Of Reactor Power Based On Multi-Agent Reinforcement Learning[J]. Nuclear Power Engineering. doi: 10.13832/j.jnpe.2024.080030

基于多智能体强化学习的反应堆功率协调控制方法研究

doi: 10.13832/j.jnpe.2024.080030
基金项目: 中央高校基本科研业务费;黑龙江省省属本科高校“优秀青年教师基础研究支持计划”

Study On Coordinated Control Method Of Reactor Power Based On Multi-Agent Reinforcement Learning

  • 摘要: 为提高核电站反应堆功率与蒸汽发生器水位的协调控制精度,本研究提出了一种基于TD3(Twin Delayed Deep Deterministic Policy Gradient)的多智能体强化学习协调控制框架。在该框架中,不同子任务被分配给相应的智能体,各智能体相互配合以准确协调反应堆功率和蒸汽发生器水位。通过一系列仿真实验,本研究证实了该框架的有效性和优越性。实验结果表明,多智能体控制框架在多种功率切换工况下显著提高了控制速度和稳定性,其超调量和控制时间均优于传统 PID 控制器。此外,该框架在未经训练的新工况中也表现出优异的泛化能力。研究表明,基于多智能体强化学习的控制框架能够有效改善反应堆功率的协调控制精度与稳定性。

     

  • 加载中
计量
  • 文章访问数:  23
  • HTML全文浏览量:  7
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-08-12
  • 网络出版日期:  2025-01-23

目录

    /

    返回文章
    返回