【团体标准】基于多智能体强化学习的博弈决策系统标准

本网站发布时间： 2024-01-25

T/JSIA 0003-2024
现行
定价：无文本 / 折扣价： 0 元
在线阅读

开通会员免费在线看70000余条国内标准，赠送文本下载次数，单本最低仅合13.3元！还可享标准出版进度查询、定制跟踪推送、标准查新等超多特权！查看详情>>

标准简介

适用范围：

4一般要求4.1系统组成系统由数据存储模块、信息配置模块、交互展示模块、策略生成模块组成。4.1.1数据存储模块使用数据库系统或文件系统实现感知数据和算法模型的持久化存储。4.1.1.1数据存储模块基本技术要求a)使用数据库系统或文件系统实现数据的持久化存储；b)选择合适的数据结构和存储方式，以支持高效的数据查询和检索。4.1.1.2数据存储模块功能要求a)提供数据写入和读取接口，允许决策系统将关键数据存储到数据库或文件中，以及从中检索数据，存储系统的中心存储可支持存储容量的动态的、持续的扩充；b)支持数据的批量存储和查询，以便于训练和分析大规模数据，且具备冗余备份的功能。4.1.1.3数据存储模块性能要求a)并发存储性能：数据存储应能够满足并发写入的要求；b)系统不应该因为存储系统响应不及时而导致程序异常现象，数据库查询的效率应足够高，能够在短时间内返回查询结果；c)存储设备宜对缓存进行优化设计，采用记录性能优先策略，保证对数据实时记录。支持数据的持久化存储，以确保数据不会在系统关闭后丢失。4.1.2信息配置模块对于强化学习算法应用的场景信息能够自定义配置：如智能体数量、环境基本配置信息等。实现用户界面技术，如图形用户界面（GUI）或命令行界面（CLI），使用用户界面库或框架，以便创建友好的配置界面。4.1.2.1信息配置模块基本技术要求a)设计界面，允许用户配置决策系统的参数、算法、模型等信息，系统的信息配置功能可支持环境基本属性信息的动态设置；b)系统内部模块间高内聚、低耦合等特点，系统数据内容安全性高，且更加稳定。4.1.2.2信息配置模块功能要求用户与系统进行交互配置系统环境信息，初始化对战环境，为强化学习算法提供多样的、可靠的运行环境，用户界面的响应时间应迅速，用户在界面上操作时不应感到明显的延迟。4.1.2.3信息配置模块性能要求规模扩展性能：硬件环境能够支持交互环境规模的动态扩展，系统不应该因为环境复杂而导致可视化界面卡顿等异常情况。4.1.3交互展示模块环境可视化：显示当前的环境状态，可能是一个图像、地图或其他可视化界面，以便用户可以观察系统的状态。这可以帮助用户了解环境的情况，监控决策系统的执行。策略展示：在环境可视化中展示各方（代理、智能体等）当前执行的策略，以便用户可以实时观察它们的决策行为。这可以通过箭头、运动轨迹等方式实现。实时数据更新：交互展示模块需要能够获取实时数据，包括环境的状态、各个智能体的动作、得分等。这些数据将用于更新环境可视化和策略展示。统计信息展示：展示环境中各个指标的统计信息，如得分、胜率、执行次数等。这可以帮助用户更好地了解系统的性能。交互性界面：提供用户与展示模块进行交互的方式，例如按钮、滑块等。用户可以通过交互来改变环境参数、调整展示方式等。数据记录与回放：将展示的数据记录下来，以便用户可以随时回放和分析之前的决策过程。这对于改进策略、分析失败案例等非常有帮助。可配置性：允许用户根据需要自定义展示模块的布局、显示内容和样式，以适应不同的应用场景。错误处理与提示：提供适当的错误处理机制和提示信息，以便在出现问题时能够及时通知用户。多模式支持：支持不同的展示模式，如实时模式、回放模式、对比模式等，以满足不同用户的需求。可扩展性：考虑到未来可能的需求变化，展示模块应该易于扩展和升级。

基本信息

标准号：
T/JSIA 0003-2024
标准名称：
基于多智能体强化学习的博弈决策系统标准
英文名称：
Specification for Decision-Making System Based on Multi-Agent Reinforcement Learning
标准状态：
现行
发布日期：
2024-01-23
实施日期：
2024-01-30
出版语种：

标准分类号

标准ICS号：
35.080
中标分类号：

关联标准

替代以下标准：
被以下标准替代：
引用标准：
采用标准：

出版信息

页数：
字数：
开本：

其他信息

起草人：
高阳、霍静、李文斌、陈鹏、李关防、何雨、安双双、杨光、任东东、曹宏业、王砚铭、杨言、朱良瀚、解宇、余长州、陈广、刘思源、袁奔、郭事成
起草单位：
江苏万维艾斯网络智能产业创新中心有限公司、南京大学、中国船舶集团有限公司第七一六研究所、中科曙光南京研究院有限公司
归口单位：
江苏省软件行业协会
提出部门：
江苏省软件行业协会
发布部门：
江苏省软件行业协会

其它标准

上一篇： T/JSIA 0003-2021 江苏省区块链产业人才培训基地评估规范（试行）
下一篇： T/JSIA 0004-2022 江苏省规划布局内重点软件企业评估规范

推荐标准

【团体标准】 基于多智能体强化学习的博弈决策系统标准