标准详细信息 去购物车结算

【团体标准】 多模态人机交互技术要求

本网站 发布时间: 2023-11-06
  • T/BDAEA 003-2023
  • 现行
  • 定价: 无文本 / 折扣价: 0
  • 在线阅读
开通会员免费在线看70000余条国内标准,赠送文本下载次数,单本最低仅合13.3元!还可享标准出版进度查询、定制跟踪推送、标准查新等超多特权!   查看详情>>
标准简介标准简介

适用范围:

本文件规定了多模态人机交互技术在环境中的术语、定义、测试方法,测试标准及技术要求,确保交互系统的易用性、可靠性和互操作性,为用户提供更智能、便利和舒适的出行环境。本部分适用于在地铁、商场、银行、地下停车场等内的多模态人机交互场景。5.4.1技术要求(1)具备关键词语音识别能力,在低噪环境(噪声强度在50dB以下)中,关键词语音识别的字正确率应在90%以上;在高噪环境(噪声强度在60dB~65dB)中,关键词语音识别的字正确率宜在85%以上。字正确率的性能指标定义见GB/T21023-2007的仅能识别关键词,并根据关键词提供具体服务。(2)具备连续语音识别能力。在低噪环境(声强度在50dB以下)中连续语音识别的字正确率宜在85%以上:在高噪环境(噪声强度在60dB~65dB)中,连续语音识别的字正确率官在80%以上。字正确率的性能指标定义见GB/T21023-2007的仅能识别关键词,并根据关键词提供具体服务。(3)智能客服语音交互系统数字语音识别要求包括:应支持数字识别及服务,宜支持不同数字表达方式的识别示例并且正确率应在99%以上。5.5声源定位5.5.1技术要求(1)定位准确度:最大角度误差:定位结果与实际声源位置之间的最大角度误差不得超过±5°。(2)最大空间距离误差:定位结果与实际声源位置之间的最大空间距离误差不得超过0.5米。(3)动态响应:系统应在声源位置变化后的1000毫秒内,完成声源定位并输出结果。(4)实时性:系统的声源定位响应延迟应不超过500毫秒。5.5.2测试要求(1)时间差法测试:使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的时间,通过计算时间差来确定声源方向。(2)幅度差法测试:使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的幅度差,通过计算幅度差来确定声源方向。(3)波束形成测试:使用波束形成算法和多个麦克风,测试算法对声源定位的准确性和鲁棒性。(4)声源跟踪测试:测试声源定位系统对运动声源的跟踪能力,包括声源的速度和加速度变化等。

基本信息

  • 标准号:

    T/BDAEA 003-2023

  • 标准名称:

    多模态人机交互技术要求

  • 英文名称:

    Technical requirements for multimodal human-machine interaction
  • 标准状态:

    现行
  • 发布日期:

    2023-08-17
  • 实施日期:

    2023-09-17
  • 出版语种:

标准分类号

  • 标准ICS号:

    35.240.99
  • 中标分类号:

关联标准

  • 替代以下标准:

  • 被以下标准替代:

  • 引用标准:

  • 采用标准:

出版信息

  • 页数:

  • 字数:

  • 开本:

其他信息

  • 起草人:

    钟涛、张开婷、张方冰、蔺陆洲、陈艳艳、赵媛媛、付雨欣、管洋、章明辉、霍盈盈、胡勇、方靖涛、张超、岳俊丽、沈志墙、汪琮棠、李若晗、王丹、王雨楠、景之涌、王欣、何志龙、李强、周立荣、张迪
  • 起草单位:

    全图通位置网络有限公司、北京朴津智能科技有限公司、深圳北斗平台通信有限公司、全图通轨道交通技术有限公司
  • 归口单位:

    北京经济技术开发区企业协会
  • 提出部门:

    北京经济技术开发区企业协会
  • 发布部门:

    北京经济技术开发区企业协会