Международный день слепых: стандарт на синтезатор речи

13 ноября 2018 г.

К Международному дню слепых, отмечаемому ежегодно 13 ноября, ФГУП «Стандартинформ» подготовил обзор национального стандарта «Синтезаторы речи специальных компьютерных рабочих мест для инвалидов по зрению. Технические требования».

ГОСТ Р 52873–2017 будет введен в действие с 01.01.2019 года взамен ГОСТ Р 52873-2007.

Стандарт распространяется на синтезаторы речи, применяемые инвалидами по зрению в качестве компонента специального компьютерного рабочего места как средства реабилитации.

Синтезатор речи – техническое средство, преобразующее текст, составленный на различных языках, в звуковой сигнал.

Синтезаторы речи разделяются на: моноязычные (например, только русский язык) и многоязычные (например, русский и английский и др.); программные (функционирующие на базе технических и программных средств) и аппаратные (действующие на базе технических средств).

Синтезатор речи обеспечивает пользователю комфортные условия работы, которые включают в себя такие параметры, как слитность воспроизведения звуков в словах, разборчивость речи, близость голоса к человеческому и др., т.е. характеристики, которые влияют на утомляемость пользователя при прослушивании больших массивов информации.

Программные средства синтезатора речи должны состоять из: текстового процессора, транскриптора, звуковой базы, формирователя речевого сигнала, блока вывода звука.

Текстовый процессор должен обладать функциями выделения предложений в тексте, прочтения заголовков электронных писем и документов, а также анализировать использование «е» и «ё», выполнять задачи омонимии (замОк или зАмок), расставлять ударения в словах. Система должна определять тип интонации предложения, а также места установки и длительность пауз в чтении.

Транскриптор преобразует полученный от текстового процессора текст в последовательность звуков.

Затем, используя звуковую базу формируется речевой сигнал.

Программа синтезатора речи имеет блок вывода звука: с помощью соответствующих стандартных интерфейсов формируется звуковой поток данных на встроенную звуковую карту компьютера.

Программные средства синтезатора должны включать в себя возможность регулировки скорости речи при неизменной высоте основного тона. В качестве норматива устанавливается средняя скорость воспроизведения на уровне 90 слов в минуту, а также возможность регулировки высоты голоса при неизменной скорости, регулировки громкости звучания.

Система должна обеспечивать необходимую степень разборчивости речи. Речь считается разборчивой, если она понятна пользователям при средней скорости воспроизведения в диапазоне от 80 до 180 слов в минуту.

Постоянная ссылка
https://www.standards.ru/news/6435690.aspx