Выберите свой район: Новосибирск
Баган
Барабинск
Бердск
Болотное
Венгерово
Довольное
Здвинск
Искитим
Карасук
Черепаново
Каргат
Колывань
Кольцово
Коченево
Кочки
Краснозерское
Куйбышев
Купино
Кыштовка
Маслянино
Мошково
Новосибирск
Убинское
Обь
Ордынское
Северное
Сузун
Татарск
Тогучин
Усть-Тарка
Чаны
Чистоозерное
Чулым

Впервые разработчики вплотную подошли к созданию промышленной системы распознавания русской речи

30.11.2001
Компании Intel и Cognitive Technologies представляют результаты реализации инвестиционного проекта по развитию систем распознавания русской речи. Достигнутые результаты позволяют говорить о том, что компании вплотную подошли к созданию промышленной системы распознавания русской речи и разработке дальнейших направлений применения систем распознавания в мобильной связи, голосовых порталах и системах голосового управления.

В результате сотрудничества Intel с компанией Cognitive Technologies
впервые в России создан обширный инструментарий
для разработки систем распознавания речи.

 МОСКВА, 28 ноября 2001 г. - Сегодня компании Intel и Cognitive Technologies представляют результаты реализации инвестиционного проекта по развитию систем распознавания русской речи. Достигнутые результаты позволяют говорить о том, что компании вплотную подошли к созданию промышленной системы распознавания русской речи и разработке дальнейших направлений применения систем распознавания в мобильной связи, голосовых порталах и системах голосового управления.

В результате реализации проекта впервые в России создан обширный инструментарий для разработки систем распознавания речи, который включает крупный речевой корпус русского языка RuSpeech, достаточный для распознавания естественной речи говорящего в реальном времени. Сложность создания такого корпуса объясняется, в первую очередь, сложностью грамматики и фонетики русского языка, а его масштабность может конкурировать с лучшими мировыми речевыми корпусами, созданными для распознавания речи. RuSpeech является речевой базой данных, с которой компьютер сможет "сверять" естественную речь диктора, распознавая не только слова, уже присутствующие в базе, но и отдельные фонемы и последовательности фонем русского языка, что позволит минимизировать количество ошибок при распознавании новых, отсутствующих в корпусе слов.

Тексты для речевого корпуса создавались 220 дикторами, каждый из которых прочел, в среднем, более 250 предложений. В состав речевого корпуса входит более 50 тыс. предложений с фонетической разметкой каждого произнесенного предложения. RuSpeech содержит порядка 50 часов непрерывной речи объемом 15 Гб, размещаемых на 30 c лишним компакт-дисках. Объем этого речевого корпуса в несколько раз превышает популярные речевые базы английского языка WSJ Speech и TIMIT.

Фактически это означает, что впервые появился инструмент для создания дикторонезависимой системы распознавания русской речи. Интеграция созданного инструментария с имеющимися передовыми технологиями анализа и распознавания речи приведут к решению этой задачи в самое ближайшее время.

Результаты этой разработки могут быть использованы в:

- голосовых порталах;

- голосовом управлении в телефонии (справочные службы, телефонный доступ к электронной почте, голосовой набор номера);

системах диктовки.

Технологиями распознавания научный коллектив, на базе которого была создана компания Cognitive Technologies, занимался еще с середины 70-х гг. в рамках исследования и создания систем искусственного интеллекта, а с 1993 г. активно вел разработки в области распознавания речи наряду с системами распознавания графических изображений. Тем не менее, в связи с целым рядом существовавших технических проблем - необходимость обучать систему голосу конкретного пользователя, зависимость от оборудования, малый словарный запас - разработки носили скорее научный, перспективный характер и были далеки от промышленного применения, а сфера практического применения такого рода систем была не вполне ясна как в России, так и в мире в целом.

За последние годы большая часть технических проблем, в том числе, дикторозависимости и аппаратных требований, была в значительной мере снята, а мировой объем рынка таких систем только в 2001 г. оценивается компанией Datamonitor в $650 млн. По прогнозам компании, в ближайшие 5 лет этот рынок увеличится почти в 10 раз и составит $5,6 млрд. По оценкам департамента маркетинга компании Cognitive Technologies, объем рынка речевых технологий в России к 2006 г. может составить порядка $200 млн. Это обусловлено большой востребованностью данных технологий, в том числе в мобильной телефонии и голосовых порталах. Такое состояние рынка, перспективность разработок в области речевых технологий, а также отсутствие систем распознавания русской речи и побудило компанию Intel инвестировать в проект создания русскоязычных речевых систем.

Пресс-релиз компании Intel
Вам было интересто?
Подпишитесь на наш канал в Яндекс. Дзен. Все самые интересные новости отобраны там.
Подписаться на Яндекс.Дзен
Резонанс
Новости
Затравили и выгоняют из села – анонимы издеваются над приемной семьей с ВИЧ-ребенком в Искитиме Новосибирской области. Дошло до уголовного дела, а за мальчика заступился Уполномоченный при Президенте России по правам ребенка.
Жители улицы Путейцев в городе Обь Новосибирской области уже несколько лет живут с водой в подполье и болотом в огороде. Дома стали оседать, фундамент трещит по швам. Грунтовые воды беспокоят людей практически круглый год. Но особенно остро эта проблема встает весной, когда к грунтовым добавляются вешние.
Пасха, главный христианский праздник, в 2019 году выпадает на 28 апреля. В православии завершается Великий пост и наступает время особой радости и торжества. Верующие обмениваются пасхальным приветствием «Христос воскресе» – «Воистину воскресе» с троекратным целованием. Как встретить Пасху правильно и соблюсти церковные традиции – в материале VN.ru.
19.04.2019
Мастерица из села Малышево Ордынского района Новосибирской области Людмила Бурмистрова вырастила двоих своих и 16 приемных детей, прививая им любовь к искусству. Вся квартира украшена поделками из бисера, вязаными вещами и игрушками, вышитыми картинами и иконами. Изделия неоднократно участвовали в выставках, они просто очаровывают посетителей.
«Тигры», «Тайфуны», «Панцири», «Искандеры» и «Ярсы» - все это название современной боевой техники, которая проедет по главной площади Новосибирска 9 Мая. Тренировка прохождения механизированной колонны в День Победы прошла на военном аэродроме.
Толпу молодежи, собравшихся вокруг двух дерущихся парней, увидели жители поселка Садовый и вызвали полицию. На деле оказалось, что ребята просто проводят спортивный спарринг. Однако комментаторы в соцсетях жестко раскритиковали подростков, указав, что им не место на детской площадке.