Новосибирск 1.5 °C

Исследователи корпорации Intel учат компьютеры «читать по губам»

30.04.2003 00:00:00

 ФОРУМ INTEL ДЛЯ РАЗРАБОТЧИКОВ, Берлин, 28 апреля 2003 г. - Исследователи корпорации Intel выпустили программное обеспечение, лицензируемое по принципу открытого исходного кода, позволяющее разработчикам создавать компьютеры, которые «читают по губам» отдаваемые им команды, что обеспечивает лучшее распознавание сказанного.

Современные мощные алгоритмы распознавания речи хорошо работают при отсутствии фонового шума или при использовании хорошо настроенной гарнитуры, однако точность этих алгоритмов значительно снижается, когда приложения на их основе оказываются в условиях естественных шумов, характерных, например, для общественных мест. Программный пакет Audio Visual Speech Recognition (AVSR), объединенный с алгоритмами распознавания мимики лица из библиотеки компьютерного зрения Intel OpenCV, позволит компьютерам «наблюдать» за лицом человека и отслеживать движения его рта. Синхронизация видеоданных с результатами речевой идентификации в итоге обеспечит повышение точности распознавания речи и соответственно - эффективности широкого спектра речевых приложений в шумных средах. Программное обеспечение AVSR является частью библиотеки Intel OpenCV и представляет собой инструментальный набор из более 500 используемых при обработке изображений функций, которые помогают исследователям разрабатывать новые приложения на основе технологий компьютерного зрения.

«Корпорация Intel намерена разработать технологию, которая позволила бы компьютерам взаимодействовать с миром естественным образом - так, как это делают люди. Человеческое восприятие редко основывается на информации одного типа. Мы принимаем решения, объединяя информацию, полученную из разных источников, - говорит Джастин Раттнер (Justin Rattner), почетный сотрудник корпорации Intel подразделения Enterprise Platform Group и директор лабораторий Intel по исследованиям в области микропроцессоров. - Добавление кода аудиовизуального распознавания речи в библиотеку Intel OpenCV несомненно станет значительным стимулом к новым исследованиям и разработке приложений на основе визуального распознавания».

Исследования открывают
новые возможности применения

 Повышение быстродействия микропроцессоров, снижение цен на цифровые видеокамеры, увеличение скорости передачи видео в десятки раз за счет стандарта USB 2.0 и других передовых технологий - все это позволяет уже сегодня в реальном времени выполнять алгоритмы компьютерного зрения на персональных компьютерах, находящихся в массовом пользовании. Библиотека OpenCV создана для стимулирования инноваций в этой сфере и предоставляет доступ к исходному коду для реализации широкого спектра функций компьютерного зрения и обработки изображений. С момента выхода библиотеки OpenCV в 2000 г. исходный код из нее загружался более 500 тыс. раз, а группа ее пользователей сегодня насчитывает более 5 тыс. членов.

Разработчики используют код OpenCV в самых разных областях - от детских игрушек до промышленного производства. В программное обеспечение входит исходный код всех функций из библиотеки на языке C и бесплатная лицензия на повторное распространение. Более подробную информацию о программном обеспечении AVSR можно получить по адресу www.intel.com/research/mrl/research/avcsr.htm. Web-сайт библиотеки OpenCV расположен по адресу www.intel.com/research/mrl/research/opencv/. Частные лица, заинтересованные во вступлении в группу пользователей, могут зарегистрироваться по адресу www.groups.yahoo.com и затем подписаться на почтовую рассылку, отправив письмо по адресу OpenCV-subscribe@yahoogroups.com.

Корпорация Intel разработала уникальную децентрализованную модель исследований, по которой сегодня работают более 70 ее лабораторий по всему миру. Большая часть специалистов коллектива разработчиков программного обеспечения AVSR работает в китайском исследовательском центре Intel в Пекине. Этот центр был основан в 1998 году. Сегодня в нем занято более 40 ученых и инженеров - специалистов в области компьютерных исследований, ведущих разработки в таких областях, как компьютерное зрение, носители информации, сети Байеса, компиляторы и инструментальные средства.

Пресс-релиз компании Intel

Вам было интересно?
Подпишитесь на наш канал в Яндекс. Дзен. Все самые интересные новости отобраны там.
Подписаться на Дзен

Новости

Больше новостей

Новости районных СМИ

Новости районов

Больше новостей

Новости партнеров

Больше новостей

Самое читаемое: