В Северной столице обкатывается технология мгновенных субтитров для ТВ и Интернета

20.03.2014, 17:52

Видео программы «Сегодня в Санкт-Петербурге»

Петербургские IT-специалисты разработали программу по трансляции субтитров в прямом эфире без задержки.

Журналистам продемонстрировали уникальную для России технологию. Разработанный в Петербурге программно-аппаратный комплекс позволяет в режиме реального времени готовить субтитры для телевизионных и интернет-трансляций.

В первую очередь, это дает возможность людям с проблемами слуха полноценно воспринимать наиболее оперативную информацию: экстренные новости или, например, спортивные трансляции. Полноценную проверку технология выдержала как раз во время Паралимпиады.

Созданный программно-аппаратный комплекс может распознавать человеческую речь со скоростью 0,16 секунды. Фактически это мгновение. А значит люди с проблемами слуха могут смотреть программы в прямом эфире с субтитрами, которые при этом заранее никто не готовил.

Если в новостях и программах, выходящих в записи, субтитры готовит целый штат редакторов, то прямые трансляции спортивных состязаний, даже самые масштабные, для людей с проблемами слуха — картинка да и только.

Теперь же петербургская технология позволяет прочитать ту, информацию, которую озвучивает комментатор. Позиции спортсменов, накал борьбы и даже некие эмоции становятся доступны.

У Анны — редкая пока что работа. Она — респикер. Синхронно повторяет то, что говорит комментатор, но исключает из речи ошибки, оговорки и всякие междометия. На небольшой клавиатуре респикер также ставит знаки препинания. Программно-аппаратный комплекс распознает речь Анны, переводя ее в письменный текст.

Рядом правильность проверяет редактор Игорь, который если что успеет моментально исправить какое-нибудь слово. При этом даже телеканалы и интернет-вещатели тем более имеют небольшую технологическую задержку. Так что 2 с небольшим секунды, на которые отстают Анна с Игорем от реального комментатора, для зрителя практически незаметны.

Сейчас кто-то разочарованно вздохнул: ну какая же это технология, от человеческого фактора все равно не избавились. Тем не менее, для передач в записи эта методика требует в пять раз меньше людей. Для создания субтитров часовой передачи обычно нужно 10 человеко-часов. Здесь — только два. А о прямом эфире без подготовленных заранее текстов до этого и речи не было.

Кирилл Левин, директор Научно-исследовательского департамента Центра речевых технологий: «Людей, способных со скоростью речи набирать текст, нет. Потому что максимум, что тот же Игорь может выдержать с темпом 600–800 знаков в минуту, это от силы минут пять. Естественно ни о каком практическом использовании речи нет».

Пока технология проходит обкатку на одном из спортивных интернет-каналов. Однако вскоре она получит распространение, ведь научно-исследовательская и опытно-конструкторская разработка была выполнена в том числе и на государственные средства в рамках программы «Доступная среда». Да и зрители Паралимпиады с проблемами слуха оценили возможность видеть комментарии.

Корреспондент НТВ Алексей Чеботарёв — о новом слове в распознавании даже самой быстрой речи.

Читайте также