22century.ru Исследователи из Университета Северной Каролины в Чапел-Хилл и из Adobe Research обучили рекуррентную нейронную сеть генерировать звук по видеоряду.
Не надо путать хрен с пальцем. Мобильный телефон — довольно тормозная железка, и распознавание в реальном времени заметно хуже, чем в онлайне. Однако даже несмотря на это, скажем, Яндекс-такси на довольно приличном уровне распознаёт, скажем, адреса, произнесённые даже с самыми немыслимыми акцентами. Качество же распознавания для оффлайн-систем на приличном оборудовании — ещё на голову выше.
> Что ты имеешь ввиду - довольно тормозная? Ведь не про саму железку, правда?
Если у тебя быстрая железка, ты можешь использовать алгоритмы распознавания, которые обеспечивают более хорошее качество. Если у тебя процессор из мобильного телефона и требование распознавать речь в реальном времени, то качество будет, разумеется, хуже.
> моя кошка больше понимает
Мой совет — ты можешь много заработать на этой кошке!
Достаточно быстро для чего? Я тебе объяснил — качество распознавания напрямую зависит от двух показателей — от мощности процессора и от времени на распознавание. При твоей железке для русского языка онлайн WER при распознавании будет в районе 18—20% на хорошей модели. На Xeon 2650 20-ядерном и при времени в 4 раза большем, чем время записи, WER будет в районе 4—5% на современной модели распознавания на основе рекуррентных сеток.
Ай, да ладно. Успел уже выказать недовольство нейросетями, распознаванием речи вообще, голосовыми меню и голосовыми роботами.
Интересно было бы посмотреть на твои персональные достижения. Судя по пафосу, как минимум открыл новую Теорию относительности.
> Так ты эксплуатирешь или разрабатываешь?
Разрабатываю.
> репозитария
Репозитория. Не умничай.
> То есть, выходит, как если бы прогресс был
Прогресс есть. Потому что ещё 5 лет назад WER на том же Xeon 2650 был 30%.
> Обращаю внимание, что обычно потребителя не волнуют отдельные одноразовые достижения
В современно русском репозиторий — хранилище, место хранения (программ, объектов, метаданных и т. п.). Репозитарий — в основном, используется в отношении соответствующих инструментов финансового рынка. Вариант «репозитарий» в реальной языковой практике в ИТ-среде не встречается. Репозиторий — 993 000 результатов в google, репозитарий — 85 100, из них примерно 9/10 используется как банковский или медицинский термин.