Чтец, жнец, на дуде игрец

Я всегда очень пристально следил за развитием алгоритмов искусственного интеллекта (ИИ), было интересно когда наступит сингулярность — точка, после которой всё внезапно поменяется. Но чем дальше, чем больше я начинаю верить в то, что никакой сингулярности не будет, можно не ждать — алгоритмы искусственного интеллекта уже проникают в нашу жизнь и постепенно её меняют.

Например, хоть голосовыми помощниками пользуются далеко не все, но ими явно не удивишь — они сейчас в каждом смартфоне, а беспилотные такси и роботы-доставщики так давно тестируются, что когда они войдут в серию, все только скажут «наконец-то». Последнее, может, и хорошо, людям надо время, чтобы адаптироваться. Мне — точно надо, наш автомобиль умеет парковаться, но мы с женой так и не научились ему это доверять — всегда сами хватаемся за руль. Наверное так же волнительно будет в первый раз сесть в беспилотное такси.

ИИ уже так много вокруг, что мы едва это замечаем. На днях я обнаружил новых их плацдарм. Кто-то, наверное, уже в курсе, но для меня было в диковинку.

Искали на «Яндекс.Музыке» какую-нибудь сказку про драконов (дочка — фанат всех больших рептилий), нашлось что-то подходящее, дочка села слушать, а я занимался своими делами. Особо не вслушивался, но пару раз чтец произнесла что-то такое, что царапнуло мне слух, и тут я понял, что читает не живой человек, как мне до этого казалось, а робот!

У меня, кстати, есть несколько знакомых профессиональных чтецов, чувствую многие из них скоро начнут терять работу, — я слушал их озвучку и эмоциональная подача робота даже немножко получше.

Если каким-то образом научиться размечать эмоции в тексте (через эмодзи?), то вполне можно уже озвучивать и локализировать мультфильмы без живых актёров. Мне кажется где-то тут следующий этап.

Ctrl ←Что мне нужно в часах

Ctrl →«Мой сосед Тоторо»

6 комментариев

Spiridonov 2021

Ну для детей сказки они научились читать, но в целом пока ещё не очень :) Но придут к этому, конечно. Заставлять человека тупо читать текст под запись — это примитивная работа. Актёры озвучки останутся — там надо в эмоции и текст точнее попадать, а вот начитку закадровую запросто отдадут.

Я, кстати, доверяю парковщику, уже год как сам не паркуюсь — автомат удобнее. Редко приходится самому крутить: он иногда не умеет на узкой улицев вклиниваться. А вот по длине в минимальный диапазон лучше меня влезает.

Евгений Степанищев 2021

Ну ты знаешь, многие мои знакомые читают (коммерчески читают, продают потом эту озвучку) хуже. То есть если послушать — голос есть, ошибок нет, но нет и особенных эмоций — почти везде ровный голос. На фоне таких чтецов роботы уже очень выгодно смотрятся.

Надо, наверное, тоже начать доверять парковщику, но не в этот сезон — боюсь с нашими снежными заносами он не справится.

PastorGL 2021

Ой, ну нет. Всё в кучу.

Парктроник никакого отношения к ИИ не имеет. Это обычный минимакс, алгоритмика в нём несложная.

Как и системы Text to speech (которым уже приблизительно дофига лет, и неудивительно, что за десятилетия есть некоторый прогресс). И разметка текстов для них вполне себе производится в полуавтоматическом режиме, инструменты для этого давным-давно есть.

Евгений Степанищев 2021

Парктроник никакого отношения к ИИ не имеет.

Если под «парктроником» тут имеется ввиду не парковочный радар, а парковочный ассистент, то как он там точно реализован я не знаю, но предполагаю, что раз он появился совсем недавно, то тут не обошлось без заслуги алгоритмов ИИ.

Бегло погуглил, моё предположение (насчёт ИИ) вроде как подтверждается. Есть несколько работ по теме использования алгоритмов ИИ в парковочных ассистентах.

Как и системы Text to speech (которым уже приблизительно дофига лет, и неудивительно, что за десятилетия есть некоторый прогресс).

Синтез речи без ИИ я прекрасно помню, это даже близко не оно. Всё как эти системы говорили тогда и сейчас — небо и земля. Та же «Алиса» синтезирует голос через алгоритмы ИИ.

PastorGL 2021

Что такое «алгоритмы ИИ»? Нет такого термина.

А называть нейронки и всякое прочее машинное обучение «ИИ» несколько некорректно.

Евгений Степанищев 2021

Есть конечно. И конечно же корректно. Нейронки — один из методов машинного обучения, а машинное обучение, в свою очередь, один из разделов ИИ.

PastorGL 2021

Ну так «алгоритмы ИИ» или «методы ИИ» или «разделы ИИ»? Или всё-таки каша в голове? О чём конкретно речь?

Я вот всего три задачи ML знаю: кластеризация, классификация, и регрессия. Ну с натяжечкой ещё детекция аномалий может рассматриваться как отдельный жанр (оно тоже пользуется спросом).

А нейронки — это инструмент. Один из. Мы вот в наших больших данных его не юзаем, потому что слишком медленно и обеспечивает слишком плохую повторяемость, всё больше по старинке, статистикой, да всяческими эвристиками.

Евгений Степанищев 2021

Ну так «алгоритмы ИИ» или «методы ИИ» или «разделы ИИ»?

А где у меня про методы ИИ? У области ИИ есть разделы, внутри ИИ есть алгоритмы. Откуда такая агрессия и желание найти какую-то мифическую кашу?

PastorGL 2021

Не могу читать дилетантские рассуждения о вещах, которые автор абсолютно не понимает. Просто не могу, и всё тут. Бесит, очень сильно бесит.

Мне по работе приходится быть сильно в курсе машин лёрнингов, нейронок, классификаторов, генераторов, и прочего, что проходит под баззвордом «ИИ», и я прекрасно знаю, какой это на 90% булшит, фуфло. А что не булшит, так то расшифровывается как Искусственный Идиот, который в любой тёмной комнате обязательно найдёт кошку, если натренирован её находить.

Из-за этого я, например, не могу использовать дип лёрнинг, хотя мои клиенты, наслушавшись очередных сказочек, прямо-таки с горящими глазами требуют обучить им какую-нибудь модель на каких-нибудь данных, чтобы дальше оно типа как-то магически выдавало необъяснимый результат, похожий на настоящий. А потом с круглыми глазами приходят ко мне требовать объяснения, почему это в соседнем городе через полгода эта же нейронка (потраченное на обучение которой машинное время стоило бешеных денег) даёт им полнейшую хрень.

Блять! Не существует никакого ИИ, это растиражированный масскультом бред. Есть рисовалки для раскрашивания одинаковых фотографий, есть DLSS для апскейла (одинаковых картинок опять же) на лету, и всё. Но нет в этом всём никакого «интеллекта», и никогда не будет.

И, пожалуй, пора выносить этот бложек из закладок, тут больше не пишут ничего интересного.

Евгений Степанищев 2021

Не могу читать дилетантские рассуждения о вещах, которые автор абсолютно не понимает.

Я разве заставляю?

Мне по работе приходится быть сильно в курсе машин лёрнингов, нейронок, классификаторов, генераторов…

Да, мне тоже приходится.

Не существует никакого ИИ, это растиражированный масскультом бред.

Конечно существует.

Но нет в этом всём никакого «интеллекта»,

Интеллекта тут нет, это правда, но и в смартфоне нет ничего «smart». Это просто название.

и никогда не будет.

Это не правда.

И, пожалуй, пора выносить этот бложек из закладок, тут больше не пишут ничего интересного.

Никогда не понимал почему это нужно отдельно анонсировать.

Рекомендую, кстати, хорошую статью на тему ИИ: https://vas3k.ru/blog/machine_learning/

prepor 2021

Если каким-то образом научиться размечать эмоции в тексте (через эмодзи?), то вполне можно уже озвучивать и локализировать мультфильмы без живых актёров. Мне кажется где-то тут следующий этап.

Вообще, может быть совсем обратное, во всяком случае на первом этапе. Голос — это отличная разметка эмоций в тексте :) Во всяком случае, именно к такому сценарию нас подталкивает опыт Cyberpunk 2077, где озвучкой занимались как раз живые люди, а вот анимации — генерировались по тексту + голосу. https://www.youtube.com/watch?v=uFIxiz0jwRE

Евгений Степанищев 2021

Ну, актёров-то нанимать ещё надо )

Ваш пароль

Евгений Степанищев

Чтец, жнец, на дуде игрец