Чтец, жнец, на дуде игрец
Я всегда очень пристально следил за развитием алгоритмов искусственного интеллекта (ИИ), было интересно когда наступит сингулярность — точка, после которой всё внезапно поменяется. Но чем дальше, чем больше я начинаю верить в то, что никакой сингулярности не будет, можно не ждать — алгоритмы искусственного интеллекта уже проникают в нашу жизнь и постепенно её меняют.
Например, хоть голосовыми помощниками пользуются далеко не все, но ими явно не удивишь — они сейчас в каждом смартфоне, а беспилотные такси и роботы-доставщики так давно тестируются, что когда они войдут в серию, все только скажут «наконец-то». Последнее, может, и хорошо, людям надо время, чтобы адаптироваться. Мне — точно надо, наш автомобиль умеет парковаться, но мы с женой так и не научились ему это доверять — всегда сами хватаемся за руль. Наверное так же волнительно будет в первый раз сесть в беспилотное такси.
ИИ уже так много вокруг, что мы едва это замечаем. На днях я обнаружил новых их плацдарм. Кто-то, наверное, уже в курсе, но для меня было в диковинку.
Искали на «Яндекс.Музыке» какую-нибудь сказку про драконов (дочка — фанат всех больших рептилий), нашлось что-то подходящее, дочка села слушать, а я занимался своими делами. Особо не вслушивался, но пару раз чтец произнесла что-то такое, что царапнуло мне слух, и тут я понял, что читает не живой человек, как мне до этого казалось, а робот!
У меня, кстати, есть несколько знакомых профессиональных чтецов, чувствую многие из них скоро начнут терять работу, — я слушал их озвучку и эмоциональная подача робота даже немножко получше.
Если каким-то образом научиться размечать эмоции в тексте (через эмодзи?), то вполне можно уже озвучивать и локализировать мультфильмы без живых актёров. Мне кажется где-то тут следующий этап.
Ну для детей сказки они научились читать, но в целом пока ещё не очень :) Но придут к этому, конечно. Заставлять человека тупо читать текст под запись — это примитивная работа. Актёры озвучки останутся — там надо в эмоции и текст точнее попадать, а вот начитку закадровую запросто отдадут.
Я, кстати, доверяю парковщику, уже год как сам не паркуюсь — автомат удобнее. Редко приходится самому крутить: он иногда не умеет на узкой улицев вклиниваться. А вот по длине в минимальный диапазон лучше меня влезает.
Ну ты знаешь, многие мои знакомые читают (коммерчески читают, продают потом эту озвучку) хуже. То есть если послушать — голос есть, ошибок нет, но нет и особенных эмоций — почти везде ровный голос. На фоне таких чтецов роботы уже очень выгодно смотрятся.
Надо, наверное, тоже начать доверять парковщику, но не в этот сезон — боюсь с нашими снежными заносами он не справится.
Ой, ну нет. Всё в кучу.
Парктроник никакого отношения к ИИ не имеет. Это обычный минимакс, алгоритмика в нём несложная.
Как и системы Text to speech (которым уже приблизительно дофига лет, и неудивительно, что за десятилетия есть некоторый прогресс). И разметка текстов для них вполне себе производится в полуавтоматическом режиме, инструменты для этого давным-давно есть.
Если под «парктроником» тут имеется ввиду не парковочный радар, а парковочный ассистент, то как он там точно реализован я не знаю, но предполагаю, что раз он появился совсем недавно, то тут не обошлось без заслуги алгоритмов ИИ.
Бегло погуглил, моё предположение (насчёт ИИ) вроде как подтверждается. Есть несколько работ по теме использования алгоритмов ИИ в парковочных ассистентах.
Синтез речи без ИИ я прекрасно помню, это даже близко не оно. Всё как эти системы говорили тогда и сейчас — небо и земля. Та же «Алиса» синтезирует голос через алгоритмы ИИ.
Что такое «алгоритмы ИИ»? Нет такого термина.
А называть нейронки и всякое прочее машинное обучение «ИИ» несколько некорректно.
Есть конечно. И конечно же корректно. Нейронки — один из методов машинного обучения, а машинное обучение, в свою очередь, один из разделов ИИ.
Ну так «алгоритмы ИИ» или «методы ИИ» или «разделы ИИ»? Или всё-таки каша в голове? О чём конкретно речь?
Я вот всего три задачи ML знаю: кластеризация, классификация, и регрессия. Ну с натяжечкой ещё детекция аномалий может рассматриваться как отдельный жанр (оно тоже пользуется спросом).
А нейронки — это инструмент. Один из. Мы вот в наших больших данных его не юзаем, потому что слишком медленно и обеспечивает слишком плохую повторяемость, всё больше по старинке, статистикой, да всяческими эвристиками.
А где у меня про методы ИИ? У области ИИ есть разделы, внутри ИИ есть алгоритмы. Откуда такая агрессия и желание найти какую-то мифическую кашу?
Не могу читать дилетантские рассуждения о вещах, которые автор абсолютно не понимает. Просто не могу, и всё тут. Бесит, очень сильно бесит.
Мне по работе приходится быть сильно в курсе машин лёрнингов, нейронок, классификаторов, генераторов, и прочего, что проходит под баззвордом «ИИ», и я прекрасно знаю, какой это на 90% булшит, фуфло. А что не булшит, так то расшифровывается как Искусственный Идиот, который в любой тёмной комнате обязательно найдёт кошку, если натренирован её находить.
Из-за этого я, например, не могу использовать дип лёрнинг, хотя мои клиенты, наслушавшись очередных сказочек, прямо-таки с горящими глазами требуют обучить им какую-нибудь модель на каких-нибудь данных, чтобы дальше оно типа как-то магически выдавало необъяснимый результат, похожий на настоящий. А потом с круглыми глазами приходят ко мне требовать объяснения, почему это в соседнем городе через полгода эта же нейронка (потраченное на обучение которой машинное время стоило бешеных денег) даёт им полнейшую хрень.
Блять! Не существует никакого ИИ, это растиражированный масскультом бред. Есть рисовалки для раскрашивания одинаковых фотографий, есть DLSS для апскейла (одинаковых картинок опять же) на лету, и всё. Но нет в этом всём никакого «интеллекта», и никогда не будет.
И, пожалуй, пора выносить этот бложек из закладок, тут больше не пишут ничего интересного.
Я разве заставляю?
Да, мне тоже приходится.
Конечно существует.
Интеллекта тут нет, это правда, но и в смартфоне нет ничего «smart». Это просто название.
Это не правда.
Никогда не понимал почему это нужно отдельно анонсировать.
Рекомендую, кстати, хорошую статью на тему ИИ: https://vas3k.ru/blog/machine_learning/
Вообще, может быть совсем обратное, во всяком случае на первом этапе. Голос — это отличная разметка эмоций в тексте :) Во всяком случае, именно к такому сценарию нас подталкивает опыт Cyberpunk 2077, где озвучкой занимались как раз живые люди, а вот анимации — генерировались по тексту + голосу. https://www.youtube.com/watch?v=uFIxiz0jwRE
Ну, актёров-то нанимать ещё надо )