Разработчик собрал видео-ассистента с поддержкой множественных персонажей. / github :: talk-llama-fast :: голосовой помощник :: нейронные сети

нейронные сети talk-llama-fast голосовой помощник github 

Разработчик собрал видео-ассистента с поддержкой множественных персонажей.

" Работает на 3060 12 GB, Nvidia на 8 GB, скорее всего, тоже хватит.

Из-за записи экрана есть небольшие задержки.Без записи и на английском языке полная задержка от голосовой команды до видео ответа - всего 1.5 секунды! "

Код, exe, инструкция:https://github.com/Mozer/talk-llama-fast


Автор пишет: " Talk-llama-fast с поддержкой wav2lip:

- добавил поддержку XTTSv2 и wav-streaming.
- добавил липсинк с видео через wav2lip-streaming.
- уменьшил задержки везде где только мог.
- русский язык и UTF-8.
- поддержка множественных персонажей.
- остановка генерации при обнаружении речи.
- команды: Google, стоп, переделай, удали всё, позови.

Под капотом:
- STT: whisper.cpp large
- LLM: Mistral-7B-v0.2-Q5_0.gguf
- TTS: XTTSv2 wav-streaming
- lipsync: wav2lip-streaming
- Google: langchain google-serp "


Подробнее
talk-llama-fast wav2lip - неформальный видео-ассистент на русском
talk-llama-fast v0.1.3 - informal video assistant [en]
talk-llama-fast - инструкция на русском
нейронные сети,talk-llama-fast,голосовой помощник,github
Еще на тему
Развернуть
Выглядит как создание кошкодевочьки.
Жуть какая-то
Мечта человечества. Сидеть на диванчике и командовать. К умному дому присобачить и пусть уж лучше терминатор пол по ночам на кухне протирает и посуду моет.

Долгожданная утопия, где у самого нищего крестьянина не менее трёх рабов

Если при этом никому не нанесён вред, то почему бы и нет?

власть развращает, бесконечная власть развращает бесконечно, а наши нищие крестьяне и так не образец добродетели

Именно по этому всякую челядь нужно занять тяжелым трудом, правильно я понимаю?

Нет, не правильно. Не поэтому.

>лучше терминатор пол по ночам на кухне протирает и посуду моет

Шторы шьет.
Ахуительно, грежу мыслью голосового ассистента, даже когда-то забивал в VoxCommando всякие бинды на голосовые команды. C того времени прошло лет 7-8 и эту сферу уже просто не узнать, куча всяких умных колонок, а теперь и нейросеть прикрутили, крутяк.
Как можно приспособить в работе? В теории

Собрал ИИ-сучку-цундере которую можно заткнуть. Ниплоха.

Будущее не просто наступил - оно влетело с двух ног и выбило нахрен дверь в настоящее
И..... нихуя. Просто игрушка.
Это УЖЕ игрушка, о которой только "думали" пару лет назад...
Колесо, на игрушечном велосипеде, тоже просто игрушка...но вот тебе на, на колесе держится практически все сухопутные передвижения. Тут так же. ИИ может быть прекрасной игрушкой. А может распутывать днк и найти нам рычажок бессмертия.
Не ИИ, а нейросеть. Уже промыли блять.
Не красный, а пурпурный. В жопу без мыла не лезь, сразу жить проще станет.
Кхммммм. Попытался поставить. Обломался на ТТС. Оказалось что надо еще заехать огромному паровозу от майкрософта
Даже не знаю почему вспомнилось.
Потому что уже с текущими технологиями - это практически реальность.
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
21 век: голосовой помощник Алиса 19 век: голосовой помощник ЗАХААААР
подробнее»

голосовой помощник

21 век: голосовой помощник Алиса 19 век: голосовой помощник ЗАХААААР
Голосовой поиск в любой момент Произнесите «%1 $б», чтобы обратиться к своему устройству в любое время, даже если экран выключен или вы пользуетесь приложением.
подробнее»

голосовой помощник голосовой поиск Google интернет

Голосовой поиск в любой момент Произнесите «%1 $б», чтобы обратиться к своему устройству в любое время, даже если экран выключен или вы пользуетесь приложением.
Talk Llama - AI персонажи в Телеграме