2025-02-18

Распознавание речи оffline

Системы распознавания речи развиваются сегодня очень быстро. Меня приятно поразила библиотека Whisper от OpenAI. Сконвертировать звуковой файл в текст можно оффлайн буквально парой команд, при этом качество распознавания получается очень хорошим.

Whisper написана на python и устанавливается при помощи pip:

# installing
pip install -U openai-whisper

# usage
wisper file_to_recognize.mp3 --language Russian --model large

При первом запуске будет скачана голосовая модель для нужного языка, которая занимает несколько гигабайт на жестком диске. Распознавание голоса, особенно на CPU, занимает значительное время, получасовой файл обрабатывался на моем лаптопе пол-часа или даже дольше, но результат того стоит.

 

Оставить комментарий

 
  2025-02-18

Выпал снег

На выходных выпал снег, причем достаточно много. Решил отвлечь ребенка от майнкрафта и построить из снега снеговика. Но снеговиков в майнкрафте не строят, стороят что-то более существенное.... Пришлось строить что-то более существенное...

Как вам, нравится?

 

Оставить комментарий

 
  2025-01-28

Использование Git для двусторонней синхронизации заметок

Для синхроницации заметок на всех устройствах я использую GIT. Это просто: сначала нужно закомиттить локальные изменения, потом подтянуть изменения с сервера и позволить GIT смержить все конфиликты автоматически - для текстовых файлов это не принципиально. Затем запушить результаты мержа опять на сервер.

Процесс только звучит сложно, если делать его регулярно оно превращаесят в рутину и не требует больших усилий. Если сделать alias то тогда синхронизация будет делается в одну команду:

alias nmds='git add * ; git commit -am'\''autocommit'\'' ; git pull origin master --no-edit ; git add * ; git commit -am'\''autocommit, fix conflicts'\''  ; git push origin master'

Работает на Linux и на Termux под Android на Windows можно сделать аналогичный bash файл. Надеюсь кому-нибудь пригодится.

 

Оставить комментарий

 
  2025-01-28

Песни Аквариума которые можно понять

Борис Гребенщиков выпустил в 2024 году альбом песен, которые, в отличие от других его творений, просты для понимания. Как он сам рассказал в своем подкасте "Аэростат", это мини-альбом из незаконченных песен на английском языке, которые было важно выпустить именно сейчас.

Английский для Бориса не родной язык поэтому слова в песнях предельно просты, чего не скажешь о смыслах. Если в Radio Silence мне трудно было разобрать слова, то ли из-за проблем со сведением, то ли так и было задумано, то в новом альбоме все предельно понятно. Послушайте сами — правда ведь, совсем другое дело?

 

Оставить комментарий

 
  2025-01-22

Я в душе не ебу

Леонид Каганов опубликовал прекрасные стихи а его читатели сгенерировали замечательную песню.

Все же в какое удивительно время мы сегодня живем!

 

Оставить комментарий

 
  2025-01-20

Никто и звать никак

Борис записал новую песню, как всегда до мурашек...

Спасибо маэстро!

 

Оставить комментарий

 
  2025-01-18

Эффект Элизы

В 1966 году исследователь Джозеф Вейценбаум создал программу ELIZA, которая имитировала беседу с психотерапевтом. Простая на первый взгляд программа могла перефразировать утверждения пользователя и задавать уточняющие вопросы. Несмотря на очевидную примитивность алгоритмов, многие пользователи начинали воспринимать ELIZA как разумного собеседника. Это явление получило название "эффект Элизы" и стало одной из первых иллюстраций того, как люди склонны антропоморфизировать технологии.

Эффект Элизы проявляется в том, что люди приписывают алгоритмам человеческие качества, такие как эмпатия или разум, если взаимодействие с программой кажется хоть немного осмысленным. Даже самые простые программы, которые лишь следуют жестко заданным шаблонам, могут казаться интеллектуальными из-за нашей склонности искать смысл в коммуникации. Например, если чат-бот задает вопрос в ответ на нашу фразу, мы можем предположить, что он "понимает" нас, хотя его действия являются результатом заранее определенных правил.

Этот феномен имеет важные последствия для взаимодействия человека с технологиями. Он показывает, что наше восприятие интеллекта субъективно и не обязательно связано с реальной сложностью программы. В современном мире, где нейросети и искусственный интеллект стали более сложными, эффект Элизы обострился. Мы взаимодействуем с виртуальными ассистентами, чат-ботами и генеративными моделями, которые кажутся "умными", хотя в большинстве случаев они просто находят статистически вероятный ответ на наш запрос.

Однако эффект Элизы несет в себе и риски. Привязываясь к "человечности" машин, мы можем переоценивать их возможности или доверять им больше, чем следовало бы. Например, использование чат-ботов в медицинских или психологических консультациях может создать иллюзию заботы и компетентности, которой на самом деле нет.

Эффект Элизы напоминает нам, что технологии — это инструменты, а не разумные существа. Наша задача — понимать их ограничения и использовать их осознанно. Хотя машины становятся все более "умными", их интеллект остается искусственным, а понимание — иллюзорным.

 

Оставить комментарий

 
  2025-01-16

Релиз лингвампирчика

lingvy

Выпустил новый релиз приложения. В нём я улучшил работу с синонимами. Раньше при попытке изучить, например, наречия времени в немецом языки во время прохождения теста, пользователь должен был выбрать перевод к слову "сейчас". Если в словаре было несколько переводов, например, "nun", "gerade", "momentan" и так далее, пройти тест было нереально, так как, хотя все эти варианты правильные, приложение принимало только один из них, что вызывало раздражение.

Теперь при составлении теста в альтернативные варианты добавляются только заведомо неправильные ответы. И теперь я наконец смогу выучить этот словарик!

 

Оставить комментарий

 
  2025-01-06

Владимир Зеленский у Лекса Фридмана

Лекс Фридман взял интервью у Владимира Зеленского!

 

Оставить комментарий

 
  2025-01-01

Программа для синхронизации заметок на телефоне

Долгое время использую для синхронизации связку Termux + git и доволен как слон. Однако настройка всего этого занимает массу времени и подходит только для технических задротов вроде меня. Подумал, существует ли что-то проще? Поиски в сети не дали каких-либо работающих решений, поэтому мне стало интересно, а можно ли запрограммировать что-то с нуля. Оказалось, что вполне реально. Существует реализация JGit под Java, которая вполне работает, если ее встроить в Android-приложение. Единственную проблему, которую я сейчас пытаюсь решить, это то, что файлы должны быть доступны в общем хранилище андроид-устройства, а напрямую доступа в это хранилище у Android-приложения нет, поэтому приходится дополнительно к операциям с git реализовать операции копирования из внутреннего хранилища устройства во внешнее и наоборот. Как сделать проще, я пока не придумал. Из-за этого мое решение работает значительно медленнее, чем решение на базе Termux. В принципе, не сильно критично, но неприятно - у меня в заметках несколько тысяч файлов, и ждать полторы минуты вместо сорока секунд, когда они синхронизируются, мне не хочется...

Если получится ускорить решение опубликую на Play Market вдруг такая программа не только мне окажется полезной?

Upd: Проблему со скоростью решил, теперь работает даже быстрее чем Termux, потестирую еще некорое время на предмет багов, но кажется получилось что-то полезное...

 

Оставить комментарий