Бывшие инженеры Google X создали ИИ-помощника, который слушает вас весь день

/ (Обновлено: ) / ТехнологииНовости / Технологии

Трое бывших учёных из Google X основали стартап TwinMind, который разработал приложение с искусственным интеллектом, работающее как «второй мозг». Система с разрешения пользователя постоянно записывает окружающие разговоры в фоновом режиме, преобразуя их в структурированные заметки и напоминания.

Сооснователи Дэниел Джордж (CEO) и его коллеги Санни Танг и Махи Карим (оба CTO) запустили проект в марте 2024 года. Приложение работает офлайн, транскрибирует аудио в реальном времени и способно непрерывно записывать до 16–17 часов без значительного разряда батареи. Также поддерживается перевод на более чем 100 языков.

В отличие от конкурентов вроде Otter или Fireflies, TwinMind пассивно записывает звук весь день. Команде пришлось потратить полгода на обход ограничений iOS, создав низкоуровневый сервис на Swift.

«Мы потратили около шести-семи месяцев в прошлом году, чтобы идеально настроить непрерывную запись звука и обойти ограничения „огороженного сада“ Apple», — рассказал Джордж TechCrunch.

Идея пришла Джорджу в 2023 году, когда он работал в JPMorgan и ежедневно участвовал в совещаниях. Он создал скрипт для записи и транскрипции аудио, который затем передавал данные в ChatGPT. Результаты впечатлили его настолько, что он решил разработать отдельное приложение.

Помимо мобильного приложения, TwinMind предлагает расширение для Chrome, которое с помощью vision AI сканирует открытые вкладки и собирает контекст из почты, Slack и других платформ. Этим же инструментом стартап отобрал четырёх стажеров из 854 заявок.

«Мы открыли все профили LinkedIn и резюме соискателей во вкладках браузера и попросили расширение ранжировать лучших кандидатов. Оно справилось фантастически — именно так мы наняли наших финальных четырёх стажеров», — отметил Джордж.

Стартап уже привлёк 5,7 млн долларов (456 млн рублей) в рамках посевного раунда при оценке в 60 млн долларов. Инвесторами выступили Streamlined Ventures, Sequoia Capital и Стивен Вольфрам, который лично поддержал проект.

Недавно компания представила новую речевую модель Ear-3 с поддержкой 140 языков и низкой частотой ошибок. Модель распознает разных говорящих в беседе и будет доступна через API для разработчиков. Стоимость использования — 0,23 доллара в час (~18 рублей).

Бесплатная версия приложения остаётся с неограниченной транскрипцией, а Pro-подписка за 15 долларов в месяц (~1200 рублей) предлагает расширенный контекст и приоритетную поддержку.

Основатели подчеркивают конфиденциальность: аудиозаписи удаляются сразу после обработки, сохраняется только текст. Модели не обучаются на пользовательских данных.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии