Бывшие инженеры Google X создали ИИ-помощника, который слушает вас весь день
Трое бывших учёных из Google X основали стартап TwinMind, который разработал приложение с искусственным интеллектом, работающее как «второй мозг». Система с разрешения пользователя постоянно записывает окружающие разговоры в фоновом режиме, преобразуя их в структурированные заметки и напоминания.
Сооснователи Дэниел Джордж (CEO) и его коллеги Санни Танг и Махи Карим (оба CTO) запустили проект в марте 2024 года. Приложение работает офлайн, транскрибирует аудио в реальном времени и способно непрерывно записывать до 16–17 часов без значительного разряда батареи. Также поддерживается перевод на более чем 100 языков.
В отличие от конкурентов вроде Otter или Fireflies, TwinMind пассивно записывает звук весь день. Команде пришлось потратить полгода на обход ограничений iOS, создав низкоуровневый сервис на Swift.
«Мы потратили около шести-семи месяцев в прошлом году, чтобы идеально настроить непрерывную запись звука и обойти ограничения „огороженного сада“ Apple», — рассказал Джордж TechCrunch.
Идея пришла Джорджу в 2023 году, когда он работал в JPMorgan и ежедневно участвовал в совещаниях. Он создал скрипт для записи и транскрипции аудио, который затем передавал данные в ChatGPT. Результаты впечатлили его настолько, что он решил разработать отдельное приложение.
Помимо мобильного приложения, TwinMind предлагает расширение для Chrome, которое с помощью vision AI сканирует открытые вкладки и собирает контекст из почты, Slack и других платформ. Этим же инструментом стартап отобрал четырёх стажеров из 854 заявок.
«Мы открыли все профили LinkedIn и резюме соискателей во вкладках браузера и попросили расширение ранжировать лучших кандидатов. Оно справилось фантастически — именно так мы наняли наших финальных четырёх стажеров», — отметил Джордж.
Стартап уже привлёк 5,7 млн долларов (456 млн рублей) в рамках посевного раунда при оценке в 60 млн долларов. Инвесторами выступили Streamlined Ventures, Sequoia Capital и Стивен Вольфрам, который лично поддержал проект.
Недавно компания представила новую речевую модель Ear-3 с поддержкой 140 языков и низкой частотой ошибок. Модель распознает разных говорящих в беседе и будет доступна через API для разработчиков. Стоимость использования — 0,23 доллара в час (~18 рублей).
Бесплатная версия приложения остаётся с неограниченной транскрипцией, а Pro-подписка за 15 долларов в месяц (~1200 рублей) предлагает расширенный контекст и приоритетную поддержку.
Основатели подчеркивают конфиденциальность: аудиозаписи удаляются сразу после обработки, сохраняется только текст. Модели не обучаются на пользовательских данных.
0 комментариев