Datacurve привлекла $15 млн для конкуренции со ScaleAI
По мере того как компании в области ИИ становятся более зрелыми, борьба за высококачественные данные превратилась в одну из самых конкурентных областей отрасли, породив такие компании, как Mercor, Surge и, что наиболее заметно, ScaleAI Александра Вана. Но теперь, когда Ван перешел руководить ИИ в Meta, многие инвесторы видят возможность — и готовы финансировать компании с убедительными новыми стратегиями сбора обучающих данных.
Выпускник Y Combinator Datacurve — одна из таких компаний, сосредоточенная на высококачественных данных для разработки программного обеспечения. В четверг компания объявила о привлечении $15 млн (около 1,2 млн рублей) в рамках раунда финансирования Серии A, который возглавил Марк Голдберг из Chemistry при участии сотрудников DeepMind, Vercel, Anthropic и OpenAI. Раунд Серии A последовал за начальным раундом в $2,7 млн, в который инвестировал бывший технический директор Coinbase Баладжи Шринивасан.
Datacurve использует систему «охотников за вознаграждениями», чтобы привлекать квалифицированных инженеров-программистов для выполнения самых сложных задач по сбору наборов данных. Компания платит за эти вклады, распределив на сегодняшний день более $1 млн в виде вознаграждений.
Но соучредитель Серена Ге (на фото выше с соучредителем Чарли Ли) говорит, что главная мотивация — не финансовая. Для высокоценных услуг, таких как разработка программного обеспечения, оплата за работу с данными всегда будет значительно ниже, чем при традиционной занятости, поэтому самое важное преимущество компании — это положительный пользовательский опыт.
«Мы рассматриваем это как потребительский продукт, а не как операцию по разметке данных», — сказала Ге. — «Мы много времени уделяем размышлениям о том, как мы можем оптимизировать его, чтобы люди, которых мы хотим, заинтересовались и пришли на нашу платформу?»
Это особенно важно, поскольку потребности в данных после обучения становятся все более сложными. В то время как ранние модели обучались на простых наборах данных, современные продукты ИИ полагаются на сложные среды обучения с подкреплением, которые необходимо создавать с помощью специфического и стратегического сбора данных. По мере того как среды становятся более сложными, требования к данным становятся более интенсивными как по количеству, так и по качеству — фактор, который может дать преимущество компаниям по сбору высококачественных данных, таким как Datacurve.
Как компания на ранней стадии, Datacurve сосредоточена на разработке программного обеспечения, но Ге говорит, что модель может так же легко применяться в таких областях, как финансы, маркетинг или даже медицина.
«То, что мы делаем сейчас, — это создаем инфраструктуру для сбора данных после обучения, которая привлекает и удерживает высококомпетентных людей в их собственных областях», — говорит Ге.
ИИ: Интересно наблюдать, как смещается фокус с простого сбора больших объемов данных на стратегический сбор высококачественных данных. Подход Datacurve к привлечению экспертов через «охоту за вознаграждениями» выглядит перспективно, особенно для сложных задач вроде разработки ПО. В 2025 году, когда качество данных становится критическим фактором для успеха ИИ-моделей, такие нишевые стратегии могут оказаться ключевыми.
* Meta, Facebook и Instagram запрещены в России.
0 комментариев