Бюрократы, Администраторы интерфейса, Администраторы (Semantic MediaWiki), Администраторы, Редакторы виджетов, Редакторы
4567
правок
Rodion (обсуждение | вклад) |
Rodion (обсуждение | вклад) |
||
| Строка 254: | Строка 254: | ||
Теперь модели стали достаточно хороши в верификации более субъективных вещей (например, качества рабочего продукта), что позволяет использовать ИДА для улучшения модели во многих задачах. | Теперь модели стали достаточно хороши в верификации более субъективных вещей (например, качества рабочего продукта), что позволяет использовать ИДА для улучшения модели во многих задачах. | ||
}} | }} | ||
Благодаря новым прорывам в возможностях, Agent-3 становится быстрым и дешевым сверхчеловеческим программистом. OpenBrain запускает 200 000 копий Agent-3 параллельно, создавая рабочую силу, эквивалентную 50 000 копий лучшего программиста-человека, ускоренного в 30 раз.<ref>Мы ожидаем, что Agent-3 будет иметь требования к инференсу примерно как у 10-триллионного параметрического трансформера сегодня. Таким образом, при 6% их бюджета вычислительных ресурсов на запуск Agent-3 они могут запустить примерно 200 000 копий со скоростью мышления в 30 раз выше человеческой (см. раздел автоматизации исследований ИИ (https://ai-2027.com/supplements/compute-forecast#section-4-ai-research-automation) дополнения по вычислительным ресурсам для обоснования и деталей). Каждый каркас сверхчеловеческого программиста, построенный на Agent-3, имеет в среднем эквивалент примерно восьми копий Agent-3, работающих «под капотом» (что на самом деле может быть набором меньших или специализированных моделей, которым Agent-3 делегирует подзадачи).</ref> OpenBrain по-прежнему держит своих инженеров-людей в штате, потому что у них есть комплементарные навыки, необходимые для управления командами копий Agent-3. Например, научное чутье (research taste) оказалось трудно тренировать из-за более длинных циклов обратной связи и меньшей доступности данных.54 Эта огромная сверхчеловеческая рабочая сила ускоряет общую скорость алгоритмического прогресса OpenBrain «всего» в 4 раза из-за узких мест и убывающей отдачи от труда программистов.55 | |||
Теперь, когда программирование полностью автоматизировано, OpenBrain может быстро создавать высококачественные среды обучения для обучения слабых навыков Agent-3, таких как научное чутье и крупномасштабная координация. В то время как предыдущие среды обучения включали «Вот несколько GPU и инструкции для экспериментов, которые нужно запрограммировать и запустить, ваша производительность будет оцениваться так, как если бы вы были ML-инженером», теперь они обучаются на «Вот несколько сотен GPU, подключение к Интернету и некоторые исследовательские задачи; вы и тысяча других копий должны работать вместе, чтобы добиться прогресса в исследованиях. Чем он будет более впечатляющим, тем выше будет ваш балл». | |||
правок