AI 2027: различия между версиями

Строка 254: Строка 254:
Теперь модели стали достаточно хороши в верификации более субъективных вещей (например, качества рабочего продукта), что позволяет использовать ИДА для улучшения модели во многих задачах.
Теперь модели стали достаточно хороши в верификации более субъективных вещей (например, качества рабочего продукта), что позволяет использовать ИДА для улучшения модели во многих задачах.
}}
}}
Благодаря новым прорывам в возможностях, Agent-3 становится быстрым и дешевым сверхчеловеческим программистом. OpenBrain запускает 200 000 копий Agent-3 параллельно, создавая рабочую силу, эквивалентную 50 000 копий лучшего программиста-человека, ускоренного в 30 раз.<ref>Мы ожидаем, что Agent-3 будет иметь требования к инференсу примерно как у 10-триллионного параметрического трансформера сегодня. Таким образом, при 6% их бюджета вычислительных ресурсов на запуск Agent-3 они могут запустить примерно 200 000 копий со скоростью мышления в 30 раз выше человеческой (см. раздел автоматизации исследований ИИ (https://ai-2027.com/supplements/compute-forecast#section-4-ai-research-automation) дополнения по вычислительным ресурсам для обоснования и деталей). Каждый каркас сверхчеловеческого программиста, построенный на Agent-3, имеет в среднем эквивалент примерно восьми копий Agent-3, работающих «под капотом» (что на самом деле может быть набором меньших или специализированных моделей, которым Agent-3 делегирует подзадачи).</ref> OpenBrain по-прежнему держит своих инженеров-людей в штате, потому что у них есть комплементарные навыки, необходимые для управления командами копий Agent-3. Например, научное чутье (research taste) оказалось трудно тренировать из-за более длинных циклов обратной связи и меньшей доступности данных.54 Эта огромная сверхчеловеческая рабочая сила ускоряет общую скорость алгоритмического прогресса OpenBrain «всего» в 4 раза из-за узких мест и убывающей отдачи от труда программистов.55
Теперь, когда программирование полностью автоматизировано, OpenBrain может быстро создавать высококачественные среды обучения для обучения слабых навыков Agent-3, таких как научное чутье и крупномасштабная координация. В то время как предыдущие среды обучения включали «Вот несколько GPU и инструкции для экспериментов, которые нужно запрограммировать и запустить, ваша производительность будет оцениваться так, как если бы вы были ML-инженером», теперь они обучаются на «Вот несколько сотен GPU, подключение к Интернету и некоторые исследовательские задачи; вы и тысяча других копий должны работать вместе, чтобы добиться прогресса в исследованиях. Чем он будет более впечатляющим, тем выше будет ваш балл».