Бюрократы, Администраторы интерфейса, Администраторы (Semantic MediaWiki), Администраторы, Редакторы виджетов, Редакторы
4567
правок
Rodion (обсуждение | вклад) |
Rodion (обсуждение | вклад) |
||
| Строка 86: | Строка 86: | ||
США ужесточают экспортный контроль и заставляют все чипы оснащать различными устойчивыми к вскрытию [https://www.rand.org/pubs/working_papers/WRA3056-1.html аппаратно-реализуемыми механизмами управления], включая отслеживание местоположения. | США ужесточают экспортный контроль и заставляют все чипы оснащать различными устойчивыми к вскрытию [https://www.rand.org/pubs/working_papers/WRA3056-1.html аппаратно-реализуемыми механизмами управления], включая отслеживание местоположения. | ||
== Январь 2028: Более безопасная стратегия == | |||
За последний месяц сотни исследователей согласования (alignment) присоединились к проекту и использовали Safer-1 в качестве испытательного полигона для очень быстрой разработки Safer-2. Safer-2 прозрачен, согласован (aligned) и более способен, чем Safer-1.23 Он уже работает над разработкой Safer-3. | |||
Почему Safer-2 прозрачен? Схожая архитектура с Safer-1. Почему он согласован? В то время как Safer-1 имел в основном то же обучение, что и Agent-4, Safer-2 имеет новый метод обучения, который действительно стимулирует правильные цели и принципы, а не просто кажется таковым. Они смогли разработать этот метод обучения, быстро перебирая множество различных идей и сравнивая предполагаемый результат (Спецификацию) с фактическим результатом (мыслями в цепочке рассуждений).24 | |||
{{Collapse|Новая стратегия согласования (Alignment) OpenBrain| | |||
}} | |||
правок