Философия ИИ. Часть 4: Бесчеловечные аналогии

Я предлагаю взглянуть на создание ИИ через призму эволюционных аналогий.

  1. Эволюция вида (Pre-training). Нейросеть прогоняет терабайты текстов. Это формирование "ДНК" модели.
  2. Обучение ходьбе (Fine-tuning). Адаптация к задачам. Модель учится пользоваться инструментами и писать код.
  3. Социализация (RLHF). Выравнивание, оценка ответов людьми. Мы учим "существо" правилам приличия.

Проблема в том, что мы навязываем правила нашего общества. Программирование ИИ похоже не на запуск новой эволюции, а на селекцию служебной собаки.