Musk Wiki

Концепт

Человекоподобные роботы

ДальшеЭкзистенциальный риск ИИ

Человекоподобные роботы

Убеждение Илона Маска в том, что универсальные человекоподобные роботы — Optimus от Tesla — станут крупнейшей товарной категорией в истории, и что путь к этому пролегает через машинное обучение, выстроенное по образцу того, как учится человеческий ребёнок. Второе интервью CNBC / Дэвиду Фаберу в мае 2025 года — первая в вики специальная запись этого кластера убеждений, проговорённого им вслух: утверждение о спросе, прогноз по срокам и — самое показательное для сознания — модель того, как роботы приобретают навыки.

Это отличается от институциональной формулировки устойчивого изобилия (где мастер-план Tesla 2025 года подаёт Optimus как способ вернуть людям время). Здесь это сам Маск, под давлением, доказывает, почему, по его мнению, роботы приходят, и как они будут учиться.

Документальное примечание: вики сообщает это как заявленные прогнозы и рассуждения Маска, а не как установленный факт. Утверждения о спросе и сроках — прогнозы; они зафиксированы и приписаны ему без одобрения.

Утверждение о спросе — «крупнейший продукт за всю историю»

На довод Фабера, что десятки миллиардов роботов «в десятилетиях впереди», Маск сжимает срок («как минимум в десятилетии впереди», но «это будет расти очень быстро») и заявляет максимально сильное утверждение о спросе:

“I think, I think humanoid robots will be the biggest product ever. The demand will be insatiable.” 🔗

«Я думаю, я думаю, человекоподобные роботы станут крупнейшим продуктом за всю историю. Спрос будет ненасытным.»

Его причина — интуиция универсальности: каждый захочет такого, поданная через спутников из поп-культуры:

“who wouldn’t want their own personal C3PO or R2D2. Everyone’s going to want one.” 🔗

«кто бы не захотел собственного личного C3PO или R2D2. Каждый захочет такого.»

Он подтверждает цель в миллион роботов к 2030 году как «разумную цель» (пересказ — цифру называет Фабер). Формулировку «устойчивое изобилие» для того, к чему это ведёт, произносит Фабер, а не Маск; собственный вклад Маска здесь — это утверждение о спросе и модель обучения, которые вики помещает рядом с более широкой темой изобилия, а не как его слова.

Модель обучения — робот как ребёнок

Концептуально самая богатая часть — не прогноз, а механизм. Маск излагает поэтапную теорию того, как робот приобретает умения, и она явно построена по образцу человеческого развития.

Этап 1 — старт через имитацию (Mocap). Сначала роботов обучают примитивным задачам через человека в костюме захвата движения, чтобы «загрузить интеллект, чтобы появились базовые функции» (пересказ) — поднять предмет, открыть дверь, бросить мяч, танцевать.

Этап 2 — пороговый прорыв: обучение по видео. Способность, которую он выделяет как драматический рывок, — научиться задаче, посмотрев на неё, как это умеет человек:

“if optimus can watch videos, YouTube videos, or how to videos, or whatever. And based on that video, just like a human can learn how to do that thing, then you really have task extensibility that is dramatic, because then it can learn anything very quickly.” 🔗

«если Optimus может смотреть видео — ролики на YouTube, обучающие видео, что угодно. И на основе этого видео, ровно как человек может научиться делать ту вещь, тогда у тебя по-настоящему появляется расширяемость задач, которая драматична, потому что тогда он может научиться чему угодно очень быстро.»

Он откровенен, что это ещё не решено — «мы пока не там» (пересказ) — и называет это «очень значимым порогом».

Этап 3 — самоигра, как ребёнок с игрушками. Аналогия, к которой он прибегает, — ребёнок, обучающийся через игру, и он превращает её в инженерный рецепт (много роботов + комната с игрушками + функция вознаграждения):

“you want the robot to self-play. So you say, how does a child learn? Well, a child has toys and a child plays with the toys.” 🔗

«ты хочешь, чтобы робот занимался самоигрой. Вот ты говоришь: как учится ребёнок? Ну, у ребёнка есть игрушки, и ребёнок играет с игрушками.»

“Once you have a lot of robots, you can do this self-play, which is that you just put the robot in a room with toys and have the robot, literally have the robot play with toys.” 🔗

«Когда у тебя много роботов, ты можешь устроить эту самоигру — то есть просто поместить робота в комнату с игрушками и заставить робота, буквально заставить робота играть с игрушками.»

Классическая игрушка-сортер становится его иллюстрацией функции вознаграждения — положить круг в круглое отверстие, квадрат в квадратное, «и делать это снова и снова, пока не выйдет, и функция вознаграждения — это успех» (пересказ). Оставшиеся продвижения он считает реальными, «но не думаю, что они непреодолимы» (пересказ), решаемыми «в ближайшие несколько лет».

Что это раскрывает

  • Та же привычка к первопринципам, приложенная к робототехнике. Он переформулирует открытую проблему (универсальная манипуляция) как поддающийся решению поэтапный конвейер обучения — имитация → видео → самоигра — ровно тот приём переформулирования задачи, что отслеживает остальная вики. Иллюстрация с функцией вознаграждения — это инженерия, а не метафора.
  • Модель интеллекта через человеческое развитие. Обращение к тому, как учится ребёнок, — это маркер: он трактует биологическое обучение как доказательство существования и как шаблон — тот же инстинкт, что стоит за его слоистой моделью разума и его аппаратным взглядом на человека.
  • Универсальность как тезис о спросе. «Каждый захочет такого» — та же интуиция о тотальном адресуемом рынке, что движет его формулировкой изобилия, — робот как универсальный трудовой ресурс, а не нишевый продукт.
  • Оптимизм, ограниченный признанным пробелом. В отличие от институциональной формулировки мастер-плана, здесь он открыто признаёт, что ключевая способность (обучение по видео) не решена, — редкое «мы пока не там» под запись рядом с грандиозным заявлением.

Связанное