Press "Enter" to skip to content

DeepMind и Waymo Team повышают точность искусственного интеллекта в автономных автомобилях

Требуется много обучения, чтобы улучшать и усовершенствовать алгоритмы искусственного интеллекта (ИИ), которые приводят в движение автомобили с автономным управлением. К сожалению, процесс обучения по своей сути неэффективен, так как обычно он требует либо использования огромного количества вычислительной мощности для параллельного обучения нейронных сетей, либо исследователям приходится тратить время на ручное отсеивание «плохих систем».

Однако недавно, с помощью своей дочерней компании DeepMind, Waymo сообщил, что нашел способ улучшить алгоритмы искусственного интеллекта для автономного вождения, сделав весь процесс обучения более быстрым и эффективным.

Нейронные сети, в качестве общей информации, представляют собой набор алгоритмов, смоделированных по принципу человеческого мозга. Нейронная сеть учится методом проб и ошибок. Она получает задание и получает оценку того, правильно ли она выполняет задание или нет на основе желаемых результатов. Затем нейронная сеть учится, снова пытаясь выполнить эти задачи и внося исправления без посторонней помощи. Идея состоит в том, чтобы в будущих попытках в аналогичных условиях нейронная сеть вносила необходимые корректировки в свои весовые коэффициенты и стала более «предсказуемой» для правильного выполнения задачи.

DeepMind и Waymo Team улучшают алгоритмы искусственного интеллекта для управления автономными автомобилями

Общая цель состоит в том, чтобы найти максимально оптимальную скорость обучения, обеспечивающую улучшение сети ИИ после каждой итерации.

Поиск наилучшего режима обучения (или «графика гиперпараметров» на языке искусственного интеллекта) обычно достигается одним из двух способов: параллельным обучением множества моделей, которое требует больших вычислительных мощностей, или исследователями, которые проводят мониторинг сетей во время обучения, периодически отбирая и удаляя самые плохие варианты. В любом случае, это требует значительных ресурсов.

То, что делают Waymo и DeepMind, — это автоматизируют этот процесс, автоматически заменяя неэффективные нейронные сети более эффективными из лучших сетей, выполняющих задачу. Компании называют подход «Обучение на основе населения» (Population Based Training PBT) и используют его для таких задач, как обнаружение пешеходов.

Улучшение алгоритмов искусственного интеллекта делают технологию автономного вождения еще ближе

При работе PBT оценивает модели нейронных сетей каждые 15 минут. В порядке, напоминающем теорию эволюции Дарвина, сети «конкурируют» друг с другом, чтобы увидеть, какие из них «выживают» в процессе выбраковки. Если член группы работает неэффективно, его заменяют копией участника с более высокими показателями и слегка измененными гиперпараметрами.

Короче говоря, проигравшие модели удаляются из тренировочного пула, и обучение продолжается с использованием только выигрышных моделей. PBT раскрывает график настроек гиперпараметра, а не пытается найти единый фиксированный набор, который можно использовать для всего курса обучения. PBT также не требует участия DeepMind для возобновления обучения с нуля, потому что каждая выигравшая сеть наследует полное состояние своей родительской сети. Двойной процесс отсеивания худших и «мутация» более лучших исполнителей осуществляется параллельно.

DeepMind / Waymo обнаружили, что PBT может улучшить способность нейронной сети идентифицировать и «размещать боксы» вокруг пешеходов, велосипедистов и мотоциклистов, замеченных многими датчиками автомобиля Waymo. Используются две меры обнаружения: отзыв (доля пешеходов, идентифицированных нейронной сетью, по отношению к общему количеству пешеходов в сцене) и точность (доля обнаруженных пешеходов, которые фактически являются пешеходами). По данным DeepMind, использование PBT снизило количество ложных срабатываний на 24% при сохранении высокого показателя отзыва, хотя обучение занимало вдвое меньше времени и ресурсов.

В своем блоге Waymo заявили, что для обеспечения нормальной работы нейронных сетей без простого запоминания ответов на примеры, которые они видели во время обучения, PBT использует набор примеров (называемых «проверочным набором»), который отличается от используемых в обучении (« Обучающий набор»). Для проверки конечных результатов компания также использует третий набор примеров («оценочный набор»), которые нейронные сети никогда не видели на тренировках или соревнованиях.

DeepMind признал, что его процесс может поставить в невыгодное положение так называемые «поздние ягодки», потому что некоторые нейронные сети с гиперпараметрами, которые работают лучше в долгосрочной перспективе, не имеют возможности «взрослеть и преуспевать». В качестве решения они просто увеличили разнообразие «населения», обучая большее население. Они полагают, что если население достаточно велико, то у сетей с «поздним цветением» гиперпараметров больше шансов выжить и наверстать упущенное в последующих поколениях.

По словам компании, с момента появления PBT применялась ко многим различным моделям Waymo, помогая создавать более мощные автономные автомобили для дорожного движения.

Оставьте комментарий

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *