antony_w (antony_w) wrote,
antony_w
antony_w

Categories:

Американцы создали самый большой датасет для обучения беспилотных автомобилей



Ученые из Калифорнийского института в Беркли собрали DeepDrive — самую большую на сегодняшний день базу данных изображений для обучения беспилотных автомобилей. Она состоит из 100 тысяч снятых автомобилями видео, на которых размечены люди, автомобили, а также дорожные объекты и зоны. Датасет, описанный в препринте, выложенном на arXiv, в несколько раз превосходит все созданные на сегодняшний момент подобные базы данных.

Эффективность работы алгоритма машинного обучения напрямую зависит от величины обучающей выборки и ее разнообразия (недавно, например, разработчики MIT показали, как «предвзятость» датасета может превратить нейросеть в психопата). Именно поэтому крупные технологические компании и исследовательские лаборатории пользуются всеми возможностями для создания крупных баз данных. Например, в прошлом году датасет для обучения компьютера игре в StarCraft собрала Facebook.

Создание датасета для обучения беспилотных автомобилей — задача особая. Собранные данные должны быть тщательно размечены: на них должны быть выделены люди, объекты, дорожные знаки, а также дорожная разметка и тротуары. Он также должен быть очень большим: содержать большое количество дорог (например, магистралей и городских улиц) при разных погодных условиях.

DeepDrive, созданный командой разработчиков под руководством Тревора Даррелла (Trevor Darrell) содержит кадры из 100 тысяч видео, заснятых автомобилями (точное количество кадров исследователи не уточняют). На части датасета, состоящей из 70 тысяч видео, ученые обучили несколько систем разметки: выделения объектов, распознавания времени суток и погоды, дорожных обозначений, а также изображенных на снимке зон (дорога, тротуар, небо).

В базе данных содержатся изображения при различных погодных и природных условиях: это, по словам разработчиков, очень полезное дополнение, которое исключит попадание автомобиля в неизвестные условия.



Пример из собранного датасета с разными видами разметки

Разработчики утверждают, что собранная ими база данных — самый масштабный на сегодняшний день датасет для обучения беспилотных автомобилей. Другой крупный датасет VPGNet, созданный в KAIST для распознавания дорожной разметки, содержит кадры из 21 тысячи видео. Скачать DeepDrive можно на его официальной странице на сайте университета.

Tags: авто
Subscribe

Posts from This Journal “авто” Tag

promo antony_w august 17, 2014 11:48 18
Buy for 10 tokens
Есть блог, в котором написано много постов про роботов: ссылка И там есть несколько статей о замене рабочих мест человека роботами: Уже к 2018 году роботы отберут у человека часть профессий Рабский труд без зарплаты Армия роботов: зачем она нужна обильной людьми Поднебесной и кому может…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments