понедельник, 9 марта 2020 г.

Познакомьтесь с Джако и Бакстером, роботами машинного обучения, которые готовят отличные хот-доги


Желаете перекусить на свежем гриле фрэнком? Два робота по имени Джако и Бакстер могут обслуживать одного. Инженеры Бостонского университета сделали скачок в использовании машинного обучения для обучения роботов для выполнения сложных задач - основы, которая может быть применена для множества задач, таких как выявление раковых пятен на маммограммах или лучшее понимание голосовых команд для воспроизведения музыки. Но сначала, в качестве доказательства концепции - они научились готовить идеальный хот-дог.

Ремонт, это всегда стрес. Сложный выбор материалов и исполниителей работ. Если в Вашем ремонте грядет замена или ремонт потолка, рекомендую посетить сайт soda.dp.ua, где Вы сможете заказать профессиональные натяжные потолки Днепр.




Исследователи до сих пор не до конца понимают, как именно алгоритмы машинного обучения - ну, учатся. Это слепое пятно затрудняет применение этой техники для сложных, рискованных задач, таких как автономное вождение, где безопасность является проблемой. В шаге вперед, опубликованном в Science Robotics , Калин Белта, профессор технического колледжа BU, и исследователи в его лаборатории научили двух роботов готовить, собирать и обслуживать хот-доги вместе. Их метод сочетает в себе методы из машинного обучения и формальных методов, область компьютерных наук, которая обычно используется для обеспечения безопасности, особенно это касается программного обеспечения авионики или кибербезопасности. Эти разрозненные методы сложно математически объединить и объединить в язык , понятный роботу .

Белта, профессор механики, системотехники, электротехники и вычислительной техники, и его команда работали в области машинного обучения, известной как обучение с подкреплением . Когда компьютер выполняет задачу правильно, он получает вознаграждение, которое направляет его процесс обучения. Хотя шаги задачи изложены в алгоритме «предварительных знаний», как именно выполнить эти шаги нет. Когда робот становится лучше в выполнении шага, его награда увеличивается, создавая механизм обратной связи, который подталкивает робота к обучению наилучшему способу, например, поставить хот-дог на булочку.

Интеграция предшествующих знаний с обучением с подкреплением и формальными методами - вот что делает этот метод новым Комбинируя эти три метода, команда может сократить количество возможностей, которые роботы должны пройти, чтобы научиться готовить, собирать и обслуживать хот-дог безопасно. Белта рассматривает эту работу как демонстрацию концепции своей общей структуры и надеется, что ее продвижение может быть применено к другим сложным задачам , таким как автономное вождение.