Машинное обучение: как опыт людей делает ИИ еще более мощным
Большинство людей не подумают научить пятилетних детей бить по бейсболу, передавая им биты и мячи, предлагая им подбрасывать предметы в воздух в виде множества различных комбинаций и надеясь, что они поймут, как эти две вещи соединяются ,
И все же, в некотором роде мы сегодня подходим к машинному обучению , показывая машинам много данных и ожидая, что они научатся ассоциациям или найдут шаблоны самостоятельно.
Для многих наиболее распространенных приложений современных технологий искусственного интеллекта, таких как простое распознавание текста или изображений, это работает очень хорошо.
Но по мере того, как желание использовать ИИ для большего количества сценариев возросло, ученые и разработчики продуктов Microsoft впервые предложили дополнительный подход, называемый машинным обучением . Это основано на опыте людей, чтобы разбить проблему на более простые задачи и дать моделям машинного обучения важные подсказки о том, как быстрее найти решение. Это все равно, что учить ребенка совершать удары в домашних условиях, сначала положив мяч на тройник, затем бросив подачу за кулисы и в конце концов перейдя к фастболу.
«Это кажется очень естественным и интуитивно понятным, когда мы говорим об этом с человеческой точки зрения, но когда мы переключаемся на машинное обучение, у всех людей, независимо от того, осознают они это или нет,« давайте просто бросаем шары в систему », — сказал Марк Хэммонд, Microsoft. генеральный менеджер по бизнесу AI. «Машинное обучение — это набор инструментов, которые помогут вам прекратить это делать».
Машинное обучение стремится получать знания от людей, а не извлекать знания только из данных. Человек, который понимает стоящую перед нами задачу — как решить, какой отдел в компании должен получать входящее электронное письмо, или как автоматически позиционировать ветряные турбины, чтобы генерировать больше энергии, — сначала разбил бы эту проблему на более мелкие части. Затем они предоставили бы ограниченное количество примеров или эквивалент планов уроков, чтобы помочь алгоритмам машинного обучения решить эту проблему.
В контролируемых сценариях обучения машинное обучение особенно полезно, когда для алгоритмов машинного обучения мало или вообще нет маркированных обучающих данных, поскольку потребности отрасли или компании настолько специфичны.
В сложных и неоднозначных сценариях обучения с подкреплением — где алгоритмы испытывают затруднения при определении того, какое из миллионов возможных действий необходимо выполнить для решения задач в физическом мире, — машинное обучение может значительно сократить время, необходимое интеллектуальному агенту для поиска решения.
Это также является частью более широкой цели — дать возможность более широкому кругу людей использовать ИИ более изощренными способами. Машинное обучение позволяет разработчикам или предметным экспертам с небольшим опытом работы с ИИ, таким как юристы, бухгалтеры, инженеры, медсестры или операторы вилочных погрузчиков, передавать важные абстрактные понятия интеллектуальной системе , которая затем выполняет механику машинного обучения в фоновом режиме.
Исследователи Microsoft начали изучать принципы машинного обучения почти десять лет назад, и теперь эти концепции внедряются в продукты, которые помогают компаниям создавать все — от интеллектуальных ботов по обслуживанию клиентов до автономных систем .
«Даже самый умный ИИ будет изо всех сил пытаться научиться выполнять некоторые из очень сложных задач, которые часто встречаются в реальном мире. Поэтому вам нужен такой подход, когда люди будут руководить системами ИИ, чтобы узнать то, что мы уже знаем, «сказал Гурдип Палл, корпоративный вице-президент Microsoft по бизнес-искусству. «Использование этого« под ключ »ИИ, когда неспециалисты используют его для выполнения гораздо более сложных задач, действительно является хорошим местом для машинного обучения».
Марк Хаммонд, генеральный менеджер Microsoft по бизнес-искусству и бывший генеральный директор Bonsai, разработал платформу, которая использует машинное обучение, чтобы помочь алгоритмам глубокого обучения в решении реальных проблем. Кредит: Дэн Делонг для Microsoft
Сегодня, если мы пытаемся научить алгоритму машинного обучения узнать, что такое стол, мы могли бы легко найти набор данных с изображениями столов, стульев и ламп, которые были тщательно помечены. После предоставления алгоритму бесчисленных помеченных примеров, он учится распознавать характеристики таблицы.
Но если бы вам пришлось учить человека распознавать стол, вы, вероятно, начали бы с объяснения, что у него четыре ноги и плоский верх. Если бы вы увидели, что человек также ставит стулья в эту категорию, вы бы объяснили, что у стула есть спинка, а у стола — нет. Эти абстракции и петли обратной связи являются ключом к тому, как люди учатся, и они также могут дополнить традиционные подходы к машинному обучению.
«Если вы можете научить чему-то другого человека, вы должны научить его на машине с использованием языка, который очень близок к тому, как люди учатся», — сказал Патрис Симард, выдающийся инженер Microsoft, который впервые начал работу по обучению машин для Microsoft Research. В этом месяце его команда переходит в группу «Опыт и устройства», чтобы продолжить эту работу и еще больше интегрировать машинное обучение с предложениями ИИ для разговорного общения.
Миллионы потенциальных пользователей ИИ
Симард впервые начал думать о новой парадигме построения систем искусственного интеллекта, когда заметил, что почти все статьи на конференциях по машинному обучению были сосредоточены на повышении производительности алгоритмов на тщательно отобранных тестах. Но в реальном мире, понял он, преподавание является не менее или, возможно, более важным компонентом обучения, особенно для простых задач, где доступны ограниченные данные.
Если вы хотели научить систему искусственного интеллекта, как выбирать лучший автомобиль, но имели только несколько примеров, которые были отмечены как «хорошие» и «плохие», из этой ограниченной информации можно сделать вывод, что определяющей характеристикой хорошего автомобиля является то, что четвертый номер его номерного знака — «2». Но нацеливание системы искусственного интеллекта на те же характеристики, которые вы бы посоветовали вашему подростку: пробег, рейтинг безопасности, результаты краш-тестов, цена, позволяет алгоритмам правильно распознавать хорошие и плохие автомобили, несмотря на ограниченную доступность отмеченных примеров.
В контролируемых сценариях обучения машинное обучение улучшает модели, выявляя эти значимые функции высокого уровня. Как и в программировании, искусство машинного обучения также включает в себя разбиение задач на более простые задачи. Если необходимые функции не существуют, они могут быть созданы с использованием подмоделей, которые используют функции более низкого уровня и достаточно просты для изучения на нескольких примерах. Если система постоянно совершает одну и ту же ошибку, ошибки можно устранить, добавив функции или примеры.
Одним из первых продуктов Microsoft, использующих концепции машинного обучения, является Language Understanding — инструмент в когнитивных службах Azure, который определяет намерения и ключевые понятия из краткого текста. Он используется компаниями от UPS и Progressive Insurance до Telefonica для разработки интеллектуальных ботов для обслуживания клиентов.
«Чтобы узнать, есть ли у клиента вопрос о выставлении счетов или плане обслуживания, вам не нужно приводить нам каждый пример вопроса. Вы можете предоставить четыре или пять вместе с функциями и ключевыми словами, которые важны в этом домене. и Language Understanding заботится об оборудовании в фоновом режиме », — сказал Рихам Мансур, главный менеджер по разработке программного обеспечения, отвечающий за Language Understanding.
Исследователи Microsoft изучают, как применять концепции машинного обучения для решения более сложных задач, таких как классификация более длинных документов, электронной почты и даже изображений. Они также работают над тем, чтобы сделать учебный процесс более интуитивным, например, предлагая пользователям, какие функции могут быть важны для решения задачи.
Представьте, что компания хочет использовать AI для сканирования всех своих документов и электронных писем за последний год, чтобы выяснить, сколько цитат было разослано и сколько из них привело к продаже, сказала Алисия Эдельман Пелтон, главный менеджер программы для Microsoft Machine. Учебная группа.
Корпоративный вице-президент Microsoft по бизнесу А.И. Гурдип Палл рассказывает на недавней конференции о решениях для автономных систем, в которых используется машинное обучение. Кредит: Дэн Делонг для Microsoft
В качестве первого шага система должна знать, как идентифицировать предложение по контракту или счету. Часто для такой задачи не существует маркированных данных об обучении, особенно если каждый продавец в компании обрабатывает их немного по-своему.
Если бы система использовала традиционные методы машинного обучения, компания должна была бы передать этот процесс на аутсорсинг, отправив тысячи образцов документов и подробных инструкций, чтобы армия людей могла попытаться правильно их маркировать — процесс, который может занять месяцы назад и вперед для устранить ошибку и найти все соответствующие примеры. Им также понадобится эксперт по машинному обучению, который будет востребован для построения модели машинного обучения. И если новые продавцы начинают использовать другие форматы, на которых система не обучалась, модель запутывается и перестает работать хорошо.
В отличие от этого, сказал Пелтон, в подходе Microsoft к машинному обучению будет использоваться человек внутри компании, чтобы определить характерные особенности и структуры, обычно встречающиеся в цитате: что-то, отправленное продавцом, имя внешнего клиента, такие слова, как «цитата» или «дата доставки». , «» продукт «,» количество «или» условия оплаты «.
Это переведет опыт этого человека на язык, который машина может понять, и использовать алгоритм машинного обучения, который был предварительно выбран для выполнения этой задачи. По словам Пелтона, это поможет клиентам создавать индивидуальные решения для искусственного интеллекта за короткий промежуток времени, используя опыт, уже существующий в их организации.
Пелтон отметил, что в мире есть бесчисленное множество людей, «которые понимают свой бизнес и могут описать важные концепции — юрист, который говорит:« О, я знаю, как выглядит контракт, и я знаю, как выглядит повестка, и я могу дать вам подсказки, чтобы показать разницу.
Делая трудные проблемы действительно решаемыми
Более десяти лет назад Хаммонд работал системным программистом в нейробиологической лаборатории Йельского университета и заметил, как ученые использовали пошаговый подход к обучению животных для выполнения задач в своих исследованиях. У него было похожее прозрение о заимствовании этих уроков для обучения машинам.
Это в конечном итоге привело его к созданию бонсай , который был приобретен Microsoft в прошлом году. Он сочетает в себе машинное обучение с углубленным обучением и моделированием, чтобы помочь компаниям разработать «мозги», которые запускают автономные системы в приложениях — от робототехники и производства до энергетики и управления зданием. Платформа использует язык программирования под названием Inkling, чтобы помочь разработчикам и даже экспертам в предметной области разбирать проблемы и писать программы ИИ.
Глубокое обучение с подкреплением, ветвь ИИ, в которой алгоритмы обучаются методом проб и ошибок на основе системы вознаграждений, успешно превзошло людей в видеоиграх. Но эти модели изо всех сил пытались справиться с более сложными реальными промышленными задачами, сказал Хаммонд.
По словам Хаммонда, добавление уровня машинного обучения — или включение уникального предметного опыта организации непосредственно в модель глубокого обучения — может значительно сократить время, необходимое для поиска решений этих очень сложных реальных проблем.
Например, представьте, что производственная компания хочет обучить агента искусственного интеллекта для автономной калибровки критически важного оборудования, которое может быть выброшено из строя при изменении температуры или влажности или после того, как оно использовалось в течение некоторого времени. Человек будет использовать язык Inkling, чтобы создать «план урока», в котором будет указана соответствующая информация для выполнения задачи и для мониторинга того, хорошо ли работает система.
Вооружившись этой информацией из своего компонента машинного обучения, система Бонсай выберет лучшую модель обучения подкреплению и создаст «мозг» ИИ для сокращения дорогостоящих простоев путем автономной калибровки оборудования. Он будет тестировать различные действия в моделируемой среде и будет вознагражден или оштрафован в зависимости от того, насколько быстро и точно он выполняет калибровку.
Говоря, что мозг ИИ, на чем важно сосредоточиться с самого начала, может замкнуть много бесплодных и трудоемких исследований, поскольку он пытается в симуляции изучить, что работает, а что нет, сказал Хаммонд.
«Причина, по которой машинное обучение оказывается критически важным, заключается в том, что если вы просто наивно используете обучение с подкреплением и не предоставляете ему никакой информации о том, как решить проблему, оно собирается исследовать случайным образом и, возможно, не всегда — удастся найти решение. это работает, «сказал Хаммонд. «Это делает проблемы действительно решаемыми, тогда как без машинного обучения они не решаются».