Илон Маск просто опередил свое время
Илон Маск не ошибся в автоматизации сборочной линии Model 3 — он просто опередил свое время.
В 2017 году, когда Тесла Аналитики с осторожностью заявили, что объявили о невероятно амбициозных производственных планах Model 3 в 5000 экземпляров Model 3 в неделю и о начале «адского производства». Но Илон Маск настаивал на том, что он может осуществить это, ссылаясь на гиперавтоматику — роботизированную сборочную линию — в качестве своего секретного оружия для увеличения скорости производства и снижения затрат. Перенесемся через полтора года и Тесла доставит91 000 автомобилей в четвертом квартале 2018 года. Но нарастание не обошлось без серьезных проблем и отхода от первоначального видения Маск о высокоавтоматизированной сборочной линии.
Что случилось?
На вопрос, почему стремление к автоматизации не увенчалось успехом, Илон Ответ был связан с одной важной проблемой : роботизированным зрением или программным обеспечением, которое контролирует то, что роботы конвейера могут «увидеть», а затем сделать на основе этого компьютерного зрения. К сожалению, роботы сборочной линии просто не могли справиться с неожиданной ориентацией таких объектов, как гайки и болты, или сложным маневрированием между рамой автомобиля. Каждая такая проблема приведет к остановке конвейера. В конце концов, было гораздо проще заменить людей роботами во многих ситуациях сборки.
Сегодня компьютерное зрение (общий термин для роботизированного зрения) повсеместно и представляет собой следующий рубеж технологий искусственного интеллекта и инновационных приложений в различных отраслях промышленности. Исследователи и компании, работающие в этой области, достигли впечатляющих успехов и представляют собой недостающие элементы, необходимые для того, чтобы воплотить в жизнь идею Илона Маска об автоматизированной линии сборки автомобилей. По своей сути, эти достижения дадут компьютерам и роботам возможность надежно справляться с огромным количеством неожиданных угловых случаев — тех заблудших болтов — которые происходят в реальном мире.
Переломный момент в компьютерном зрении
Компьютерное зрение пережило переломный момент в 2012 году с применением сверточных нейронных сетей. С тех пор он действительно набрал обороты. До 2012 года компьютерное зрение в основном было связано с созданными вручную решениями — в основном алгоритмы определяли наборы правил вручную и могли относительно эффективно математически описывать свойства изображения. Они были отобраны вручную и затем объединены исследователем компьютерного зрения, чтобы идентифицировать конкретный объект на изображении, например, велосипед, витрину или лицо.
Рост машинного обучения и достижений в области искусственных нейронных сетей изменил все это, позволив нам разрабатывать алгоритмы с использованием огромного количества обучающих данных, которые могут автоматически расшифровывать и изучать особенности изображения. Общий эффект этого был двояким: (1) решения стали намного более устойчивыми (например, лицо все еще можно было идентифицировать как лицо, даже если оно было ориентировано немного по-другому, или в тени), и (2) создание хороших решений стал полагаться на большие объемы высококачественных данных обучения (модели изучают особенности на основе данных обучения, поэтому очень важно, чтобы данные обучения были точными, достаточными по количеству и представляли полное разнообразие ситуаций, которые алгоритм может увидеть позже).
Сейчас в лаборатории: GAN, неконтролируемое обучение и синтетические данные
Далее, новые подходы, такие как GAN (Generative Adversarial Networks), неконтролируемое обучение и синтетическая наземная истина, дают возможность существенно сократить как объем обучающих данных, необходимых для разработки высококачественных моделей компьютерного зрения, так и время и усилия, необходимые для сбора данные. С помощью этих подходов сети могут на самом деле начать собственное обучение и гораздо быстрее выявлять угловые случаи и выбросы с более высокой точностью. Затем люди могут оценивать угловые случаи, чтобы находить решения и гораздо быстрее получать высококачественную модель.
Эти новые подходы быстро расширяют сферу компьютерного зрения с точки зрения приложений, надежности и надежности. Они не только обещают решить производственные задачи г-на Маск, но и значительно расширяют границы в бесчисленных критических приложениях, некоторые из которых выделены ниже:
-
Автоматизация производства: роботы будут все чаще иметь возможность работать с объектами в произвольной ориентации, например, с автомобильным сиденьем, расположенным на 20 градусов от центра, или винтом, который находится на дюйм слишком далеко влево. Более того, роботы смогут надежно идентифицировать мягкие, гибкие, прозрачные объекты (например, пластиковый пакет с носками, который вы заказали на Amazon на прошлой неделе). Новые поставщики робототехники, такие как Berkshire Grey, находятся на переднем крае этого.
-
Обнаружение лица: ранее, распознавание лица не было надежным в угловых случаях, таких как боковые углы, частичное затенение или окклюзия или лица детей. Теперь исследователи обнаруживают, что компьютерное зрение может идентифицировать редкие генетические нарушения по фотографии лица с точностью до 90 процентов. Некоторые приложения передаются в руки потребителей, что возможно только потому, что алгоритмы становятся все более устойчивыми к различным условиям освещения и другим ситуациям, возникающим в результате уменьшения контроля над захватом изображения.
-
Медицинская визуализация: прогресс теперь позволяет автоматизировать оценку МРТ, обнаружение рака кожи и ряд других важных случаев использования .
-
Помощь водителю и автоматизация. Самостоятельные вождения системы выходили из строя, когда было туманно, потому что они не могли различить густой туман и камень. Теперь неконтролируемое обучение и способность создавать синтетические данные (во главе с Nvidia ) начинают использоваться для обучения системы в критических случаях, которые даже миллиарды зарегистрированных пробега не могут раскрыть.
-
Сельское хозяйство: такие компании, как Blue River Technology(приобретенная John Deere), теперь могут надежно дифференцировать сорняки и сельскохозяйственные культуры и автоматически избирательно распылять гербицид, что позволяет значительно сократить количество токсичных химических веществ, используемых в коммерческом сельском хозяйстве.
-
Информация о недвижимости и собственности: Использование компьютерного зрения поверх геопространственных изображений может позволить компаниям автоматически определять, когда наводнения, лесные пожары или ураганные ветры могут представлять опасность для конкретных объектов, позволяя домовладельцам быстрее действовать, прежде чем произойдет катастрофа.
Глядя на эти достижения, быстро становится ясно одно: Илон Маск не ошибся. Просто его видение (роботизированное и прочее) было на год или два от реальности. ИИ, компьютерное зрение и робототехника — все это приближается к переломному моменту в точности, надежности и эффективности. Для Tesla это означает, что на следующем этапе перехода к «производственному аду» (вероятно, для модели Y) на заводах в Фремонте и Шанхае появится совершенно другая сборочная линия, которая будет более успешно внедрять робототехнику в сочетании с компьютерным зрением.