Отправная Точка
«Действенные данные» идут вместе с мощным и надежным дроном, который, вероятно, является самым важным фактором развития индустрии беспилотных летательных аппаратов. Дроны часто генерируют большие объемы данных - иногда даже больше, чем мы можем контролировать. Беспилотные летательные аппараты повышают ценность для пользователя только при наличии способов быстрой обработки данных без дополнительных усилий в этом процессе. Чем быстрее, точнее и проще будут проанализированы изображения, тем лучше.
Сочетание дронов и искусственного интеллекта - кажется лучшим решением вышеупомянутых проблем. В настоящее время почти каждая компания, которая занимается обработкой данных, аналитикой или «автономным» управлением полета заявляет об использовании искусственного интеллекта, машинного или глубинного обучения. Но что на самом деле означают эти термины? Как они связаны друг с другом и где эти «термины» применяются? Следующий текст призван ответить именно на эти вопросы.
В целом, ИИ описывает способность машин, умеющих выполнять сложные задачи, которая имеет характеристики человеческого интеллекта, и включает такие вещи, как рассуждение, решение проблем, планирование, изучение, понимание и чтение человеческих языков, как показано на нижеследующем графике. В настоящее время использование ИИ в отношении Машинного Обучения, Глубинного Обучения и Программирования Перемещений являются наиболее актуальными темами и именно на них будет сделан акцент в этой публикации.
Терминология и Описание
Машинное Восприятие
Давайте начнем с Машинного Восприятия. Поскольку многие связанные с ИИ задачи для дронов также связаны и с распознаванием изображений, беспилотный летательный аппарат должен каким-то образом воспринимать и захватывать окружающую среду и объекты. Обычно это делается с помощью датчиков, например электрооптических, стереооптических и LiDAR. Этот процесс называется Машинным Восприятием.
Методы Машинного Обучения могут применяться для оптимизации дифференцируемых параметров. В отличие от программного обеспечения, которое было запрограммировано вручную и выполняет задачи по специальным инструкциям (как, например, программа Машинного Зрения), алгоритмы Машинного Обучения разработаны таким образом, чтобы они могли со временем обучаться и совершенствоваться под воздействием новых данных.
Глубинное Обучение, в свою очередь, является специализированным методом обработки информации и подметодом Машинного Обучения, который использует нейронные сети и большое количество данных для принятия решений. Методы обучения основаны на функционировании человеческого мозга, который также состоит из взаимосвязанных нейронов. Так называемые Искусственные Нейронные Сети состоят из нескольких слоев, каждый из которых связан со следующим уровнем и отвечает за определенную задачу. Такая конструкция позволяет комбинировать и расширять новым содержанием то, что уже было усвоено.
Хотя многие компании перешли от Машинного Зрения к общепринятым подходам Машинного Обучения, похоже, что первые шаги в индустрии беспилотных летательных аппаратов предпринимаются с помощью алгоритмов Глубинного Обучения. Последние разработки в области технологий, а именно GPU (графических процессоров), позволили использовать ГО, в связи с соотношением его цены и производительности, а также необходимой аппаратной инфраструктуры. Хотя графические процессоры и обеспечивают более высокую вычислительную мощность, тем не менее, для обучения алгоритмам ГО требуются разумные сроки, а также, в основном, необходимы миллионы изображений для надежного выполнения определенной задачи с помощью ГО. Таким образом, если у вас есть доступ к большой подборке данных с изображениями и достаточная вычислительная мощность, методы ГО могут быть предпочтительным выбором, так как оно обычно превосходит традиционные методы МО и МЗ, особенно при распознавании изображений.
Теперь давайте перейдем к Программированию Перемещений. Оно является сильным инструментом, когда речь заходит о ситуационной информированности и, в более широком смысле, о технологии Sense & Avoid и полетах BVLOS. Необходимым условием для Программирования Перемещений обычно является захват окружающей среды, то есть - Машинное Восприятие. Для этого дрон визуализирует окружающую среду, например, с помощью технологии SLAM (Метод одновременной локализации и построения карты). Это дает дрону возможность определять не обязательно именно то, что находится в окружающей среде, но само расстояние до неё. В контексте Программирования Перемещений Глубинное Обучение используется для обнаружения и распознавания таких объектов, как люди, байкеры или автомобили, и для последующего создания соответствующего маршрута полета.
«Технология дронов может раскрыть весь свой потенциал только тогда, когда сбор и анализ данных достигают высочайшего уровня автоматизации».
Определенно не сегодня. Эффективные решения для обработки изображений существуют, и работают они так же хорошо, как и МО и ГО подходы для определенных задач. Следует задаться вопросом: какой мне нужен результат и какая информация/данные мне доступны? Всегда учитывайте, что любой МО-подход требует огромных наборов данных и интенсивную подготовку. Поэтому, если у вас есть только ограниченное количество изображений, возможно, наилучшим решением было бы использовать программное обеспечение обработки изображений. В случае, когда вам доступны огромные наборы данных и необходимо выполнить множество различных задач, подходы МО или ГО, вероятно, превосходят средства, которые использует программное обеспечение. Другими словами, чем больше задач и чем большую сложность они представляют для программного обеспечения обработки изображений, тем больше вероятность того, что подходы МО/ГО являются лучшим способом их решения, поскольку размер данных в этом случае увеличивается.
Большая часть применений алгоритмов МО и ГО в настоящее время наблюдается в области проверки и технического обслуживания. Такие компании, как Sky-Futures и Scopito, используют различные подходы МО и/или ГО для различных задач проверки. Так, например, автоматически распознаются на изображениях и проверяются на наличие аномалий изоляторы линий электропередач, или используются алгоритмы для обнаружения коррозии на металлических поверхностях. По данным Sky-Futures, их показатели выявления составляют 80-90%. Другим примером является Ardenna, американская софтверная компания, которая в настоящее время обновляет программное обеспечение с Computer Vision Software до основанной на МО рельсовой инспекции железнодорожной компании BNSF, для обнаружения сразу более 30 повреждений на железнодорожных путях. Многие методы ИИ уже используются для анализа данных в энергетике, сельском хозяйстве, недвижимости, строительстве и лесохозяйственном секторе. Список применений основанного на ИИ анализа данных, кажется бесконечным, и только что упомянутые примеры составляют лишь незначительную часть того, что уже доступно на рынке.
Как уже описано выше, цель сочетания дронов и искусственного интеллекта состоит в том, чтобы сделать эффективное использование больших наборов данных (например, аэрофотоснимков) как можно более автоматизированными и беспроблемными. Никто не хочет смотреть на 5000 белоснежных снимков ветряных турбин в поиске крошечных трещин. Дроны могут раскрыть весь свой потенциал только тогда, когда сбор и анализ данных достигают высочайшего (или в будущем - абсолютного) уровня автоматизации. Судя по всему, большим потенциалом для обработки таких массивных данных настолько автоматизировано, насколько это возможно, обладают подходы МО и ГО. В последние годы использование сложных алгоритмов искусственного интеллекта стало возможным для дронов по причине огромного и быстрого роста вычислительной мощности, а также затрат на хранение и доступность цифровых данных, а первые и надежные решения этих проблем уже имеются на рынке. Если ИИ будет развиваться так же быстро, как мы это видели в последние годы, вскоре мы найдем высокоавтоматизированные и комплексные решения, которые еще больше увеличат добавленную стоимость использования дронов. Но компании должны учитывать тот факт, что сочетание дронов и искусственного интеллекта имеет смысл только в том случае, если это экономит деньги и время пользователя - в некоторых случаях традиционное Машинное Зрение (в сочетании с МО/ГО) всё ещё может быть более простым и лучшим решением.