В основе сверточных нейронных сетей (CNN) лежит сверточная операция — мощный метод, позволяющий сохранять пространственную информацию. Эта операция облегчает извлечение пространственных и цветовых моделей, определяющих различные объекты.

В CNN фильтры, также известные как ядра, играют ключевую роль. Фильтры — это небольшие матрицы, которые используются для извлечения особенностей объекта, таких как края, из изображений. Используя разнообразные фильтры, сеть получает возможность идентифицировать сложные формы и объекты.

Фильтры и края:

Фильтры изображений — фундаментальная концепция компьютерного зрения. Эти фильтры представляют собой компактные матрицы, предназначенные для изменения входного изображения определенным образом, например, для выделения краев объекта внутри изображения.

Край изображения представляет собой место, где наблюдается заметное изменение интенсивности. Чтобы обнаружить эти изменения интенсивности внутри изображения, создаются специализированные фильтры изображений. Эти фильтры анализируют кластеры пикселей и реагируют на чередующиеся шаблоны темных и светлых пикселей. На их выходе видны края объектов и отчетливые текстуры.

CNN способны автономно изучать наиболее подходящие фильтры, необходимые для точной классификации изображений.

Фильтры Собела:

Фильтры Собеля — это особый тип фильтров изображений, широко используемый в задачах обработки изображений и компьютерного зрения, особенно для обнаружения краев. Эти фильтры предназначены для выделения краев и градиентов изображения путем выделения областей, интенсивность которых быстро меняется.

Фильтр Собеля состоит из двух отдельных фильтров, часто называемых ядрами Собеля, которые свертываются с изображением для вычисления аппроксимации градиента изображения. Два ядра обычно представляют собой горизонтальное ядро ​​​​Собела и вертикальное ядро ​​​​Собела. Эти ядра представляют собой простые матрицы, содержащие заранее определенные значения.

Горизонтальное и вертикальное ядро ​​Собеля обычно выглядит следующим образом:

Когда эти ядра свернуты с изображением, они подчеркивают области, где происходит быстрое изменение интенсивности в горизонтальном и вертикальном направлениях. Полученные отфильтрованные изображения в результате применения этих ядер часто называют градиентными изображениями. Изображения градиента представляют собой величину изменения интенсивности в каждом пикселе, и комбинация этих величин градиента может использоваться для определения местоположения краев и контуров внутри изображения.

По сути, фильтры Собеля предоставляют мощный и эффективный способ определения краев изображения, фиксируя изменения интенсивности в разных направлениях. Они служат фундаментальным инструментом в конвейерах обработки изображений, выполняя такие задачи, как обнаружение краев, анализ градиента изображения и извлечение признаков.

Частота изображений:

Опираясь на фундаментальные принципы физики, мы понимаем, что частота относится к скорости колебаний при анализе звуковых волн. Эта концепция находит параллель в сфере изображений, где частота означает меру изменения.

В контексте изображений изменения происходят пространственно. Высокочастотное изображение характеризуется выраженными флуктуациями интенсивности. В частности, он обозначает быстрые переходы яркости от одного пикселя к соседнему аналогу. И наоборот, низкочастотное изображение демонстрирует более равномерное распределение яркости или постепенные изменения.

Чтобы проиллюстрировать это различие, рассмотрим следующий пример: