Практическое сравнение методов компьютерного зрения и глубокого обучения в задаче бинарной классификации изображений

Лохвицкий Владимир Александрович; Яковлев Евгений Леонидович; Бушев Илья Владимирович

doi:doi:10.20295/2413-2527-2025-444-89-98

Главная / Журналы / Интеллектуальные технологии на транспорте / Номер 4 / Практическое сравнение методов компьютерного зрения и глубокого обучения в задаче бинарной классификации изображений

Практическое сравнение методов компьютерного зрения и глубокого обучения в задаче бинарной классификации изображений

Отправить рукопись Скачать PDF
Текст

Цитировать

Цитирований:

ПРАКТИЧЕСКОЕ СРАВНЕНИЕ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ И ГЛУБОКОГО ОБУЧЕНИЯ В ЗАДАЧЕ БИНАРНОЙ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ

Журнал: ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ НА ТРАНСПОРТЕ № 4 , 2025

Рубрики: МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И СИСТЕМНЫЙ АНАЛИЗ

Лохвицкий Владимир Александрович ¹

Яковлев Евгений Леонидович ²

Бушев Илья Владимирович ³

Информация об авторах и публикации

Авторы:

1. Военно-космическая академия имени А. Ф. Можайского (Кафедра математического и программного обеспечения специальных космических комплексов, Доцент)
сотрудник

Россия

2. Военно-космическая академия имени А. Ф. Можайского (Кафедра математического и программного обеспечения специальных космических комплексов, Доцент)
сотрудник

Россия

3. Военно-космическая академия имени А. Ф. Можайского
студент

Россия

Тип:

Статья

DOI:

https://doi.org/10.20295/2413-2527-2025-444-89-98

EDN:

https://elibrary.ru/rlqion

Страницы:

с 89 по 98

Статус:

Опубликован

Получено:

20.11.2025

Одобрено:

25.11.2025

Опубликовано:

15.12.2025

Классификаторы:

ВАК 1.2.1 Искусственный интеллект и машинное обучение
ВАК 1.2.2 Математическое моделирование, численные методы и комплексы программ
ВАК 2.3.1 Системный анализ, управление и обработка информации, статистика
УДК 656.073 Управление грузовыми перевозками

Язык материала:

русский

Ключевые слова:

компьютерное зрение, глубокое обучение, YOLO, бинарная классификация, анализ изображений, обработка изображений, нейросетевые методы

Аннотация и ключевые слова

Аннотация:
Задачи бинарной классификации изображений широко применяются в инженерных и производственных системах, включая автоматизированный контроль, техническое зрение и мониторинг объектов. При усложнении условий съемки и увеличении объемов данных возникает необходимость сравнения классических алгоритмов компьютерного зрения и нейросетевых методов глубокого обучения с целью выбора оптимального. Цель: провести практическое сравнение эффективности классического алгоритма обработки изображений и нейросетевой модели YOLO при решении задачи бинарной классификации. Методы: традиционная обработка изображений на основе пороговой фильтрации, морфологических операций и анализа геометрических признаков, а также модель детекции YOLO, обученная на размеченной выборке. Результаты: классический алгоритм показал высокую скорость обработки и достаточную точность при стабильном освещении, однако продемонстрировал значительное падение качества при изменении условий съемки. Модель YOLO обеспечила более высокие показатели точности, устойчивость к фотометрическим и геометрическим вариациям, а также стабильную работу при наличии дополнительных шумов. Практическая значимость: результаты могут быть использованы при проектировании систем компьютерного зрения, выборе оптимального алгоритма под конкретные условия эксплуатации, а также создании гибридных систем, объединяющих преимущества классических и нейросетевых методов. Обсуждение: исследование подтверждает, что классические методы эффективно работают в условиях ограниченных ресурсов, но чувствительны к внешним факторам. Нейросетевые подходы, напротив, обеспечивают высокую обобщающую способность и устойчивость, что делает их предпочтительными при нестабильных условиях съемки. Новизна работы заключается в сравнении методов в идентичных условиях обработки с акцентом на практические показатели, что позволяет объективно оценить область применения каждого подхода.

Ключевые слова:
компьютерное зрение, глубокое обучение, YOLO, бинарная классификация, анализ изображений, обработка изображений, нейросетевые методы

Текст

Текст (PDF): Читать Скачать

Список литературы

1. Сеничев А. В., Новикова А. И., Васильев П. В. Сравнение глубокого обучения с традиционными методами компьютерного зрения в задачах идентификации дефектов // Молодой исследователь Дона. 2020. № 4 (25). С. 64–67. EDN: https://elibrary.ru/TKXORB

2. Полковникова Н. А. Исследование методов и алгоритмов компьютерного зрения на основе сверточных и рекуррентных нейронных сетей // Эксплуатация морского транспорта. 2020. № 3 (96). С. 154–168. DOI:https://doi.org/10.34046/aumsuomt96/21. EDN: https://elibrary.ru/TQLDDM

3. Саксонов П. В., Бауман А. А. Обзор методов машинного обучения // Современные тенденции и инновации в науке и производстве: материалы XII Международной научно-практической конференции (Междуреченск, Россия, 26 апреля 2023 г.). Междуреченск: Кузбасский гос. технический ун-т им. Т. Ф. Горбачева, 2023. С. 444-1–444-6. EDN: https://elibrary.ru/OVBWRJ

4. Гонсалес Р. С., Вудс Р. Е. Цифровая обработка изображений = Digital Image Processing. Third Edition / пер. с англ. Л. И. Рубанова и П. А. Чочиа. 3-е изд., испр. и доп. М.: Техносфера, 2012. 1104 с. EDN: https://elibrary.ru/TIKLUW

5. Сеничев А. В., Новиков С. С. Методы компьютерного зрения и их применение в анализе изображений. М.: ИПРАН РАН, 2020. 142 с.

6. Bradski G., Kaehler A. Learning OpenCV: Computer Vision with the OpenCV Library. Sebastopol (CA): O’Reilly Media, 2008. 575 p.

7. Redmon J., Farhadi A. YOLOv3: An Incremental Improvement // ArXiv. 2018. Vol. 1804.02767. 6 p. DOI:https://doi.org/10.48550/arXiv.1804.02767.

8. Caballar R. D., Stryker C. What is Computer Vision? URL: http://www.ibm.com/think/topics/computer-vision (дата обращения: 07.11.2025).

9. Patel M. The Complete Guide to Image Preprocessing Techniques in Python. URL: http://readmedium.com/the-complete-guide-to-image-preprocessing-techniques-in-python-dca30804550c (дата обращения: 07.11.2025).

10. Thresholding (Image Processing) // Wikipedia. Last update 12 November 2025. URL: http://en.wikipedia.org/wiki/Thresholding_(image_processing) (дата обращения: 16.11.2025).

11. Mathematical Morphology // Wikipedia. Last update 08 November 2025. URL: http://en.wikipedia.org/wiki/Mathematical_morphology (дата обращения: 16.11.2025).

12. Bradski G. The OpenCV Library // Dr. Dobb’s Journal Software Tools. 2000. Vol. 25, Iss. 11. Pp. 120–125. EDN: https://elibrary.ru/EOYXGL

13. PyTorch: An Imperative Style, High-Performance Deep Learning Library / A. Paszke, S. Gross, F. Massa [et al.] // Advances in Neural Information Processing Systems 32: Proceeding of the 33rd Conference on Neural Information Processing Systems (NeurIPS 2019), (Vancouver, Canada, 08–14 December 2019). NeurIPS Foundation, 2019. Pp. 8024–8035.

14. Hunter J. D. Matplotlib: A 2D Graphics Environment // Computing in Science and Engineering. 2007. Vol. 9, Iss. 3. Pp. 90–95. DOI:https://doi.org/10.1109/MCSE.2007.55.

15. Turay T., Vladimirova T. Toward Performing Image Classification and Object Detection with Convolutional Neural Networks in Autonomous Driving Systems: A Survey // IEEE Access. 2022. Vol. 10. Pp. 14076–14119. DOI:https://doi.org/10.1109/ACCESS.2022.3147495. EDN: https://elibrary.ru/NWOBGS

16. Powers D. M. W. Evaluation: From Precision, Recall and F-measure to ROC, Informedness, Markedness and Correlation // Journal of Machine Learning Technologies. 2011. Vol. 2, Iss.1. Pp. 37–63.

17. Клетте Р. Компьютерное зрение. Теория и алгоритмы = Concise Computer Vision. An Introduction into Theory and Algorithms / пер. с англ. А. А. Слинкина. М.: ДМК Пресс, 2019. 506 с.

Отправить рукопись Скачать PDF
Текст JATS XML

Цитировать

Цитирований:

Подтверждение

Регистрация