ПРАКТИЧЕСКОЕ СРАВНЕНИЕ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ И ГЛУБОКОГО ОБУЧЕНИЯ В ЗАДАЧЕ БИНАРНОЙ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ
Аннотация и ключевые слова
Аннотация (русский):
Задачи бинарной классификации изображений широко применяются в инженерных и производственных системах, включая автоматизированный контроль, техническое зрение и мониторинг объектов. При усложнении условий съемки и увеличении объемов данных возникает необходимость сравнения классических алгоритмов компьютерного зрения и нейросетевых методов глубокого обучения с целью выбора оптимального. Цель: провести практическое сравнение эффективности классического алгоритма обработки изображений и нейросетевой модели YOLO при решении задачи бинарной классификации. Методы: традиционная обработка изображений на основе пороговой фильтрации, морфологических операций и анализа геометрических признаков, а также модель детекции YOLO, обученная на размеченной выборке. Результаты: классический алгоритм показал высокую скорость обработки и достаточную точность при стабильном освещении, однако продемонстрировал значительное падение качества при изменении условий съемки. Модель YOLO обеспечила более высокие показатели точности, устойчивость к фотометрическим и геометрическим вариациям, а также стабильную работу при наличии дополнительных шумов. Практическая значимость: результаты могут быть использованы при проектировании систем компьютерного зрения, выборе оптимального алгоритма под конкретные условия эксплуатации, а также создании гибридных систем, объединяющих преимущества классических и нейросетевых методов. Обсуждение: исследование подтверждает, что классические методы эффективно работают в условиях ограниченных ресурсов, но чувствительны к внешним факторам. Нейросетевые подходы, напротив, обеспечивают высокую обобщающую способность и устойчивость, что делает их предпочтительными при нестабильных условиях съемки. Новизна работы заключается в сравнении методов в идентичных условиях обработки с акцентом на практические показатели, что позволяет объективно оценить область применения каждого подхода.

Ключевые слова:
компьютерное зрение, глубокое обучение, YOLO, бинарная классификация, анализ изображений, обработка изображений, нейросетевые методы
Список литературы

1. Сеничев А. В., Новикова А. И., Васильев П. В. Сравнение глубокого обучения с традиционными методами компьютерного зрения в задачах идентификации дефектов // Молодой исследователь Дона. 2020. № 4 (25). С. 64–67.

2. Полковникова Н. А. Исследование методов и алгоритмов компьютерного зрения на основе сверточных и рекуррентных нейронных сетей // Эксплуатация морского транспорта. 2020. № 3 (96). С. 154–168. DOI: 10.34046/ aumsuomt96/21.

3. Саксонов П. В., Бауман А. А. Обзор методов машинного обучения // Современные тенденции и инновации в науке и производстве: материалы XII Международной научно-практической конференции (Междуреченск, Россия, 26 апреля 2023 г.). Междуреченск: Кузбасский гос. технический ун-т им. Т. Ф. Горбачева, 2023. С. 444-1–444-6.

4. Гонсалес Р. С., Вудс Р. Е. Цифровая обработка изображений = Digital Image Processing. Third Edition / пер. с англ. Л. И. Рубанова и П. А. Чочиа. 3-е изд., испр. и доп. М.: Техносфера, 2012. 1104 с.

5. Сеничев А. В., Новиков С. С. Методы компьютерного зрения и их применение в анализе изображений. М.: ИПРАН РАН, 2020. 142 с.

6. Bradski G., Kaehler A. Learning OpenCV: Computer Vision with the OpenCV Library. Sebastopol (CA): O’Reilly Media, 2008. 575 p.

7. Redmon J., Farhadi A. YOLOv3: An Incremental Improvement // ArXiv. 2018. Vol. 1804.02767. 6 p. DOI: 10.48550/ arXiv.1804.02767.

8. Caballar R. D., Stryker C. What is Computer Vision? URL: http://www.ibm.com/think/topics/computer-vision (дата обращения: 07.11.2025).

9. Patel M. The Complete Guide to Image Preprocessing Techniques in Python. URL: http://readmedium.com/thecomplete-guide-to-image-preprocessing-techniques-in-python-dca30804550c (дата обращения: 07.11.2025).

10. Thresholding (Image Processing) // Wikipedia. Last update 12 November 2025. URL: http://en.wikipedia.org/wiki/ Thresholding_(image_processing) (дата обращения: 16.11.2025).

11. Mathematical Morphology // Wikipedia. Last update 08 November 2025. URL: http://en.wikipedia.org/wiki/Mathematical_ morphology (дата обращения: 16.11.2025).

12. Bradski G. The OpenCV Library // Dr. Dobb’s Journal Software Tools. 2000. Vol. 25, Iss. 11. Pp. 120–125.

13. PyTorch: An Imperative Style, High-Performance Deep Learning Library / A. Paszke, S. Gross, F. Massa [et al.] // Advances in Neural Information Processing Systems 32: Proceeding of the 33rd Conference on Neural Information Processing Systems (NeurIPS 2019), (Vancouver, Canada, 08–14 December 2019). NeurIPS Foundation, 2019. Pp. 8024–8035.

14. Hunter J. D. Matplotlib: A 2D Graphics Environment // Computing in Science and Engineering. 2007. Vol. 9, Iss. 3 Pp. 90–95. DOI:https://doi.org/10.1109/MCSE.2007.55.

15. Turay T., Vladimirova T. Toward Performing Image Classification and Object Detection with Convolutional Neural Networks in Autonomous Driving Systems: A Survey // IEEE Access. 2022. Vol. 10. Pp. 14076–14119. DOI: 10.1109/ ACCESS.2022.3147495.

16. Powers D. M. W. Evaluation: From Precision, Recall and F-measure to ROC, Informedness, Markedness and Correlation // Journal of Machine Learning Technologies. 2011. Vol. 2, Iss.1. Pp. 37–63.

17. Клетте Р. Компьютерное зрение. Теория и алгоритмы = Concise Computer Vision. An Introduction into Theory and Algorithms / пер. с англ. А. А. Слинкина. М.: ДМК Пресс, 2019. 506 с.

Войти или Создать
* Забыли пароль?