Россия
Россия
Задачи бинарной классификации изображений широко применяются в инженерных и производственных системах, включая автоматизированный контроль, техническое зрение и мониторинг объектов. При усложнении условий съемки и увеличении объемов данных возникает необходимость сравнения классических алгоритмов компьютерного зрения и нейросетевых методов глубокого обучения с целью выбора оптимального. Цель: провести практическое сравнение эффективности классического алгоритма обработки изображений и нейросетевой модели YOLO при решении задачи бинарной классификации. Методы: традиционная обработка изображений на основе пороговой фильтрации, морфологических операций и анализа геометрических признаков, а также модель детекции YOLO, обученная на размеченной выборке. Результаты: классический алгоритм показал высокую скорость обработки и достаточную точность при стабильном освещении, однако продемонстрировал значительное падение качества при изменении условий съемки. Модель YOLO обеспечила более высокие показатели точности, устойчивость к фотометрическим и геометрическим вариациям, а также стабильную работу при наличии дополнительных шумов. Практическая значимость: результаты могут быть использованы при проектировании систем компьютерного зрения, выборе оптимального алгоритма под конкретные условия эксплуатации, а также создании гибридных систем, объединяющих преимущества классических и нейросетевых методов. Обсуждение: исследование подтверждает, что классические методы эффективно работают в условиях ограниченных ресурсов, но чувствительны к внешним факторам. Нейросетевые подходы, напротив, обеспечивают высокую обобщающую способность и устойчивость, что делает их предпочтительными при нестабильных условиях съемки. Новизна работы заключается в сравнении методов в идентичных условиях обработки с акцентом на практические показатели, что позволяет объективно оценить область применения каждого подхода.
компьютерное зрение, глубокое обучение, YOLO, бинарная классификация, анализ изображений, обработка изображений, нейросетевые методы
1. Сеничев А. В., Новикова А. И., Васильев П. В. Сравнение глубокого обучения с традиционными методами компьютерного зрения в задачах идентификации дефектов // Молодой исследователь Дона. 2020. № 4 (25). С. 64–67.
2. Полковникова Н. А. Исследование методов и алгоритмов компьютерного зрения на основе сверточных и рекуррентных нейронных сетей // Эксплуатация морского транспорта. 2020. № 3 (96). С. 154–168. DOI: 10.34046/ aumsuomt96/21.
3. Саксонов П. В., Бауман А. А. Обзор методов машинного обучения // Современные тенденции и инновации в науке и производстве: материалы XII Международной научно-практической конференции (Междуреченск, Россия, 26 апреля 2023 г.). Междуреченск: Кузбасский гос. технический ун-т им. Т. Ф. Горбачева, 2023. С. 444-1–444-6.
4. Гонсалес Р. С., Вудс Р. Е. Цифровая обработка изображений = Digital Image Processing. Third Edition / пер. с англ. Л. И. Рубанова и П. А. Чочиа. 3-е изд., испр. и доп. М.: Техносфера, 2012. 1104 с.
5. Сеничев А. В., Новиков С. С. Методы компьютерного зрения и их применение в анализе изображений. М.: ИПРАН РАН, 2020. 142 с.
6. Bradski G., Kaehler A. Learning OpenCV: Computer Vision with the OpenCV Library. Sebastopol (CA): O’Reilly Media, 2008. 575 p.
7. Redmon J., Farhadi A. YOLOv3: An Incremental Improvement // ArXiv. 2018. Vol. 1804.02767. 6 p. DOI: 10.48550/ arXiv.1804.02767.
8. Caballar R. D., Stryker C. What is Computer Vision? URL: http://www.ibm.com/think/topics/computer-vision (дата обращения: 07.11.2025).
9. Patel M. The Complete Guide to Image Preprocessing Techniques in Python. URL: http://readmedium.com/thecomplete-guide-to-image-preprocessing-techniques-in-python-dca30804550c (дата обращения: 07.11.2025).
10. Thresholding (Image Processing) // Wikipedia. Last update 12 November 2025. URL: http://en.wikipedia.org/wiki/ Thresholding_(image_processing) (дата обращения: 16.11.2025).
11. Mathematical Morphology // Wikipedia. Last update 08 November 2025. URL: http://en.wikipedia.org/wiki/Mathematical_ morphology (дата обращения: 16.11.2025).
12. Bradski G. The OpenCV Library // Dr. Dobb’s Journal Software Tools. 2000. Vol. 25, Iss. 11. Pp. 120–125.
13. PyTorch: An Imperative Style, High-Performance Deep Learning Library / A. Paszke, S. Gross, F. Massa [et al.] // Advances in Neural Information Processing Systems 32: Proceeding of the 33rd Conference on Neural Information Processing Systems (NeurIPS 2019), (Vancouver, Canada, 08–14 December 2019). NeurIPS Foundation, 2019. Pp. 8024–8035.
14. Hunter J. D. Matplotlib: A 2D Graphics Environment // Computing in Science and Engineering. 2007. Vol. 9, Iss. 3 Pp. 90–95. DOI:https://doi.org/10.1109/MCSE.2007.55.
15. Turay T., Vladimirova T. Toward Performing Image Classification and Object Detection with Convolutional Neural Networks in Autonomous Driving Systems: A Survey // IEEE Access. 2022. Vol. 10. Pp. 14076–14119. DOI: 10.1109/ ACCESS.2022.3147495.
16. Powers D. M. W. Evaluation: From Precision, Recall and F-measure to ROC, Informedness, Markedness and Correlation // Journal of Machine Learning Technologies. 2011. Vol. 2, Iss.1. Pp. 37–63.
17. Клетте Р. Компьютерное зрение. Теория и алгоритмы = Concise Computer Vision. An Introduction into Theory and Algorithms / пер. с англ. А. А. Слинкина. М.: ДМК Пресс, 2019. 506 с.



