Разработка пакета функций на языке Python для обработки гиперспектральных изображений и построения модели для предсказания содержания белка в одиночных зерновках пшеницы
Проект представляет собой пакет функций на языке Python для оценки содержания белка в зернах пшеницы по их гиперспектральным изображениям в ближнем инфракрасном диапазоне. Эта библиотека включает в себя функции предварительной обработки спектров, сегментации объектов и построения мнгомерной регрессионной зависимости между спектрами и референтными значениями содержания белка в зернах по Кьельдалю.
Проект представляет собой пакет функций на языке Python для оценки содержания белка в зернах пшеницы по их гиперспектральным изображениям в ближнем инфракрасном диапазоне. Эта библиотека включает в себя функции предварительной обработки спектров, сегментации объектов и построения мнгомерной регрессионной зависимости между спектрами и референтными значениями содержания белка в зернах по Кьельдалю.
В результате работы был разработан пакет wheat_spectra, который имеет следующий состав:-
сonvert – конвертер между форматами mat и bip
-
smoothing – удаление шума из данных с помощью сглаживания
-
from_3d_to_2d – формирование плоской матрицы
-
image_work – обработка 2d-изображения(выделение кассеты с зерновками, выравнивание края картинки, получение маски объектов)
-
removal_defects_image – устранение дефектов на 2d-изображении
-
spectra_pixels – разметка пикселов зерновок, выделение нужных спектров, усреднение спектров
-
regression – построение регрессионной модели
В ходе проделанной работы был разработан пакет функций wheat_spectra на Python. В настоящее время проводятся эксперименты по построению регрессионной модели с помощью PLS - регрессии. Работоспособность пакета подтверждена справкой о внедрении с предприятия CSort. В рамках данной работы была написана научная статья, принятая к публикации в электронном сборнике материалов II Всероссийской научно-технической конференции «Современные цифровые технологии».
Замена методов аналитической химии предсказанием уровня белка по БИК-спектрам позволяет, во-первых, радикально ускорить анализ, а во-вторых, проводить его для каждой зерновки индивидуально, а не для партии зерна в среднем. Все это открывает возможность строить аппараты для сортировки зерновок по содержанию белка, т.е. управления качеством зерна путем разделения (а не смешивания) партий зерна на высоко- и низкобелковые.