СПОСОБ ОПРЕДЕЛЕНИЯ ВРЕМЕНИ СОЗРЕВАНИЯ ОДНОГО ИЛИ НЕСКОЛЬКИХ ПЛОДОВ Российский патент 2020 года по МПК G01N21/27 B07C5/342 

Описание патента на изобретение RU2730110C1

Область техники

Заявляемое изобретение относится к области неразрушающих физических методик определения потребительских характеристик пищевой продукции (например, состав, качество, зрелость и проч.), в основе которых лежит оптическая спектроскопия. Изобретение может быть использовано для контроля зрелости, свежести и качества фруктов на овощных складах, плодоовощных базах и прилавках продуктовых магазинов.

Уровень техники

Из публикации WO 2006135267 A2 известен способ определения качества фрукта и степени его зрелости по спектру люминесценции. При помощи светодиода, лазера или ксеноновой лампы со специально подобранным фильтром происходит возбуждение люминесценции внутри продукта (в частности, яблока), после чего при помощи спектрометра регистрируется ее спектр. Зрелость устанавливается путем сравнения измеренного спектра люминесценции с эталонным значением для данного фрукта.

Недостатком данного метода является высокая чувствительность процессов люминесценции к условиям окружающей среды (температуре, РН и др.). Более того, за счет сильного поглощения светового излучения внутри фрукта детектирующее устройство способно зарегистрировать только сигнал с приповерхностных слоев фрукта, что не позволит сделать объективный вывод о степени его созревания.

Из публикации JP 5626982 B2 известен также метод определения качества фруктов при помощи оптической спектроскопии ближнего инфракрасного (ИК)-диапазона (650-800 нм). Сущность метода сводится к измерению спектра поглощения фрукта (или овоща), дифференцировании спектра до второй производной, после чего подбирают окно с наиболее ярко проявляющейся спектральной особенностью - провалом на длине волны 670-680 нм, глубина которого зависит от степени зрелости фрукта. Глубина спектрального провала сопоставляется с уровнем хлорофилла, присущего данному фрукту. Последний измеряется специальным устройством. На основании этих данных (спектра и уровня хлорофилла) формируется калибровочная модель, которая впоследствии используется для определения зрелости других аналогичных фруктов.

К недостаткам данного способа можно отнести достаточно дискретную шкалу зрелости фрукта, состоящую всего из трех уровней (недозрелый, зрелый, перезрелый), а также использование только нескольких длин волн, что опять же не позволяет всеобъемлюще оценить спелость фрукта в целом.

Известен также способ определения уровня сахара внутри фрукта и степени его твердости (JP 2006226775 A), по которым можно косвенно определить уровень зрелости. Данный метод основан на измерении поглощения фруктом светового излучения на четырех длинах волн с последующим соотнесением полученных значений с калибровочной моделью. Калибровочная модель формируется, исходя из измеренных экспериментально коэффициентов поглощения на длинах волн 720, 740, 770 и 810 нм, показаний измерителя твердости мякоти плода, а также гиперспектральных изображений разрезанного плода. Калибровочная модель, построенная методом частных наименьших квадратов (Partial Least Squares, PLS-regression [1]), используется для определения твердости и уровня сахара других фруктов.

Однако, использование гиперспектральных камер для получения изображений с требуемым для дифференциации фруктов качеством и разрешением существенно повышает стоимость устройства, реализующего данную технологию, кроме того, вышеуказанный метод подразумевает анализ не всего спектра, а только выделенных длин волн в ИК-диапазоне, поэтому часть информации, например, о качестве фрукта, теряется.

Известен метод определения зрелости фруктов, и, в частности, китайских груш сорта Huanghua (публикация CN 107247033 А). Он основан на оптической спектроскопии УФ, видимого и ИК диапазонов (190-2150 нм), использовании алгоритма исключения Гаусса и одного из методов многомерного анализа - метода частных наименьших квадратов для дискриминантного анализа (Partial Least Squares Discriminant Analysis, PLS-DA [2]). Сущность метода сводится к измерению спектров диффузного отражения фрукта, их предобработки, применения алгоритма исключения Гаусса для редуцирования числа длин волн в спектре с целью избавления от шумов и повышения точности. Данная процедура проводится для фруктов с разной степенью зрелости, после чего очищенные спектры вместе со временем сбора фруктов группируют в калибровочную модель при помощи метода PLSDA. Сформированная модель используется для определения зрелости новых фруктов.

Одним из недостатков указанного метода является "качественность" шкалы степени зрелости - зрелость фрукта определяется с точностью до одной недели. Этого достаточно, чтобы определить уровень зрелости фрукта (недозрелый, зрелый, перезрелый), однако по такой шкале невозможно сделать прогноз о том, когда точно созреет фрукт и сколько времени он будет сохранять оптимальные вкусовые качества. Редуцирование числа длин волн, подверженных анализу, или, другими словами, их исключение в силу малого статистического веса, может привести к потере информации о каких-либо индивидуальных особенностях исследуемого фрукта (дефектах, вмятинах, грибке и проч.), которые обычно проявляются в спектре гораздо слабее. Наконец, для регистрации столь широкого спектрального диапазона понадобится несколько спектральных приборов, что значительно увеличит как финансовые, так и трудозатраты при реализации указанной технологии.

Наиболее близким по технической сущности к заявляемому изобретению является способ оценки степени зрелости фрукта при помощи оптической спектроскопии и колориметрии, раскрытый в публикации CN 102818777 В. Система определения зрелости в данном методе является двухступенчатой: на первом этапе происходит формирование калибровочной модели по определению качества фруктов на основании оптических спектров их диффузного отражения, а также физических характеристик плода, измеренных традиционными методами (при помощи специальных устройств). Используется спектральный диапазон от 380 до 1700 нм.

Особенностью данного метода, отличающей его от заявляемого, является сбор отраженного излучения не с какой-то области фрукта, а с точки (перетяжки) на поверхности. Для фокусировки излучения в точку используется дополнительная собирающая линза, расположенная непосредственно за источником. Формирование калибровочной модели происходит при помощи одного из алгоритмов машинного обучения. Для этой цели авторы предлагают использовать метод опорных векторов (Support Vector Machine, SVM [3]). Второй этап определения зрелости, присущий данному методу и отличающий его от заявляемого, состоит в необходимости проведения колориметрических измерений, дополняющих калибровочную модель определения качества до калибровочной модели по определению зрелости фрукта. В результате может быть определена степень зрелости каждого анализируемого фрукта по дискретной и достаточно качественной шкале - "недозрелый", "пригодный для сбора", "пригодный для употребления" и т.д.

К недостаткам данного метода можно отнести, во-первых, невозможность одновременного анализа группы фруктов, обусловленную измерением спектра фрукта с точки на его поверхности (так называемые точечные измерения). Более того, для получения требуемого результата (определения степени зрелости фрукта) необходимо точечные измерения проводить в совокупности с колориметрическими, что существенно увеличивает усложняет реализацию способа. Наконец, качественная дискретная шкала зрелости не позволяет точно определить время созревания фрукта и сделать прогноз относительно времени сохранения им оптимальных для потребителя вкусовых качеств.

Раскрытие изобретения

Техническая проблема, на решение которой направлено заявляемое изобретение, заключается в необходимости преодоления недостатков, присущих аналогам и прототипу заявляемого технического решения за счет создания технологически простого неразрушающего способа определения степени зрелости фрукта и времени его созревания. Заявляемый способ может быть также использован для оценки интервала времени, в течение которого фрукт будет обладать оптимальными для потребителя вкусовыми качествами.

Технический результат, достигаемый при использовании заявляемого изобретения, заключается в обеспечении повышения точности и скорости определения времени созревания плода при упрощении технологии по сравнению с прототипом. Кроме того, заявляемый способ позволит проводить измерения для нескольких, имеющих примерно одну степень зрелости, плодов одновременно, что также сократит временные затраты и стоимость измерений.

Достижение технического результата стало возможным за счет комбинирования методов оптической спектроскопии, видимого и ближнего ИК-диапазона с методами многомерного анализа статистических данных и машинного обучения.

Заявленный технический результат достигается тем, что способ определения времени созревания по меньшей мере, одного плода, включает:

- измерение оптического спектра плода с формированием массива спектральных данных плода, для чего плод облучают в спектральном диапазоне от 440 до 1000 нм, используя в качестве источника белый светодиод, расположенный на расстоянии 5-10 см от поверхности плода, регистрируют интенсивность диффузно отраженного излучения спектрометром в том же спектральном диапазоне с предварительным сбором пучка отраженного излучения собирающей линзой, расположенной на расстоянии 5-10 см от поверхности плода зеркально относительно источника;

- обработку массива измеренных спектральных данных, включающую предобработку данных, включающую сглаживание измеренных спектральных зависимостей методом экспоненциального скользящего среднего, нормализацию спектров на максимальное значение, а также снижение размерности каждого элемента исходного массива спектральных данных;

- определение времени созревания плода по предварительно сформированной калибровочной матрице, построенной на основе многократных измерений спектральных данных плода и полученной посредством использования алгоритма градиентного бустинга, обеспечивающего выбор наиболее оптимальной функции восстановления времени созревания плода по данному массиву спектральных данных.

Облучение плода проводят один раз в течение одной минуты каждые 30 минут в течение 5-7 дней. Фокусное расстояние собирающей линзы составляет 2 см.

Заявляемое изобретение поясняется следующими чертежами:

на фиг. 1 приведена схема экспериментальной установки, с помощью которой реализуется заявляемая технология;

на фиг. 2 показаны характерные спектры диффузного отражения фруктов (банана (а) и авокадо (б)) в разные моменты времени в процессе созревания. По оси абсцисс указан номер канала спектрометра, который переводится в длину волны с помощью калибровочного файла.

на фиг. 3 показаны спектры фруктов (банана (а) и авокадо (б)) в разные моменты времени в процессе созревания, переведенные в пространство первых двух главных компонент. Черно-белыми точками показаны переведенные спектры из обучающей выборки, звездочками - спектры из экзаменационной (тестовой) выборки;

на фиг. 4 приведен основной результат реализации предлагаемой технологии -визуализация результатов тестирования обученной модели (для банана (а) и авокадо (б)). Черной линией показана валидационная кривая, соответствующая случаю, когда предсказанное и истинное значения совпадают. Точками показаны предсказания обученной модели при анализе экзаменационной выборки.

Позициями на чертежах обозначены:

1. Источник излучения

2. Объект исследования (плод или несколько плодов)

3. Собирающая линза

4. Оптическое волокно

5. Спектрометр

Осуществление изобретения

Принцип реализации заявляемого способа проиллюстрирован на конкретном примере, который, однако, не является единственно возможным, но позволяет наглядно продемонстрировать возможность успешного выполнения поставленной перед изобретением задачи и достижения заявленного технического результата.

В качестве источника излучения 1 используется белый светодиод мощностью 1 Вт, питание на который (5 В) подается от промышленной сети (220 В) через преобразователь напряжения. Исследуемый объект 2 (фрукт) располагают на расстоянии примерно 5-10 см от источника. Источником 1 засвечивают область на поверхности исследуемого объекта. Размер области засветки при этом составляет примерно 1-5 см. Угол падения излучения выбирается произвольно.

Диффузно отраженное от поверхности объекта излучение собирают при помощи короткофокусной собирающей линзы 3 (f=2 см) и фокусируют в многомодовое оптическое волокно 4, соединенное напрямую со спектрометром 5. Расстояние от поверхности фрукта до собирающей линзы примерно равно расстоянию от его поверхности до источника.

Регистрацию оптического спектра осуществляют спектрометром 5, подключенным, например, через USB-интерфейс к компьютеру. Регистрируют излучение с длиной волны в видимом и ближнем ИК-диапазоне (440-1000 нм). В предлагаемой схеме реализации технологии процесс регистрации спектров был автоматизирован в программе LabView, осуществляющей также и запись спектров в текстовый файл (http://www.labview.ru/). Пользователю было доступно изменение таких характеристик, как время экспозиции спектрометра (время накопления сигнала), количество усреднений для одного измерения, время ожидания на нагрев светодиода, а также время между двумя последовательными измерениями.

Использование диффузного отражения с некоторой области на поверхности объекта (то есть не точечное измерение) позволяет в дальнейшем избежать проведение колориметрических измерений. Такое решение позволяет упросить процесс измерений и значительно его ускорить. Более того, регистрация спектров с области, а не точки, позволяет подвергнуть анализу не единичный объект, а группу близко расположенных объектов, что является ключевым преимуществом при анализе больших партий объектов (например, фруктов).

Использование спектроскопии обусловлено возможностью извлечения из спектральных характеристик информации о происходящих в органическом объекте процессов. Известно, что в процессе созревания любого фрукта происходит изменение его физико-химического состава, превращение одних органических соединений в другие, изменение цвета и т.д. Например, для банана характерны следующие изменения характеристик: цвет - меняется с зеленого на желтый, что говорит о формировании в составе банана каротиноидов; по мере созревания банан размягчается, что говорит о разрушении пектинов в его составе; созревающий банан приобретает сладкий вкус, что говорит о распаде крахмала в его составе на глюкозу и впоследствии сахарозу с фруктозой; меняется и запах банана, что говорит об образовании сложных эфиров. Каждый из этих процессов сопровождается уничтожением и появлением новых органических веществ, имеющих свой индивидуальный спектр поглощения. Таким образом, изменение состава фрукта в процессе созревания напрямую влияет на спектр его поглощения, а, следовательно, и на спектр отражения. С точки зрения спектроскопии каждое органическое соединение обладает уникальным спектром поглощения, поэтому при превращении органических соединений друг в друга, происходит существенное изменение спектра, которое и предполагается регистрировать в рамках заявляемой технологии. Зачастую такие изменения по своим значениям являются очень малыми, поэтому их экстракция из спектральных данных представляет собой достаточно трудоемкий с точки зрения вычислительной сложности процесс. Однако используемый в рамках заявляемого изобретения процесс обработки спектральных данных позволяет зарегистрировать даже небольшие изменения в спектре отражения фрукта, на основании чего впоследствии становится возможным определить момент его созревания, а также сделать прогноз о времени сохранения им оптимальных для потребителя вкусовых качеств.

Для осуществления обработки спектральных данных, зарегистрированных и зафиксированных в блоке памяти компьютера, в результате описанных выше измерений выполняют следующие шаги:

1. Предобработка, заключающаяся в сглаживании шумов, нормализации спектра и уменьшении размерности массива данных.

2. Непосредственно обработка данных, заключающаяся в решении задачи регрессии методом градиентного бустинга, в результате чего становится возможным определение момента созревания фрукта и прогнозирование временного интервала сохранения последних оптимальных вкусовых качеств.

Процедура предобработки начинается со сглаживания шумов в спектральных данных методом экспоненциального скользящего среднего [4]. Суть метода сводится к замене в указанном окне сглаживания интенсивности каждой экспериментальной точки спектра на ее взвешенное среднее значение по всем предыдущим точкам. Значение интенсивности в i-й спектральной точке выражается через ее значение в (i-l)-й, значение которой, в свою очередь, выражается через ее (i-2)-e значение и так далее. В результате искомое значение можно записать в виде рекуррентной формулы:

EMAi=αpi+(l-α)*EMAi-1,

где EMAi - рассчитанное (сглаженное) значение интенсивности в i-й точке, pi -измеренное значение интенсивности спектра в i-й точке, α - сглаживающая константа (принимает значения из интервала [0,1] и уменьшается при удалении от i точки).

Таким образом, значение интенсивности в указанной точке спектра задается рекуррентно через ее значения во всех предыдущих точках. Необходимо отметить, что чем дальше от рассматриваемой расположена точка, тем меньшим будет ее вес - наиболее значимыми являются точки, расположенные в непосредственной близости от рассматриваемой, наименее значимыми - точки, максимально удаленные от нее. Использование указанного метода позволяет очистить спектральные данные от шумов и сделать соответствующие им кривые более гладкими.

Следующий этап обработки - нормализация спектра. Процедура нормализации состоит в нахождении максимального значения в спектре (максимальной интенсивности) и делении всего спектра на это максимальное значение. Указанная процедура позволяет перейти от размерных значений интенсивности спектра в интервале, определяемом экспозицией спектрометра, к безразмерным величинам в интервале [0,1].

Следующий этап - понижение размерности массива данных до значений, соизмеримых с количеством исследуемых объектов. Подобную процедуру можно реализовать одним из методов многомерного анализа, например, методом главных компонент (Principal Component Analysis или, сокращенно, РСА [5]).

В дальнейшем описании использованы следующие термины и определения:

Выборка - набор спектральных измерений, проведенных над анализируемым продуктом (плодом);

Объект выборки - отдельное спектральное измерение;

Набор признаков объекта выборки - значения интенсивности на разных длинах волн. Число признаков объекта равно числу длин волн в спектре, то есть числу каналов спектрометра (1024).

Суть метода главных компонент состоит в проецировании исходной выборки признаков, соответствующих данному объекту, на гиперплоскость (существенно меньшей размерности) таким образом, чтобы сохранить наибольшее количество информации. Условие сохранения наибольшего количество информации формально интерпретируется как условие максимизации дисперсии спроецированной выборки и записывается (в матричном виде) как вариационная задача:

где wj - весовые коэффициенты, по смыслу являющиеся оптимальными направлениями, задающими положение в пространстве этой гиперплоскости, X - матрица "объекты-признаки". Эта задача решается традиционными для вариационного исчисления методами (по смыслу состоящими в дифференцировании и поиске экстремума), находятся направляющие вектора гиперплоскости, а затем исходный набор признаков проецируется на нее.

В результате каждая спектральная кривая с размерностью 1024×2 (1024 строки, 2 столбца) переводится в одну точку (размерность 1×2). Набор признаков, соответствующих одному измерению, существенно редуцируется. То есть, если раньше одному измерению соответствовал целый спектр (кривая), характеризуемый 1024 значениями (данной длине волны соответствует данное значение интенсивности), то теперь одному измерению соответствует только одна точка в пространстве главных компонент.

В результате получают набор очищенных от шумов, нормализованных, сжатых до необходимой для отсутствия ошибок размерности признаков, которые используются в качестве входных данных в процессе обработки с целью экстракции целевых характеристик.

Определение времени созревания плода может быть реализовано посредством решения задачи многомерной линейной регрессии, представляющей собой определение поведения независимой переменной по зависимой, доступной для измерения, например, с использованием методов машинного обучения.

Обучение состоит в подборе алгоритма (функции а(х)), позволяющего по признакам (х) построить ответы наиболее близкие к истинным (у). То есть для обучения берется выборка, содержащая признаки и ответы (элементом такой выборки может быть, например, спектр авокадо, который созреет через 3 дня). На основе признаков строятся ответы, которые сравниваются с истинными. Мера сравнения - среднеквадратичная ошибка Q (w, X):

где X - матрица "объекты-признаки", w - веса признаков, у - вектор истинных ответов, l -длина выборки.

Задача регрессии на этапе обучения состоит в подборе алгоритма таким образом, чтобы эта ошибка была минимальной (Q (w, X)→min). Подбор алгоритма - очень трудоемкий процесс, который возможно, но крайне трудно осуществить аналитическим способом. Поэтому используются алгоритмы машинного обучения, в частности, алгоритм градиентного бустинга [6].

Бустинг - процесс последовательного построения композиции алгоритмов таким образом, что каждый следующий алгоритм исправляет ошибки предыдущего. На первом шаге подбирается алгоритм, минимизирующий среднеквадратичную ошибку Q, определяемую формулой, указанной выше. Второй алгоритм должен быть построен таким образом, что его композиция (сумма) с первым опять давала минимально возможное значение среднеквадратичной ошибки Q. По аналогии строятся третий, четвертый и т.д. алгоритмы до тех пор, пока среднеквадратичная ошибка всей композиции алгоритмов не станет меньше наперед заданной. На этапе построения каждого алгоритма задача минимизации решается методом градиентного спуска [7], подбирающего весовую функцию (w), которая осуществляет минимизацию функционала ошибки Q, согласно следующей формуле:

где wt-1 - значение весовой функции на предыдущей итерации, ηt - некоторый численный коэффициент, который принято называть шагом. Функции подбирается до тех пор, пока разница между весовыми функциями в двух соседних итерациях не будет меньше наперед заданной. То есть осуществляют подбор функции, минимизирующей ошибку данного алгоритма, затем подбор функции, минимизирующей ошибку двух алгоритмов и так далее до последнего шага обучения модели - формирования оптимальной композиции алгоритмов.

На этом этапе происходит завершения обучения модели, после чего ее становится возможным использовать для определения целевых характеристик. Обычно также осуществляют проверку работоспособности модели и оценку ее точности на так называемом тестовом наборе - наборе (выборке) признаков, на которых модель не обучалась, но для которого известны истинные ответы. Удобной визуализацией работоспособности модели является зависимость "предсказание-истинное значение" и нанесенная на нее валидационная кривая, являющаяся хорошим маркером в плане визуализации. Обычно она задается уравнением у=х (истинное значение=предсказанному) и показывает случай стопроцентного совпадения предсказанных обученной моделью значений целевой характеристики с истинными. Чем ближе лежат предсказания модели к валидационной прямой, тем точнее результат она выдает. Однако в погоне за максимальной точностью необходимо учитывать, что погрешность, выдаваемая моделью, также должна быть разумной - например, величина среднеквадратичной ошибки не может быть меньше цены деления прибора.

В рамках нашей задачи зависимой переменной является спектр в РСА-пространстве (точка), независимой - время созревания анализируемого фрукта. Все измеренные и переведенные в РСА-пространство спектры дробятся на две выборки - обучающую и тестовую. На обучающей выборке происходит обучение модели, то есть подбор оптимального алгоритма, ставящего спектру диффузного отражения в соответствие время созревания фрукта. На этапе тестирования модель сама определяет время созревания (или связанную с ней характеристику) по имеющимся у нее на входе подготовленным спектральным данным.

Отметим, что иногда бывает удобно определить не непосредственно время созревания фрукта, а, например, время, прошедшее с момента сбора или с момента транспортировки фруктов, или рассчитать время созревания/время жизни, исходя из табличных данных.

После завершения этапа тестирования происходит визуализация его результатов и оценка точности. По валидационной кривой определяется точность работы модели, а также производится оценка погрешности определения времени созревания фрукта. На этом процесс обработки спектральных данных считается завершенным.

Таким образом, получен новый неразрушающий способ оценки времени созревания фрукта, который заключается в измерении оптических спектров диффузного отражения в видимом и ближнем ИК-диапазоне с области поверхности фрукта и последующей их предобработке, заключающейся в сглаживании шумов, нормализации и сжатии размерности пространства признаков методами многомерного статистического анализа (например, РСА), и последующем решении задачи многомерной линейной регрессии методами машинного обучения (в частности, посредством алгоритма градиентного бустинга).

В прикладном плане предлагаемый способ позволяет более эффективно (технически более просто и быстро) оценить время созревания фрукта, а также сделать прогноз о временном интервале, в течение которого фрукт будет сохранять оптимальные для потребителя вкусовые качества.

Пример конкретного выполнения

Реализация заявляемого способа была продемонстрирована на примере анализа находящихся в процессе созревания фруктов - бананов и авокадо. Задача состояла в определении момента времени созревания каждого фрукта. Для проверки устойчивости модели в рамках заявляемого способа и более точного определения выдаваемой ей погрешности измерения проводились для нескольких фруктов. Всего было исследовано 5 бананов и 2 авокадо.

Указанные выше фрукты были выбраны произвольным образом с целью проверки работоспособности заявляемого изобретения, однако указанный набор фруктов не накладывает ограничений на использование. Абсолютно любой фрукт поглощает и рассеивает излучение, что и лежит в основе заявляемого способа. Разница состоит в том, что каждый отдельный фрукт в силу своего молекулярного состава поглощает/рассеивает свет индивидуально - например, зеленое яблоко практически не поглощает зеленый свет, но хорошо поглощает другие цвета, поэтому мы и видим его зеленым, а, мандарин, наоборот, поглощает зеленый цвет, а оранжевый - нет, поэтому для нашего глаза мандарин выглядит оранжевым. Другими словами, каждый отдельный фрукт обладает своими индивидуальными спектральными особенностями, расположенными в разных областях спектра (на разных длинах волн). Поэтому при реализации способа используют не узкополосный источник света (красный светодиод), а источник с широким спектром излучения (440-1100 нм) и соответствующий ему детектирующий прибор, чтобы получить возможность зарегистрировать индивидуальные спектральные особенности совершенно разных видов фруктов. Это позволяет утверждать, что заявляемый способ может быть реализован и для других фруктов.

Условия эксперимента установлены одинаковыми для всех фруктов: измерение спектров проводится один раз в полчаса в течение нескольких дней (5-7) с целью отслеживания динамики созревания фрукта. Время экспозиции спектрометра составляло 3000 мс, число усредняемых спектров при однократном измерении (проводившемся раз в 30 мин) было выбрано равным 5. На нагрев светодиода отводилось 60 сек. Также перед каждым измерением проводилось снятие спектра темнового поля (при выключенном светодиоде), который впоследствии вычитался из основного спектра. Это было необходимо для исключения влияния внешних по отношению к системе паразитных наводок, а также различных засветок, приходящих не от источника излучения (лампа освещения в комнате, светодиоды индикаторов и других приборов).

На фиг. 2 приведены характерные спектры диффузионного отражения разных фруктов (по одному из каждого набора) в различные моменты времени в процессе их созревания. Во-первых, следует отметить тот факт, что спектры разных видов фруктов похожи между собой. Это объясняется тем, что спектральные характеристики любого объекта определяются, в первую очередь, источником излучения. Одинаковый источник излучения (как было и в нашем случае) дает похожие спектры. Однако отличия, вызванные сугубо индивидуальным молекулярным составом, все же имеются - спектральный пик в случае банана (225-250 канал) существенно шире пика характерного для авокадо (210 канал), кроме того, спектр авокадо содержит дополнительный пик на длине волны, соответствующей 500-му каналу спектрометра, в то время как для банана такой спектральный пик отсутствует. Примечательно, что процесс созревания одинаково влияет на модификацию спектральных особенностей разных фруктов - видно, что в обоих случаях с течением времени наблюдается рост соответствующего спектрального пика, который постепенно замедляется и останавливается. Другие области спектра меняются незначительно.

Далее весь набор спектральных данных (для обоих фруктов) был разделен на две выборки - обучающую и экзаменационную (тестовую). В случае банана проводилось 5 серий измерений (измерялось 5 различных бананов) - из них четыре серии отводилось на обучение модели, одна - на тестирование (4:1). Такое разбиение было направлено на получение высокой точности конечного результата (малой ошибки в определении времени созревания). В случае авокадо на обучение было отведено две серии, на тестирование - одна (2:1), причем тестирование проводилось для наименее тщательно измеренного авокадо (для этого авокадо измерения длились 3 дня, для других - 5-7). Идея была в том, чтобы усложнить задачу обучаемой модели и посмотреть эффективность ее работы.

Первоначально все (и обучающие, и тестируемые) данные подвергались предобработке и переводились в пространство первых двух главных компонент. Здесь следует отметить некоторую особенность процедуры предобработки. Процесс обучения модели происходил таким образом, что для каждой отдельной обучающей выборки формировался свой набор главных направлений (РСА-компонент). Затем данные из тестируемой выборки проецировались на каждый такой набор, в результате чего для одного спектра из экзаменационной выборки получались 4 (в случае банана) или 2 (в случае авокадо) значения проекций на главные компоненты. Затем эти проекции (4 или 2 соответственно) усреднялись (среднее арифметическое). Результаты предобработки (РСА-изображение) данных приведены на фиг. 3. Каждая точка соответствует одному переведенному в РСА-пространство спектральному измерению (получаемому с периодом в 30 минут).

Следует обратить внимание, во-первых, на существенные качественные различия между РСА-изображениями разных фруктов. РСА-кривые для бананов напоминают гиперболу, РСА-кривые для авокадо - прямую и кубические параболы. Отметим, что необработанные спектральные зависимости не давали такого существенного качественного различия. Во-вторых, в отличие от спектров, РСА-изображения для обоих фруктов (для авокадо чуть хуже) показывают хорошую разделяемость как данных внутри одной выборки (отдельные точки разного цвета), так и разных выборок (разные кривые, группы точек). То, что данные хорошо разделяются внутри одной выборки, говорит о том, что способ позволяет отличать один и тот же фрукт в процессе созревания с определенной точностью. Отличие самих выборок указывает на возможность способа различать разные фрукты одного и того же вида. Оба эти вывода справедливы как для разных типов выборок (обучающая/тестируемая), так и для обоих фруктов (банан и авокадо).

Следующий (заключительный) шаг - решение задачи регрессии (обучение и валидация). Необходимо найти, сколько времени прошло с момента времени начала измерений - некоторой условной точки, относительно которой удобно как совершать предсказание, так и сравнивать его значение с истинным. Истинным значением принят момент времени измерения конкретного спектра из обучающей или экзаменационной выборки относительно времени начала измерения конкретной серии (фрукта) внутри соответствующей выборки. Это истинное значение времени измерения фиксировали на этапе записи спектра. Таким образом, задача обучения состояла в обучении модели подбору алгоритма, позволяющего правильно сопоставить спектру фрукта момент времени его измерения (относительно начала всех измерений в данной серии). Задача валидации (тестирования) состояла в предсказании данным алгоритмом по спектру времени его измерения и сравнении предсказанного времени с истинным, зафиксированным при снятии спектра.

На Фиг. 4 приведен результат решения валидационной части задачи регресии для двух видов фруктов. Черной линией показана валидационная кривая. Установлено, что для банана практически все точки лежат в непосредственной близости от валидационной кривой. Есть небольшое расхождение в конце измерений, вероятно, связанное с процессом перезревания и порчи фрукта. Для авокадо ситуация выглядит хуже, что, во-первых, может быть связано с меньшим объемом обучающей выборки, а также с меньшим временем анализа тестируемого авокадо по сравнению с другими фруктами. Однако и в таком случае можно считать поставленную задачу успешно решенной. Очевидно, что увеличение объема выборки и более тщательное измерение фрукта существенно повысят точность решения.

Помимо качественного анализа графиков (близость экспериментальных точек к валидационной кривой) проводят также и количественный анализ. Показательной для конечного потребителя характеристикой в данном случае является значение ошибки предсказания моделью момента времени измерения спектра относительно условной точки (начала измерений соответствующей серии). В случае банана значение такого рода ошибки составило всего 2.5 часа. В случае авокадо результат оказался ожидаемо хуже - ошибка определения момента измерения спектра составила практически 12 часов. Оба эти значения говорят о том, что предлагаемая технология в случае набора даже небольшой базы данных в одинаковых условиях позволит определить момент времени анализа объекта (другими словами, его возраст) относительно любой условной точки с хорошей точностью (всего 5 измерений одного фрукта способны дать точность в 2.5 часа).

Вся вышеописанная процедура проведения измерений и обработки экспериментальных данных применима не только для единичного объекта, но и для группы объектов (группы фруктов). Геометрические параметры измерительной схемы подобраны так, что расходящийся пучок от источника излучения способен засветить несколько близко расположенных объектов, а линза - собрать диффузно отраженное излучение. Разница по сравнению с единичным объектом будет только в значении интенсивности спектра, а также в возможном изменении его формы из-за наличия индивидуальных особенностей одного из объектов группы (например, из-за дефекта фрукта или его перезрелости). По такого рода индивидуальным особенностям в спектре и можно будет понять, что один из фруктов отличается от остальных. С точки зрения обработки принцип не меняется - на вход программы будет поступать аналогичный текстовый файл, содержащий несколько иные численные значения, что совершенно не повлияет на процесс ее работы. В качестве результата получаем некоторый усредненный (по числу объектов) момент времени измерения спектра. Точность выдаваемого результата будет определяться объемом измеренной ранее обучающей выборки, она не будет сильно зависеть от количества анализируемых объектов (возможно только в лучшую сторону) и будет известна по измерениям с единичными объектами. Поэтому в случае, если для группы объектов будет получено существенно большее значение ошибки, чем для единичного объекта, это опять же будет говорить о том, что один объект (фрукт) из группы является испорченным. Последовательным исключением объектов при анализе можно будет установить какой именно. Таким образом, если возраст фрукта относительно некоторой условной точки известен, то исходя из известных общедоступных данных о времени созревания данного типа фруктов (которые можно взять как из специальных таблиц, так и из собственных качественных/спектральных наблюдений - по внешнему виду фрукта/его спектру понятно, в какой момент времени он созрел), можно определить (с некоторой точностью) момент времени созревания фрукта и сделать прогноз относительно возможной длительности его сохранения.

Заявляемый способ позволяет значительно упростить технологию определения времени созревания плодов за счет исключения необходимости проведения колориметрических измерений, а также обеспечивает повышение точности определения времени созревания плода вплоть до нескольких часов за счет более тщательной процедуры обработки спектральных данных, состоящей в уменьшения их размерности методом главных компонент и последующего анализа алгоритмом градиентного бустинга.

Литература:

[1] S. Wold et al., PLS-regression: a basic tool of chemometrics, Chemom. Intell. Lab. Syst., 58, 109- 130(2001)

[2] M. Barker et al., Partial least squares for discrimination, J. Chemometrics, 17, 166-73 (2003)

[3] C. Cortes et al., Support-Vector Networks, Machine Learning, 20, 273-297 (1995)

[4] Грешилов А.А., Стакун В.А., Стакун А.А. Математические методы построения прогнозов. - М.: Радио и связь, 1997. - 112 с.

[5] Н. Abdi et al., Principal component analysis, Wiley Interdisciplinary Reviews: Computational Statistics, 2, 433-459 (2010)

[6] J.H. Friedman, Greedy Function Approximation: A Gradient Boosting Machine, IMS 1999 Reitz Lecture (1999)

[7] Arfken, G. "The Method of Steepest Descents", Mathematical Methods for Physicists, Orlando, FL: Academic Press, pp. 428-436, 1985

Похожие патенты RU2730110C1

название год авторы номер документа
СПОСОБ ОБРАБОТКИ ВЕКТОРНЫХ СИГНАЛОВ ДЛЯ РАСПОЗНАВАНИЯ ОБРАЗОВ НА ОСНОВЕ ВЕЙВЛЕТ-АНАЛИЗА 2017
  • Ефиторов Александр Олегович
  • Доленко Сергей Анатольевич
RU2690001C1
СПОСОБ ПРОВЕДЕНИЯ ИСПЫТАНИЯ КАПСУЛИРОВАННЫХ ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ В БЛИСТЕРНОЙ УПАКОВКЕ МЕТОДОМ БИК СПЕКТРОМЕТРИИ 2018
  • Титова Анна Васильевна
  • Родионова Оксана Евгеньевна
  • Балыклова Ксения Сергеевна
  • Акбулатова Элина Амзатхановна
  • Беланов Сергей Юрьевич
  • Демкин Никита Андреевич
  • Полежай Олег Сергеевич
RU2685756C1
СПОСОБ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ 1991
  • Боковиков А.Б.
  • Попов Ю.А.
RU2012430C1
СПОСОБ РАСПОЗНАВАНИЯ ОБРАЗОВ БИОХИМИЧЕСКИХ НАЗЕМНЫХ ОБЪЕКТОВ С ТОНКИМИ СПЕКТРАЛЬНЫМИ РАЗЛИЧИЯМИ НА ОСНОВЕ ГИПЕРСПЕКТРАЛЬНЫХ ДАННЫХ 2018
  • Третьяков Владислав Анатольевич
RU2695963C1
Способ анализа медицинских данных с помощью нейронной сети LogNNet 2021
  • Величко Андрей Александрович
  • Величко Татьяна Васильевна
RU2754723C1
СПОСОБ ПРОВЕДЕНИЯ ИСПЫТАНИЯ ТАБЛЕТИРОВАННЫХ ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ В БЛИСТЕРНОЙ УПАКОВКЕ МЕТОДОМ БИК СПЕКТРОМЕТРИИ 2018
  • Титова Анна Васильевна
  • Родионова Оксана Евгеньевна
  • Балыклова Ксения Сергеевна
  • Акбулатова Элина Амзатхановна
  • Беланов Сергей Юрьевич
  • Демкин Никита Андреевич
  • Полежай Олег Сергеевич
RU2685758C1
ОПТИЧЕСКИЙ СПОСОБ НЕДЕСТРУКТИВНОЙ КОЛИЧЕСТВЕННОЙ ОЦЕНКИ СТЕПЕНИ ЗРЕЛОСТИ ТОМАТОВ 2014
  • Будаговская Ольга Николаевна
  • Будаговский Андрей Валентинович
  • Акишин Дмитрий Васильевич
  • Сутормина Алена Владимировна
  • Гудковский Владимир Александрович
RU2582957C2
НЕРАЗРУШАЮЩИЙ ОПТИЧЕСКИЙ СПОСОБ ОЦЕНКИ ЗРЕЛОСТИ ПЛОДОВ 2010
  • Будаговская Ольга Николаевна
  • Будаговский Андрей Валентинович
  • Гончаров Сергей Александрович
  • Исаев Роман Дмитриевич
  • Ильинский Александр Семенович
  • Кружков Андрей Викторович
  • Шорников Денис Геннадьевич
  • Будаговский Иван Андреевич
RU2453106C2
СПОСОБ СОЗДАНИЯ МНОГОМЕРНЫХ ГРАДУИРОВОЧНЫХ МОДЕЛЕЙ АНАЛИТИЧЕСКОГО ПРИБОРА 2013
  • Жаринов Константин Анатольевич
  • Крашенинников Анатолий Александрович
  • Скутин Илья Владимирович
RU2541906C1
УСТРОЙСТВО ДЛЯ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ 1996
  • Боковиков А.Б.
RU2123176C1

Иллюстрации к изобретению RU 2 730 110 C1

Реферат патента 2020 года СПОСОБ ОПРЕДЕЛЕНИЯ ВРЕМЕНИ СОЗРЕВАНИЯ ОДНОГО ИЛИ НЕСКОЛЬКИХ ПЛОДОВ

Изобретение относится к области определения потребительских характеристик пищевой продукции и касается способа определения времени созревания по меньшей мере одного плода. Способ включает в себя измерение оптического спектра отраженного от плода излучения белого светодиода в диапазоне от 440 до 1000 нм и обработку массива измеренных спектральных данных. Обработка данных включает в себя сглаживание измеренных спектральных зависимостей методом экспоненциального скользящего среднего, нормализацию спектров на максимальное значение, а также снижение размерности каждого элемента исходного массива спектральных данных. Определение времени созревания плода производят по предварительно сформированной калибровочной матрице, построенной на основе многократных измерений спектральных данных плода и полученной посредством использования алгоритма градиентного бустинга. Технический результат заключается в повышении точности и сокращении времени измерения. 2 з.п. ф-лы, 4 ил.

Формула изобретения RU 2 730 110 C1

1. Способ определения времени созревания по меньшей мере одного плода, включающий:

измерение оптического спектра плода с формированием массива спектральных данных плода, для чего плод облучают в спектральном диапазоне от 440 до 1000 нм, используя в качестве источника белый светодиод, расположенный на расстоянии 5-10 см от поверхности плода, регистрируют интенсивность диффузно отраженного излучения спектрометром в том же спектральном диапазоне с предварительным сбором пучка отраженного излучения собирающей линзой, расположенной на расстоянии 5-10 см от поверхности плода зеркально относительно источника;

обработку массива измеренных спектральных данных, включающую предобработку данных, включающую сглаживание измеренных спектральных зависимостей методом экспоненциального скользящего среднего, нормализацию спектров на максимальное значение, а также снижение размерности каждого элемента исходного массива спектральных данных; определение времени созревания плода по предварительно сформированной калибровочной матрице, построенной на основе многократных измерений спектральных данных плода и полученной посредством использования алгоритма градиентного бустинга, обеспечивающего выбор наиболее оптимальной функции восстановления времени созревания плода по данному массиву спектральных данных.

2. Способ по п. 1, отличающийся тем, что облучение плода проводят один раз в течение одной минуты каждые 30 минут в течение 5-7 дней.

3. Способ по п. 1, отличающийся тем, что фокусное расстояние собирающей линзы составляет 2 см.

Документы, цитированные в отчете о поиске Патент 2020 года RU2730110C1

CN 102818777 B, 18.03.2015
CN 107247033 B, 20.09.2019
US 2018011008 A1, 11.01.2018
Способ определения степени спелости плодов и семян 1981
  • Кубышев Владимир Алексеевич
  • Никулин Владимир Ильич
  • Гаршин Владимир Степанович
  • Гаршина Елена Ивановна
  • Попов Юрий Николаевич
  • Климок Александр Иванович
SU1033066A1

RU 2 730 110 C1

Авторы

Новиков Илья Алексеевич

Пойманов Юрий Михайлович

Балашов Игорь Сергеевич

Шарипова Маргарита Ильгизовна

Грунин Андрей Анатольевич

Федянин Андрей Анатольевич

Габдуллин Руслан Айдарович

Даты

2020-08-17Публикация

2019-12-24Подача