УДК 638.14+51-76
В иерархии социальных насекомых центральное место занимает матка, воспроизводящая всех членов сообщества. При ее отсутствии сообщество быстро погибает, потому что средняя продолжительность жизни «рядовых» насекомых составляет несколько недель, что сравнимо со временем вывода новой плодной матки. В случае пчел потеря матки ведет к гарантированному вымиранию семьи, если это произошло во второй половине лета. Поэтому важно выделить ульи, в которых произошла потеря. Одной из возможностей является анализ звуковых сигналов, издаваемых пчелами. Роль звуков в организации «общения» между пчелами и другими социальными насекомыми была убедительно подтверждена Е.К. Еськовым, А.Ф. Рыбочкиным и другими исследователями. Опытные пчеловоды по звуку способны выделить ульи, в которых могла произойти потеря матки.
Существенно удешевить и облегчить оценку состояния ульев могут компьютерные методы диагностики…
Работа посвящена созданию системы автоматического контроля пчелиного улья на наличие или отсутствие матки. Оценена возможность и эффективность проведения такой классификации по параметрам звуков пчел с использованием современных методов машинного обучения. Звуки пчел описаны признаками на основе усредненной энергии сигнала в мел-спектральных частотных полосах. Для выполнения работы создан оригинальный набор записей звуков в ульях, собранный на пасеке в автоматическом режиме со смартфонов, установленных в ульях. Оценена эффективность использования логистической регрессии, метода опорных векторов, градиентного бустинга, а также разработанного авторами метода статистически взвешенных синдромов. Показано, что методы опорных векторов и логистической регрессии позволяют с точностью более 98% корректно классифицировать текущее состояние улья, определяя отсутствие или наличие матки по параметрам звуков. При этом информативность частотных признаков существенно меняется с частотой. Максимальная эффективность наблюдается для признаков с частотами от 70 до 130 Гц. При дальнейшем увеличении частоты признаков их информативность снижается и выше 900 Гц для рассматриваемой задачи становится довольно низкой. Полученные результаты доказывают правильность использования методов машинного обучения и частотно-энергетических признаков для автоматического определения присутствия или отсутствия матки в улье, а также реальную возможность создания эффективных технических средств автоматического мониторинга состояния улья.
Ключевые слова: звуки пчел, пчелиная матка, методы машинного обучения, пчеловодство, метод опорных векторов, логистическая регрессия.
В.Я. ЧУЧУПАЛ, Н.В. ОКУЛОВ1,
О.В. СЕНЬКО, А.В. КУЗНЕЦОВА2
Вычислительный центр им. А.А. Дородницына ФИЦ «Информатика и управление» РАН, г. Москва;
1ООО «Правильное Пчеловодство», г. Пермь;
2Институт биохимической физики им. Н.М. Эмануэля РАН, г. Москва
ЛИТЕРАТУРА
1. Еськов Е.К., Тобоев В.А. Изменение структуры звуков, генерируемых пчелиными семьями в процессе социотомии // Зоологический журнал. — 2011. — Т. 90. — №2.
2. Дрейзин В.Э., Рыбочкин А.Ф., Захаров И.С. Акустический контроль пчелиных семей с помощью вычислительной техники // Пчеловодство. — 2000. — №4.
3. Рыбочкин А.Ф., Дрейзин В.Э., Захаров И.С. Анализатор звуков пчелиных семей // Пчеловодство. — 2003. — №4.
4. Amlathe P. Standard Machine Learning Techniques in Audio Beehive Monitoring: Classification of Audio Samples with Logistic Regression, K-Nearest Neighbor, Random Forest and Support Vector Machine. All Graduate Theses and Dissertations. — 2018. https://digitalcommons.usu.edu/etd/7050.
5. Cortes C., Vapnik V. Support-Vector Networks // Machine Learning. — 1995. — Vol. 20 (3).
6. Friedman J. Multiple Additive Regression Trees with Application in Epidemiology // Statistics in Medicine. — 2003. — Vol. 22 (9). doi:10.1002/sim.1501. PMID 12704603.
7. Qandour A. Ahmad I., Habibi D., Leppard M. Remote Beehive Monitoring using Acoustic Signals // Acoustics Australia. Australian Acoustical Society. — 2014. — №12. — Vol. 42.
8. Senko O.V., Kuznetsova A.V. A recognition method based on collective decision making using systems of regularities of various types // Pattern Recognition and Image Analysis. — 2010. — Vol. 20.
СВЕДЕНИЯ ОБ АВТОРАХ:
Чучупал Владимир Яковлевич, канд. физ.-мат. наук, вед. науч. сотр, e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.;
Окулов Николай Васильевич, директор, email: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.;
Сенько Олег Валентинович, д-р физ.-мат. наук, вед. науч. сотр., зав. отделом «Математические методы распознавания и анализа информации», e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript., https://orcid.org/0000-0002-5586-3503;
Кузнецова Анна Викторовна, канд. биол. наук, ст. науч. сотр, e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript., https://orcid.org/0000-0002-0297-7013.
DETERMINATION OF THE PRESENCE OF A QUEEN BEE IN A HIVE BY SPECTRAL CHARACTERISTICS OF SOUND BY MACHINE LEARNING METHODS
V.J. Chuchupal, N.V. Okulov, O.V. Senko, A.V. Kouznetsova
The paper presents the creation of an automatic control system of a bee hive for the presence or absence of a queen bee. The option and effectiveness of creation of such a classification using the parameters of the bee sounds was evaluated using modern methods of machine learning. Bee sounds are described by signs based on the averaged signal energy in the mel-spectral frequency bands. To perform the work the proprietary dataset of recordings of sounds in the hives was made, received in automatic mode using smartphones installed in the hives. The efficiency of logistic regression, support vector methods, gradient boosting, and method of statistically weighted syndromes, developed by the authors, was evaluated. It is shown that the methods of support vectors and logistic regression allowed with high accuracy (more than 98%) to correctly classify the current state of the hive, to determine the absence or presence of a queen according to the sound parameters. At the same time, the information content of the frequency parameters differed significantly as frequency changes. The maximum ability was observed for parameters corresponding to frequencies in the range of 70 –130 Hz. With a further increase in frequency, the information content gradually decreases, and for parameters corresponding to frequencies from 900 for the observed task becomes relatively low. The obtained results prove the correctness of the use of methods of machine learning and frequency and energy features to determine automatically the presence or absence of the queen bee in the hive, as well as the real possibility of developing effective technical means for automatic monitoring of the state of the hive.
Keywords: bee sounds, queen bee, honeybee industry, methods of machine learning, beekeeping, support vector machine, logistic regression.