О чем думают домашние животные?


думающий кот

Скажи “Мяу”, и я скажу, о чем ты думаешь.

Попытка общений с братьями нашими меньшими уже давно предпринималась, а также старания наладить контакт с ними проводится во многих зоологических институтах, исследовательских центрах не одно десятилетие, в основном за границей. Например, общение с дельфинами. Но стоит обратить внимание на ближайшее окружение, то есть животных, которых человек приручил много столетий назад и которые идут на контакт с нами, но мы их не слышим по ряду причин и обстоятельств.

Коты и кошки… Самостоятельные и гордые, как привыкли мы их считать, но действительно ли это так?

Гражданин Марвин Р. Кларк в 1895 году опубликовал обычную на первый взгляд книгу под названием «Киска и ее язык». Однако кроме разных занимательных историй про животных-компаньонов, автор привел небольшой список кошачьих слов.

кошачьи слова

Компания ООО “Би-оН ЭМГ” совместно с ветеринаром Базовкиным Я.Н. провели исследование и проверили достоверность данных переводов, а также создали систему распознающие голоса кошек на базе нейронной сети, и переводящие их на человеческий язык.

Как не раз утверждал ветеринар Базовкин Яков Николаевич, имеющий опыт работы с животными несколько десятилетий: “Животные по-разному ведут себя в домашней среде и в гостинице для зверей. В первом случае, они спокойны и умиротворены, могут издавать больший спектр звуков, чем в условиях агрессивной среды. Многое также упирается в характер и темперамент животного, их опыт… Общение с животными, кошками и собаками строится во многом на невербальном общении, особенно у собак. Хотя у кошек также подвижность хвоста и ушей отражают их эмоции.”

Распознавание "речи" животных, на данный момент очень актуальная тема, многие люди интересуются этим, так как хотят понять, что "говорит" их домашний питомец. Сейчас этой тематикой занимаются такие корпорации как: Google и Temtation Lab.

У Google это система интегрирована переводчик Google Translate называется "Google Translate for Animals". Использование данного предложения происходит следующим образом: в начале записывается звук, после чего выбирается вид животного, далее делается перевод. Сам перевод занимает несколько секунд, сейчас возможен перевод только на английский язык.[1]

Temptation Lab выпустила ошейник для кошек, ошейник сам распознаёт речь и переводит её на английский язык.[2] Но продукт не доступен в продаже и нет отзывов его использования, есть предположения, что это была рекламная акция корма и продукт выпускался в рамках данной рекламы.

Целью работ помимо экспериментальных расшифровок данных речи котов и проверки соответствия исследования Марвина Р. Кларка, стояла также задача подбора оптимального алгоритма по распознаванию речи для программного обеспечения.

Метод, который использовался, это “метод проб и ошибок”, экспериментальный.

Данные, которые были записаны и размечены ветеринаром, а также записи голосов котов участников эксперимента, согласно соответствую звуков значений по мнению хозяев, привели к формированию базы данных записей котов. Общее количество записей котов на апрель 2018 года 48, но планируется также расширение и дообучение.

Алгоритм распознавания звуков у котов

В данной работе распознавалось в целом 7 основных речевых команд, которыми кошки сообщают свое состояние человеку. Методов это сделать несколько: подавать необработанные сигнал на рекуррентную сеть, подавать отсчеты спектра за какое-то короткое время(т.н. частотно-временная обработка), подавать участки спектра на сеть с одномерными свертками, делать обработку или использовать кепстральные(или мел-кепстральные коэффициенты)[3] и в дальнейшем подавать их, на новые нейронные сети: рекуррентные или сверточные сети. То есть проще говоря, использовать не одну нейронную сеть, алгоритм, а комбинировать алгоритмы и таким образом повышать точность распознавания. Также можно анализировать уровень громкость и анализировать по отношению к нему делать обработку данных и распознавание с помощью полносвязных сетей или с помощью метрических классификаторов, проще говоря, более простых методов.

В данной работе была использована пред. обработка в виде вычисления кепстральных коэффициентов[3], после чего они подавались на полносвязную нейронную сеть (так называемый метод обработки данных). Данная пред. обработка позволяет преобразовать сигнал любой размерности, в сигнал фиксированной размерности, что дает возможность распознавать его нейронной сетью на ограниченном числе классов, то есть соответствия между звуками “мяуканья” и смыслом на человеческом языке. Так же учитывая, что кепстральное преобразование, предобработка, обладает свойством «уплотнения энергии», во многом благодаря использованию в своей основе ДКП-2[4], использование такого преобразования позволяет сократить пространство признаков в несколько тысяч раз, то есть ускорить обработку и уменьшить число необходимых для распознавания сигналов. Информацию, необходимую для распознавания, о сигнале можно представить несколькими коэффициентами в этой работе их 35. После чего вектор признаков нормализуется делением на свою дисперсию и центрированием на 0.

Распознавание спонтанной человеческой речи кепстральными коэффициентами получается довольно плохого качества из-за того, что количество распознаваемых слов превышает десятки тысяч, но для распознавания строго ограниченного числа команд не превышающего 100 этот метод дает довольно хорошие результаты.[5] Для повышения точности системы на выходе в качестве классификатора используется нейронная сеть, с одним скрытым слоем, который должен извлекать более информативные признаки для последующего распознавания выходным слоем.[6]

На первом этапе происходит определение (бинарная классификация) — это речь(мяукание) или просто шум, в случае если классификатор решает что это голос, то записывается сигнал с микрофона в течении того времени, пока длится речь. После чего производится кепстральное преобразование, для описания сигнала выделяются первые 35 элементов кепстра, что позволяет описать любой сигнал вектором конечной длинны, также позволяет уменьшить пространство признаков более чем в 1000 раз и данные признаки инвариантны к сдвигам по времени. Далее сигнал подается на нейронную сеть, которая распознает произнесенные кошкой команды.

Сигнал на входе:


Первые 90 кепстральных коэффициентов:

 

Программа для распознавания:

 

Можно сказать, что положение хвоста и ушей у кошек демонстрируют эмоции животного, также как у человека мимические мышцы лица. Но несмотря на это, речь кошек также весьма многогранна, как и у людей, и по тональности и звукам можно понять, о чем говорит животное и как, получить информацию по эмоциональному окрасу речи.

Важно отметить, что у многих животных есть различные повадки, но как ни странно, можно увидеть один феномен, что независимо от породы существует язык кошек, который един для любой точки мира на земле. Данный факт сильно отличает кошек от людей. В принципе все может обосновываться примитивными повадками и простейшими звуками у кошек, из-за того, что они весьма редко используют речь и по большей части для решения простейших задач, но также может быть и другая причина, которая в будущем будет выявлена.

Например, в процессе исследования на примере кота Люция (фото ниже) было замечено, что он не выпрашивает корм, но просит открыть дверь, ходя за хозяевами, не сидя при этом около двери.

Фото Люция

Вот ряд уроков, взятых из книги «Кошка и её язык», которые сейчас являются такими же применимыми, как и столетие назад:

Коты могли бы в любой момент разрушить международную дипломатию «В величественных капитолийских зданиях в Вашингтоне и на самых секретных заседаниях кабинета в Белом доме, как и почти во всех обитаемых местах земного шара, есть шпион, до ушей которого доходят секреты нации, которые, если о них шепнуть в неподходящий момент могут её разрушить».

Кошки могут предсказывать погоду «Если кошка моется обычным способом, можно быть уверенным в ясной, солнечной погоде, но если она вылизывает себя против шерсти или моется, держа лапу над ухом, ждите грозы».

Наполеон ненавидел котов «Говорят, что Наполеон Бонапарт ненавидел котов так же сильно, как австрийцев и русских».

Несмотря на это, во Франции была (может быть?) больница для котов «В Париже, Франция, есть очень большое заведение, само название которого, Hospice du Chats (Дом для котов), говорит о его назначении. Это роскошное здание, занимающее очень большую площадь, имеет два этажа и специально построено для предоставления убежища котам Франции. В нём есть комнаты для котов разных полов и национальностей, оборудованные паровым отоплением, еда там подаётся с добросовестной регулярностью, а в управлении учреждением во всех мелочах обращают внимание на этикет и точность, как в хорошо организованной гостинице».

Исаак Ньютон, возможно, использовал котов для изучения законов физики «Говорят, что сэр Исаак Ньютон сделал в своём сарае две дыры: большую дыру для своего старого кота и рядом с ней дыру поменьше для котят».

Важно отметить, что в гостинице для кошек ветеринар не раз отмечал, что кошки совершенно по-другому ведут себя в новой обстановке, они очень часто просят к себе внимания и выпустить их погулять, и совершенно в других условиях дома, где чувствуют себя более свободно и не принужденно. Многие например, понимают человеческий язык и слова, которые говорят люди, как ни странно бы это не звучало, но в изучении данного вопроса еще предстоит очень многое осознать и проверить.

Выводы:

В данной работе получилось реализовать систему распознавания семи речевых сигналов, которые издают кошки. Вероятность правильной классификации превышает 90%. Важно увеличить число записей котов и расширить список перечня типовых сигналов, чем активно занимается компания ООО “Би-оН ЭМГ”.

Касательно результатов анализа речевых сигналов, удалось выявить правдивость в соответствии сигналов исследования Марвина Р. Кларка, некоторые соответствия еще предстоит проверить из-за специфичности значений и невозможности создать благоприятные условия сейчас в рамках эксперимента для записи звуков котов, но текущие результаты эксперимента дали обнадеживающие результаты и позволили сделать выводы о том, что у котов единый язык, и они пытаются наладить контакт с человеком, причем данный контакт подается четкой логике по распознаванию речи.

Также в рамках работ была создана программа переводчик языка кошек в реальном времени и с записи различных форматов на человеческий язык от компании ООО Би-оН ЭМГ, планируется вывести данный переводчик в ближайшем будущем на рынок, и в последующем его модифицировать, расширяя функции и возможности.

 

 

Список литературы:

  1. Google Translate for Animals https://www.google.co.uk/intl/en/landing/translateforanimals/tour.html
  2. Temtation Lab http://catterbox.com/
  3.  Мел-кепстральные коэффициенты (MFCC) и распознавание речи https://habrahabr.ru/post/140828
  1. Loeffler, A. Ligtenberg and G. Moschytz. Practical Fast 1-D DCT Algorithms with 11 Multiplications // Proc. Int’l. Conf. on Acoustics, Speech, and Signal Processing 1989 (ICASSP '89), pp. 988—991.
  1. О.С. Агашин, О.Н. Корелин: Методы цифровой обработки речевого сигнала задача распознавания изолированных слов с использованием сигнальных процессоров. http://www.nntu.ru/trudy/2012/04/032-044.pdf
  2. Саймон Хайкин: Нейронные сети полный курс.
  3. Марвин Р. Кларк книга «Киска и ее язык» 1895 года

 

ООО Би-оН ЭМГ и ветеринар Базовкин Я.Н.

Авторы: Иванюк Н.М., Понимаш З.А., Каримов В.Р.

Предыдущая статья Сиба-ину описание породы
Следующая статья Парад собак в Москве

Нет комментариев

Оставьте коментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *