Системы анализа и обработки данных

Автоматическое распознавание музыкальных нот

Выпуск № 3 (60) Июль - Сентябрь 2015

Авторы:

А.А. КОНЕВ,

А.А. ОНИЩЕНКО,

Е.Ю. КОСТЮЧЕНКО,

А.Ю. ЯКИМУК

DOI: http://dx.doi.org/10.17212/1814-1196-2015-3-32-47

Скачать полный текст

Аннотация
Авторы
Список литературы

Аннотация
В данной работе рассматривается процесс распознавания музыкальных нот. В качестве входных данных может выступать звуковой файл, в котором находится запись мелодии. Источником звука при записи мелодии может выступать одиночный музыкальный инструмент, их набор, а также голос человека, напевающего мелодию. Входной файл изначально представлен в формате .wav или записывается в этом формате с микрофона. Обработка осуществляется путем последовательного определения частоты основного тона сигнала и преобразованием значения частоты основного тона в соответствующую ноту. Проводится сравнение программ, реализующих алгоритмы выделения частоты основного тона. Специфика исследования заключается в использовании на первом этапе алгоритмов выделения частоты основного тона с учетом особенностей слуховой системы человека, воспринимающей звук. Применение этих алгоритмов, с одной стороны, позволяет достичь более точного определения значения по сравнению с аналогами, в частности с пиковыми методами. С другой стороны, используемые в настоящий момент в модели слуховой системы человека гребенки фильтров имеют ограничение верхней частоты основного тона в 400 Гц, так как приспособлены для работы с обычной речью. Это является недостатком, поскольку при исполнении мелодий, например, оперными певцами частота основного тона может достигать 1400 Гц. Однако, это ограничение не является принципиальным и требует дополнительного исследования на предмет возможности расширения гребенки фильтров, моделирующих слуховую систему человека. Второй этап представляет собой преобразование выделенной частоты основного тона к ноте на основе разработанного алгоритма. Алгоритм базируется на таблицах соответствия частот нотам с учетом их минимальной продолжительности. Представлены результаты тестирования программы, реализующей эти алгоритмы. В заключении представлены основные результаты работы и ее последующее развитие: расширение диапазона допустимых к распознаванию частот.

Ключевые слова: распознавание нот, частота, основной тон, спектр звука, обработка звука, фильтрация звука, вокал, нотная запись

Авторы:

А.А. КОНЕВ
634050, РФ, г. Томск, пр. Ленина, 40, Томский государственный университет систем управления и радиоэлектроники, кандидат технических наук, доцент. Е-mail: kaa1@keva.tusur.ru

А.А. ОНИЩЕНКО
634050, РФ, г. Томск, ул. Гагарина, 7, ООО «Тензор», инженер органа криптографической защиты.Е-mail: veganwin@gmail.com

Е.Ю. КОСТЮЧЕНКО
634050, РФ, г. Томск, пр. Ленина, 40, Томский государственный университет систем управления и радиоэлектроники, кандидат технических наук, доцент.Е-mail: key@keva.tusur.ru

А.Ю. ЯКИМУК
634050, РФ, г. Томск, пр. Ленина, 40, Томский государственный университет систем управления и радиоэлектроники, аспирант.Е-mail: yay@keva.tusur.ru

Список литературы
1. Connect with the music you love [Electronic resource]. – Available at:http://www.sha-zam.com/ (accessed: 07.10.2015).

2. The open music encyclopedia [Electronic resource]. – Available at:http://www.musipe-dia.org/ (accessed: 05.10.2015).

3. Love that song but don't know what it is? Tunatic can tag it for you! [Electronic resource]. – Available at:http://www.wildbits.com/tunatic/ (accessed: 05.10.2015).

4. The ultimate music search [Electronic resource]. – Available at:http://www.midomi.com/ (accessed: 05.10.2015).

5. Способин И.В. Элементарная теория музыки. – М.: Музыка, 1968. – 203 с.

6. Praat: doing phonetics by computer [Electronic resource]. – Available at:http://www.fon.hum.uva.nl/praat/(accessed 07.10.2015).

7. The musical view of audio [Electronic resource]. – Available at:http://www.celemony.com/en/melodyne/ (accessed: 05.10.2015).

8. Черных Д.В., Конев А.А., Мещеряков Р.В. Элементы программного комплекса для оценки биометрических параметров в защищенных системах // Электронные средства и системы управления. – 2011. – № 1. – С. 188–190.

9. Конев А.А., Тихонова В.И. Выделение вокализованных звуков в слитной речи // Акустика речи. Медицинская и биологическая акустика. Архитектурная и строительная акустика. Шумы и вибрации. Аэроакустика: сборник трудов XVI сессии Российского акустического общества. – М.: ГЕОС, 2005. – Т. 3. –С. 47–50.

10. Сравнение параметров для выделения вокализованных сегментов и классификации гласных фонем / С.А.Елистратов, М.А.Косенко, Е.Ю.Костюченко, А.А.Чичерин // Доклады Томского государственного университета систем управления и радиоэлектроники. – 2012. – Т. 1, № 2. – С. 171–174.

11. Конев А.А. Модель и алгоритмы анализа и сегментации речевого сигнала:автореф.дис.… канд.техн. наук. – Томск, 2007. – 20 с.

12. Mitre A.,Queiroz M.,FariaR.Accurate and efficient fundamental frequency determination from precise partial estimates // Proceedings of the 4th AES Brazil Conference, May 2006. – Sou-Paulo, 2006. – P. 113–118.

13. Estimation of pitch from speech signals[Electronic resource]. – Available at: iitg.vlab.co.in/?sub=59&brch=164&sim=1012&cnt=1(accessed: 05.10.2015).

14. Gerhard D. Pitch extraction and fundamental frequency: history and current techniques: technical report TR-CS 2003-06. – Regina Saskatchewan, Canada: Department of Computer Science University of Regina, 2003. – 22 p.

15.ТюлинЮ.Н. Краткийтеоретическийкурсгармонии. – М.: Музыка, 1978. – 168 с.

Просмотров: 3870

СИСТЕМЫ АНАЛИЗА И ОБРАБОТКИ ДАННЫХ

Автоматическое распознавание музыкальных нот