Аннотация
В данной работе рассматривается процесс распознавания музыкальных нот. В качестве входных данных может выступать звуковой файл, в котором находится запись мелодии. Источником звука при записи мелодии может выступать одиночный музыкальный инструмент, их набор, а также голос человека, напевающего мелодию. Входной файл изначально представлен в формате .wav или записывается в этом формате с микрофона. Обработка осуществляется путем последовательного определения частоты основного тона сигнала и преобразованием значения частоты основного тона в соответствующую ноту. Проводится сравнение программ, реализующих алгоритмы выделения частоты основного тона. Специфика исследования заключается в использовании на первом этапе алгоритмов выделения частоты основного тона с учетом особенностей слуховой системы человека, воспринимающей звук. Применение этих алгоритмов, с одной стороны, позволяет достичь более точного определения значения по сравнению с аналогами, в частности с пиковыми методами. С другой стороны, используемые в настоящий момент в модели слуховой системы человека гребенки фильтров имеют ограничение верхней частоты основного тона в 400 Гц, так как приспособлены для работы с обычной речью. Это является недостатком, поскольку при исполнении мелодий, например, оперными певцами частота основного тона может достигать 1400 Гц. Однако, это ограничение не является принципиальным и требует дополнительного исследования на предмет возможности расширения гребенки фильтров, моделирующих слуховую систему человека. Второй этап представляет собой преобразование выделенной частоты основного тона к ноте на основе разработанного алгоритма. Алгоритм базируется на таблицах соответствия частот нотам с учетом их минимальной продолжительности. Представлены результаты тестирования программы, реализующей эти алгоритмы. В заключении представлены основные результаты работы и ее последующее развитие: расширение диапазона допустимых к распознаванию частот.
Ключевые слова: распознавание нот, частота, основной тон, спектр звука, обработка звука, фильтрация звука, вокал, нотная запись
Список литературы
1. Connect with the music you love [Electronic resource]. – Available at:http://www.sha-zam.com/ (accessed: 07.10.2015).
2. The open music encyclopedia [Electronic resource]. – Available at:http://www.musipe-dia.org/ (accessed: 05.10.2015).
3. Love that song but don't know what it is? Tunatic can tag it for you! [Electronic resource]. – Available at:http://www.wildbits.com/tunatic/ (accessed: 05.10.2015).
4. The ultimate music search [Electronic resource]. – Available at:http://www.midomi.com/ (accessed: 05.10.2015).
5. Способин И.В. Элементарная теория музыки. – М.: Музыка, 1968. – 203 с.
6. Praat: doing phonetics by computer [Electronic resource]. – Available at:http://www.fon.hum.uva.nl/praat/(accessed 07.10.2015).
7. The musical view of audio [Electronic resource]. – Available at:http://www.celemony.com/en/melodyne/ (accessed: 05.10.2015).
8. Черных Д.В., Конев А.А., Мещеряков Р.В. Элементы программного комплекса для оценки биометрических параметров в защищенных системах // Электронные средства и системы управления. – 2011. – № 1. – С. 188–190.
9. Конев А.А., Тихонова В.И. Выделение вокализованных звуков в слитной речи // Акустика речи. Медицинская и биологическая акустика. Архитектурная и строительная акустика. Шумы и вибрации. Аэроакустика: сборник трудов XVI сессии Российского акустического общества. – М.: ГЕОС, 2005. – Т. 3. –С. 47–50.
10. Сравнение параметров для выделения вокализованных сегментов и классификации гласных фонем / С.А.Елистратов, М.А.Косенко, Е.Ю.Костюченко, А.А.Чичерин // Доклады Томского государственного университета систем управления и радиоэлектроники. – 2012. – Т. 1, № 2. – С. 171–174.
11. Конев А.А. Модель и алгоритмы анализа и сегментации речевого сигнала:автореф.дис.… канд.техн. наук. – Томск, 2007. – 20 с.
12. Mitre A.,Queiroz M.,FariaR.Accurate and efficient fundamental frequency determination from precise partial estimates // Proceedings of the 4th AES Brazil Conference, May 2006. – Sou-Paulo, 2006. – P. 113–118.
13. Estimation of pitch from speech signals[Electronic resource]. – Available at: iitg.vlab.co.in/?sub=59&brch=164&sim=1012&cnt=1(accessed: 05.10.2015).
14. Gerhard D. Pitch extraction and fundamental frequency: history and current techniques: technical report TR-CS 2003-06. – Regina Saskatchewan, Canada: Department of Computer Science University of Regina, 2003. – 22 p.
15.ТюлинЮ.Н. Краткийтеоретическийкурсгармонии. – М.: Музыка, 1978. – 168 с.