Разложение звука на частоты
А разложить просто, берешь Быстрое Преобразование Фурье(БПФ/FFT) и применяешь к сигналу. Еще можно применить окно хэмминга для увелечения качества преобразования.
Модели искусственных нейронных сетей из формальных нейронов & имитации нейробиологического процесса разложения смешанного звукового потока -> http://www.keldysh.ru/pages/NNModel/kuz_files/kuz_pdf/Lectures/p_NNL2.ppt
Думаю может быть полезным. Хотя по некоторым критериям остается очень и очень много вопросов....
Может еще парочка ссылок не помешает:
http://www.computerra.ru/offline/1999/293/3577/ - статья из компьютеры.
http://bookmp3.com.ua/index.php?nma=catalog&fla=stat&nums=8&cat_id=3&page=1 - так, небольшая статейка о речевых технологиях.
Тут важно не "простое" разложение звуковой волны на частотный спектр, а хорошее понимание методов синтеза речи и модулей лингвистеческой обработки и анализа. Да и самое важное, конечно же, это создание вразумительной системы/программы обучения нейронов, что является намного более сложной задачей чем даже синтез звука.
Удачи коллега ;)
Удачи коллега ;)
Хм, коллега?! Вы тоже этим занимаетесь?
А про обучение я придумал. Там идёт запись сигнала, с преобразованием в карту (или несколько карт - по времени), а затем простое сравнение входного сигнала с эталонным (записаным). Это уже было мной опробовано на тексте, конечно были ошибки в опазновании, но надеюсь при работе со звуком такого не возникнет.
Pavia, спасибо за Фурье :)
В коем-то роде да. Я занимаюсь нейронными сетками и экспертными системами. Обучение нейронов и персептронов, методы распознования информации, методы представления полученной инофрмации, методы и алгоритмы обработки представленной информации и выявления необходимого в определенный момент "знания".
[QUOTE=evil_rabbit]А про обучение я придумал. Там идёт запись сигнала, с преобразованием в карту (или несколько карт - по времени), а затем простое сравнение входного сигнала с эталонным (записаным). Это уже было мной опробовано на тексте, конечно были ошибки в опазновании, но надеюсь при работе со звуком такого не возникнет.[/QUOTE]
Ну я так понимаю Вы в будующем планируете не просто синтезирование и распознование звука на основе записанного ранее звука (звуковых, речевых команд), но и наверное построение системы на базе нейросетки с дальнейшей возможностью самообучения системы???