Разложение звука на частоты

21K

10 ноября 2008 года

60 / / 27.08.2008

Здравствуйте, я решил написать программу для управления компьютером при помощи голоса (на основе нейронных карт Кохонена), проблема в том, что я не знаю как разложить звук на частоты, чтобы передать значения нейронам. Помогите если знаете или хотя-бы ссылку. Заранее благодарен.

Подписаться на вопросНеобходима регистрация

По порядку

Сначала полезные

Сначала решения

5 ответов

-1 спам

551

10 ноября 2008 года

Pavia

357 / / 22.04.2004

Не знаю зачем для неронки расклаывать звук на гормоники, так можно передовать. Хотя возможно с разложением будет лучше.
А разложить просто, берешь Быстрое Преобразование Фурье(БПФ/FFT) и применяешь к сигналу. Еще можно применить окно хэмминга для увелечения качества преобразования.

Цитировать

0 спам

502

10 ноября 2008 года

Jail

550 / / 30.01.2007

Цитата: evil_rabbit

Модели искусственных нейронных сетей из формальных нейронов & имитации нейробиологического процесса разложения смешанного звукового потока -> http://www.keldysh.ru/pages/NNModel/kuz_files/kuz_pdf/Lectures/p_NNL2.ppt
Думаю может быть полезным. Хотя по некоторым критериям остается очень и очень много вопросов....
Может еще парочка ссылок не помешает:
http://www.computerra.ru/offline/1999/293/3577/ - статья из компьютеры.
http://bookmp3.com.ua/index.php?nma=catalog&fla=stat&nums=8&cat_id=3&page=1 - так, небольшая статейка о речевых технологиях.
Тут важно не "простое" разложение звуковой волны на частотный спектр, а хорошее понимание методов синтеза речи и модулей лингвистеческой обработки и анализа. Да и самое важное, конечно же, это создание вразумительной системы/программы обучения нейронов, что является намного более сложной задачей чем даже синтез звука.
Удачи коллега ;)

Цитировать

0 спам

21K

11 ноября 2008 года

evil_rabbit

60 / / 27.08.2008

Цитата: Jail

Да и самое важное, конечно же, это создание вразумительной системы/программы обучения нейронов, что является намного более сложной задачей чем даже синтез звука.
Удачи коллега ;)

Хм, коллега?! Вы тоже этим занимаетесь?
А про обучение я придумал. Там идёт запись сигнала, с преобразованием в карту (или несколько карт - по времени), а затем простое сравнение входного сигнала с эталонным (записаным). Это уже было мной опробовано на тексте, конечно были ошибки в опазновании, но надеюсь при работе со звуком такого не возникнет.

Pavia, спасибо за Фурье :)

Цитировать

0 спам

502

11 ноября 2008 года

Jail

550 / / 30.01.2007

Цитата: evil_rabbit

Хм, коллега?! Вы тоже этим занимаетесь?

В коем-то роде да. Я занимаюсь нейронными сетками и экспертными системами. Обучение нейронов и персептронов, методы распознования информации, методы представления полученной инофрмации, методы и алгоритмы обработки представленной информации и выявления необходимого в определенный момент "знания".
[QUOTE=evil_rabbit]А про обучение я придумал. Там идёт запись сигнала, с преобразованием в карту (или несколько карт - по времени), а затем простое сравнение входного сигнала с эталонным (записаным). Это уже было мной опробовано на тексте, конечно были ошибки в опазновании, но надеюсь при работе со звуком такого не возникнет.[/QUOTE]
Ну я так понимаю Вы в будующем планируете не просто синтезирование и распознование звука на основе записанного ранее звука (звуковых, речевых команд), но и наверное построение системы на базе нейросетки с дальнейшей возможностью самообучения системы???

Цитировать

0 спам

21K

12 ноября 2008 года

evil_rabbit

60 / / 27.08.2008

:eek: что-то в этом роде :)

Цитировать