Распознавание слов.
Люди помогите кто чем может. Посоветуйте учебники или статейки по теме распознавания слов. (Именно слов, пока не нужно речь). Или может кто писал что -то подобное поделится исходником. Заранее спасибо.
если распознавание в тексте, то просто банально разделяешь слова по признаку знаков пунктуации, а затем анализируешь каждое слово отдельно на наличие общих правил, базовых эвристик. то есть проверяешь не состоит ли оно полностью из согласных\гласных, равно ли примерно число гласных и согласных, не идет ли подряд три и более гласных\согласных, не идут ли после гласных мягкий и твердый знак, проверяешь на общую длинну слова, что бы оно не было очень большое и не слишком маленькое, отслеживаешь не стандартные(менее употребимые) буквы, такие как ы,й,я,э,ё, проверяешь частоту вхождения наиболее популярных букв а,о,к, в конце можно по всему тексту поискать наиболее часто употребительные слова, предлоги. после того как протестируешь текст, необходимо будет взять результаты каждого из тестов с различными весами, и применить правила Баеса, например длинна слова не так критична как содержание всех гласных в слове, значит вес теста о длинне должен быть значительно меньше. в итоге получишь вероятность около 60-70%, если грамотно реализуешь то даже может быть около 70-90%.
если необходимо не только удостоверится, что это слово, но и узнать, что оно значит, то тогда надо составить словари в виде деревьев с очень сложной структурой, ну тут скорее работа не программиста, а лингвиста.
готовых книг не ищи, тема не очень популярная.
ЗЫ: а на фиг ты разместил тему в раздел "винапи"? думал мелкософт реализовал функцию проверки слов?=) как по мне так тему надо в общие вопросы.=)