Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Почтовая рассылка

Подписчиков: -1
Последний выпуск: 19.06.2015

Анализ текстовых файлов

1.9K
05 января 2006 года
mail0
137 / / 09.05.2005
Вот надо сделать утилитку, которая, анализируя содержимое текстового файла, удаляла бы некоторые элементы.
В текстовиках есть:
1) Псевдографика
2) Инфа о исполнителе, годе выпуска альбома
3) Список треков
4) Суммарная длительность/размер треков
5) Инфа о релизе
Требуется удалять 1-ое и последнее. Всё было бы просто, если бы все файлы были сильно похожи, но... увы, совершенно единого формата нет :( . В какую сторону посоветуете смотреть. Регулярные выражения, ручками анализировать символы может есть какая-то библиотека, которую можно прспособить для данных целей (было бы прекрасно).
Присоединяю примеры файлов.
Давайте подумаем вместе :)
292
06 января 2006 года
Matush
726 / / 14.01.2004
А сколько всего таких файлов (желательно числом, а не словом "много")?
1.9K
06 января 2006 года
mail0
137 / / 09.05.2005
Цитата:
Originally posted by Matush
А сколько всего таких файлов (желательно числом, а не словом "много")?

Сейчас их около 500, но дело в том, что они прибывают... :)

406
06 января 2006 года
vitaly2003s
481 / / 27.07.2004
Цитата:
Originally posted by mail0
Сейчас их около 500, но дело в том, что они прибывают... :)



Можеш содержание хотя бы 2х из них привести чтобы посмотреть на формат

12K
06 января 2006 года
b1er
5 / / 19.07.2005
Может легче выбрать только нужное из мусора, чем вырезать ненужное?
1.9K
06 января 2006 года
mail0
137 / / 09.05.2005
Цитата:
Originally posted by b1er
Может легче выбрать только нужное из мусора, чем вырезать ненужное?

Примеры в архиве, приатаченном к первому сообщению ;).

Цитата:
Может легче выбрать только нужное из мусора, чем вырезать ненужное?


Я думал об этом, но иногда пишут tracks, в других случаях t.r.a.c.k . l.i.s.t , в общем напишу я прогу, предусмотрю (если удастся) всё тонкости, которые сейчас есть, но вдруг кто-то придумает нечто слабо похожее, на то что было, тогда мне придётся смотреть исходники, добавлять функционал... А вот псевдографика, например и ещё некоторые вещи будут всегда (по крайней мере в ближайшее время)

292
07 января 2006 года
Matush
726 / / 14.01.2004
А если написать прогу с полуавтоматическим режимом?
К примеру открываешь файл. Прога сразу подсвечивает то, что сочла нужным. Если все правильно - жмем ОК, если нет - добавляем/удаляем нужные области и жмем ОК.

Хоть и прийдется участвовать в процессе, но времени на один файл должно уйти мало.

Для начала написать функцию, которая будет подсвечивать только текст (псевдографика уже отпадет). Тут только есть нюанс, что в псевдографике могут использоваться ".,\" которые потпадают под критерий текст. То есть надо будет еще анализировать, что если между псевдографикой проскакивает один-два (к примеру) текстовых символов, то считать что они не нужны.

Ну и т.д. и т.п.
1.9K
07 января 2006 года
mail0
137 / / 09.05.2005
В общем начал писать на C#... во всю мощь стараюсь использовать ругулярные выражения. Уже есть некоторые успехи :)
1.9K
13 января 2006 года
mail0
137 / / 09.05.2005
Цитата:
Originally posted by mail0
В общем начал писать на C#... во всю мощь стараюсь использовать ругулярные выражения. Уже есть некоторые успехи :)


Спешу похвастаться :D . В общем, реализовал свою задумку на C#, получившаяся система "обучается" (правда не самостоятельно...) работает на ура. из 400 пропарсеных файлов неправильными оказались лишь штук 10...

15K
15 марта 2006 года
kotofurer
8 / / 15.03.2006
дык не обделите широкую обшественность исходниками данного шедевра
713
15 марта 2006 года
Ap0k
360 / / 13.03.2006
Цитата:
Originally posted by kotofurer
дык не обделите широкую обшественность исходниками данного шедевра


File Editor
Оговорясь больше не поддерживаю... свою работу программа выполнила и этим я ограничился:)

15K
15 марта 2006 года
kotofurer
8 / / 15.03.2006
Цитата:
Originally posted by Ap0k
File Editor
Оговорясь больше не поддерживаю... свою работу программа выполнила и этим я ограничился:)


не понял
ну да ладно

713
15 марта 2006 года
Ap0k
360 / / 13.03.2006
Цитата:
Originally posted by Ap0k
File Editor
Оговорюсь: проект больше не поддерживаю... свою работу программа выполнила и этим я ограничился:)

Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог