Анализ текстовых файлов
В текстовиках есть:
1) Псевдографика
2) Инфа о исполнителе, годе выпуска альбома
3) Список треков
4) Суммарная длительность/размер треков
5) Инфа о релизе
Требуется удалять 1-ое и последнее. Всё было бы просто, если бы все файлы были сильно похожи, но... увы, совершенно единого формата нет :( . В какую сторону посоветуете смотреть. Регулярные выражения, ручками анализировать символы может есть какая-то библиотека, которую можно прспособить для данных целей (было бы прекрасно).
Присоединяю примеры файлов.
Давайте подумаем вместе :)
А сколько всего таких файлов (желательно числом, а не словом "много")?
Сейчас их около 500, но дело в том, что они прибывают... :)
Сейчас их около 500, но дело в том, что они прибывают... :)
Можеш содержание хотя бы 2х из них привести чтобы посмотреть на формат
Может легче выбрать только нужное из мусора, чем вырезать ненужное?
Примеры в архиве, приатаченном к первому сообщению ;).
Я думал об этом, но иногда пишут tracks, в других случаях t.r.a.c.k . l.i.s.t , в общем напишу я прогу, предусмотрю (если удастся) всё тонкости, которые сейчас есть, но вдруг кто-то придумает нечто слабо похожее, на то что было, тогда мне придётся смотреть исходники, добавлять функционал... А вот псевдографика, например и ещё некоторые вещи будут всегда (по крайней мере в ближайшее время)
К примеру открываешь файл. Прога сразу подсвечивает то, что сочла нужным. Если все правильно - жмем ОК, если нет - добавляем/удаляем нужные области и жмем ОК.
Хоть и прийдется участвовать в процессе, но времени на один файл должно уйти мало.
Для начала написать функцию, которая будет подсвечивать только текст (псевдографика уже отпадет). Тут только есть нюанс, что в псевдографике могут использоваться ".,\" которые потпадают под критерий текст. То есть надо будет еще анализировать, что если между псевдографикой проскакивает один-два (к примеру) текстовых символов, то считать что они не нужны.
Ну и т.д. и т.п.
В общем начал писать на C#... во всю мощь стараюсь использовать ругулярные выражения. Уже есть некоторые успехи :)
Спешу похвастаться :D . В общем, реализовал свою задумку на C#, получившаяся система "обучается" (правда не самостоятельно...) работает на ура. из 400 пропарсеных файлов неправильными оказались лишь штук 10...
дык не обделите широкую обшественность исходниками данного шедевра
File Editor
Оговорясь больше не поддерживаю... свою работу программа выполнила и этим я ограничился:)
File Editor
Оговорясь больше не поддерживаю... свою работу программа выполнила и этим я ограничился:)
не понял
ну да ладно
File Editor
Оговорюсь: проект больше не поддерживаю... свою работу программа выполнила и этим я ограничился:)