Проэкт Информационный Справочник Itшника
Обращаюсь с просьбой дать рекомендацию по реализации проекта, какие языки/готовые решения лучше использовать, почему.
Суть проекта: для начинающих ITшников, а также средне разбирающихся пользователей есть множество материалов в сети, но иногда возникает необходимость получить какую-либо информацию за достаточно короткое время. Пример: подробное описание ПО или железяки, где были бы указаны преимущества, недостатки, достоинства, рекомендации по использованию. Или пример: нужна детальная информация про CPU, перебирать кучу книг/сайтов не вариант.
В таком случае приходит на помощь мой проект, для которого я перебираю информацию из книг (пока обработаны 2 по железу), прессы (журналы Железо, Домашний ПК, Computer Bild, Chip, Upgrade...). Из статей убираю все, что по моему мнению является лишним (введение, вступление, шуточное сравнение), тем самым оставляя только главную суть материала, следовательно пользователю будет нужно меньше времени затратить, чтобы прочитать материал, и быстрее он получит интересующую его информацию. В проекте используется система древовидного каталога, которой отдается преимущество перед поиском, т.к. грамотный каталог должен предлагать выбор материала, а поиск предоставлять материал по запросу пользователя - мне нужен как таки 1й вариант.
На данный момент обработано 2 книги, из них выбраны "полезные" по моему мнению, материалы. Так же другие статьи из журналов. Всего более 550 исходных материалов обработано. В результате чего моя коллекция "полезных" материалов насчитывает более 2500 тысяч статей. Статьи хранятся в формате "*.docx".
Хочу сделать платформу в вебе для доступа к материалам. Требуется решение, как можно легче/практичнее или по другим причинам реализовать взаимодействие Вордовских документов с вебом, чтобы не пришлось конвертировать/копировать файлы/материалы при их публикации. Также нужен способ, чтобы готовая система при работе с док файлами могла проводить поиск по ним, какую-то часть информации выводить после получения доступа к ней, была гибкой и возможно расширение функционала.
Я понимаю, что это делается довольно сложно. В плане программирования знаю всего лишь азы С/С++/Visual C++, на среднем уровне HTML/CSS/Jooml'у. Буду благодарен любым рекомендациям, которые способны будут помочь мне в решении поставленной задачи.
[right]Спасибо за внимание, Havik[/right]
P.S. Готов к перспективному сотрудничеству.
У вас есть разрешение на публикацию от авторов книг и редакций журналов? Если нет (а скорее всего именно так), то по сути, вы украли чужую интеллектуальную собственность.
По делу: информация о железках быстро устаревает, т. к. постоянно выходят новые. Новые версии софта тоже выходят постоянно. За прогрессом IT не угнаться.
Опять же имхо: ваш проект быстро заглохнет, и станет скопищем пыльного устаревшего хлама. Ибо нужно будет постоянно перелопачивать сотни книг, журналов, статей... А вот информация в Гугле/Яндексе и других поисковиках всегда будет свежей. И, самое оптимальное, всегда можно спросить совета по новинкам софта/железа на форуме у старых верных товарищей по цеху :).
Не подумайте пожалуйста, что я с Вами спорю, возможно вы и правы. Я всего лишь выскажу известное мне положение: книги и журналы, которые находятся в свободной продаже/ в свободном доступе можно использовать как источники материала с указанием автора и источника, т.е. авторское право и закон я не нарушаю.
У меня немного другая цель. Все козыри я раскрывать не собираюсь... просто изложил суть идеи, для которой требуется пояснение, как это можно реализовать.
Не каждому пользователю доставляет удовольствие лазить по форуму и/или пытаться задать правильный вопрос в поисковике, где гарантия что 1ые сайты в том же гугле не являются просто пропиаренными ресурсами и несут именну "полезную" информацию? Где можно взять хороший материал из тех же книг и журналов? Они когда-то вышли, редакция на них в свое время заработала деньги и выкинула PDF в паблик (например журнал Железо на оф.сайте)...
Это моё Имхо отчасти. А теперь, если можете что порекомендовать насчет реализации, буду Вам признателен.
Но по сабжу - любой wiki движок.
Откуда там взялись вордовские документы?
В вордовских документах я работаю с материалами, из них необходимо произвести считывание информации и вывод в веб. По ним же, необходимо производить поиск материала. Другие варианты, как не перерабатывать уже готовые 2500 материалов я не знаю.
Это тупизм. Система будет тормознутая по самое нехочу. Темболее почему именно ворд? а не например OOo или LO writer? Почему не pdf на крайний случай???
Быстрота, удобство, куча возможностей, не нужно изобретать велосипед.
Пишем макрос для ворда (или цпп через OLE) Открываем файлы по очереди ->сохраняем в хтмл или копируем весь текст и заносим в бд сразу.
с этим не знаком, поэтому и обратился за рекомендациями на форум.
Ворд в данном случае удобен тем, что материал всегда можно подредактировать, а это для 1 из условий мне необходимых.
Спасибо, уже присмотрел некоторые движки, которые работают без БД, инфу хранят в файлах, попробую, как раз то что хотел...
А что если написать программу, например C++/C#, которая с ворд.доками и будет работать...и запустить все это дело на сервере... реально овчинка не стоит выделки?