четверг, 30 июня 2011 г.

Re: Разбор файлов MS Office на Ruby

тогда не мучайся и пропусти через catdoc или как там утилька витуса вагнера звалась. если нужно таки всяческое форматирование - ну остается опенофис, как уже говорили. но для него иксы потребуются, хоть и в безголовом варианте.
Excerpts from Foreteller's message of Thu Jun 30 00:41:24 +0400 2011:
> Док файлы исключительно для индекса чтобы можно было осуществлять
> поиск в том числе с учетом контента в доковских файлах;
>
> On Jun 29, 9:59 pm, Afa <afa.al...@gmail.com> wrote:
> > Excerpts from Foreteller's message of Wed Jun 29 15:15:38 +0400 2011:> Задача: организовать чтение информации из файлов MS Office (*.doc(x),
> > > *.xml) для реализации прайс-лист парсера.
> >
> > не принимать прайс лист в .doc* -- ничего хорошего не выйдет. и в .txt не принимать.
> > разбор плайнтекста для выдирания оттуда табличных данных - неблагодарная задача.
> >
> > при наличии экселятины - прогнать через гем spreadsheet. шанс на автоматическую обработку повыше 80%.
>

--
--
Данное сообщение отправлено Вам, так как Вы являетесь подписчиком группы "RubyOnRails to russian" на группах Google.
FAQ группы находится по адресу: http://ru.wikibooks.org/wiki/RubyFAQ

Для того, чтобы отправить сообщение в эту группу, пошлите его по адресу
ror2ru@googlegroups.com
Чтобы отменить подписку на эту группу, отправьте сообщение по адресу: ror2ru-unsubscribe@googlegroups.com
Дополнительные варианты находятся на странице группы http://groups.google.com/group/ror2ru?hl=ru

Комментариев нет:

Отправить комментарий