shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] trabalhar com pdf


From: Valtoir
Subject: Re: [shell-script] trabalhar com pdf
Date: Wed, 13 Feb 2013 19:03:11 -0200

Petterson, li que já finalizaste o download do pdf, mas talvez queiras dar
uma olhada (até para melhorá-lo) no script que fiz já há um bom tempo, para
isso. Nem sei se ainda roda, mas acho que sim.

http://www.vivaolinux.com.br/script/Diario-Oficial-da-Uniao-Download-facilitado

T+

Valtoir


Em 13 de fevereiro de 2013 17:47, Petterson Faria <
address@hidden> escreveu:

> Eles podiam ter um webservice e tal.
> Mas estou dando uma olhada no que aproveitar da busca deles...
>
> http://pesquisa.in.gov.br/imprensa/core/start.action
>
>
> --
> Atenciosamente,
> *Petterson Faria*
>
> "Há momentos em que a maior sabedoria, é parecer não saber nada" (Sun Tzu)
>
>
>
> 2013/2/13 Tiago Peczenyj <address@hidden>
>
> > **
> >
> >
> > agradeça ao governo q não libera um formato mais simples de ler como...
> txt
> >
> > mas processar PDF é realmente uma tarefa herculea. vc tem sorte, poderiam
> > ser apenas scans.
> >
> > 2013/2/13 Petterson Faria address@hidden>
> >
> >
> > > Estava testando esse agora.
> > > Converteu "legal"
> > > A codificação aceita parametros "Latin1, UTF-8, etc"
> > > Vou fazer uns testes e ver como fica.
> > >
> > > Percebi que ele pega um "bloco" e joga tudo em uma linha.
> > > Ou seja, terei que abusar nos cuts
> > >
> > >
> > > --
> > > Atenciosamente,
> > > *Petterson Faria*
> >
> > >
> > > "Há momentos em que a maior sabedoria, é parecer não saber nada" (Sun
> > Tzu)
> > >
> > >
> > >
> > > 2013/2/13 Jorge Barros de Abreu address@hidden>
> > >
> > > > **
> >
> > > >
> > > >
> > > > Sugiro o pdftotext.
> > > >
> > > > Converta em um arquivo temporário tipo texto puro e faça a busca
> nele.
> > > >
> > > > Verifique como é que ele trata a acentuação.
> > > >
> > > > Até.
> > > > --
> > > > Data Estelar 2456334,335787
> > > > http://sites.google.com/site/ficmatinf
> > > > Desejo-lhe Paz, Vida Longa e Prosperidade.
> > > > São Bem Vindas Mensagens no Formato texto UTF-8 com Acentos.
> > > >
> > > >
> > >
> > >
> > > [As partes desta mensagem que não continham texto foram removidas]
> > >
> > >
> > >
> > > ------------------------------------
> >
> > >
> > > ----------------------------------------------------------
> > > Esta lista não admite a abordagem de outras liguagens de programação,
> > como
> > > perl, C etc. Quem insistir em não seguir esta regra será moderado sem
> > > prévio aviso.
> > > ----------------------------------------------------------
> > > Sair da lista: address@hidden
> >
> > > ----------------------------------------------------------
> > > Esta lista é moderada de acordo com o previsto em
> > > http://www.listas-discussao.cjb.net
> > > ----------------------------------------------------------
> > > Servidor Newsgroup da lista: news.gmane.org
> > > Grupo: gmane.org.user-groups.programming.shell.brazil
> > >
> > > Links do Yahoo! Grupos
> > >
> > >
> > >
> >
> > --
> > Tiago B. Peczenyj
> > Linux User #405772
> >
> > http://about.me/peczenyj
> >
> > [As partes desta mensagem que não continham texto foram removidas]
> >
> >
> >
>
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>
>
> ------------------------------------
>
> ---------------------------------------------------------------------
> Esta lista não admite a abordagem de outras liguagens de programação, como
> perl, C etc. Quem insistir em não seguir esta regra será moderado sem
> prévio aviso.
> ---------------------------------------------------------------------
> Sair da lista: address@hidden
> ---------------------------------------------------------------------
> Esta lista é moderada de acordo com o previsto em
> http://www.listas-discussao.cjb.net
> ---------------------------------------------------------------------
> Servidor Newsgroup da lista: news.gmane.org
> Grupo: gmane.org.user-groups.programming.shell.brazil
>
> Links do Yahoo! Grupos
>
>
>


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]