shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] trabalhar com pdf


From: Petterson Faria
Subject: Re: [shell-script] trabalhar com pdf
Date: Wed, 13 Feb 2013 20:01:48 -0200

Um amigo chegou a me passar, mas parece que a url base mudou.
baixei o script, "passei o olho" no fonte e rodei.
Valeu, qualquer coisa amanhã vejo com calma.


--
Atenciosamente,
*Petterson Faria*

"Há momentos em que a maior sabedoria, é parecer não saber nada" (Sun Tzu)



2013/2/13 Valtoir <address@hidden>

> **
>
>
> Petterson, li que já finalizaste o download do pdf, mas talvez queiras dar
> uma olhada (até para melhorá-lo) no script que fiz já há um bom tempo, para
> isso. Nem sei se ainda roda, mas acho que sim.
>
>
> http://www.vivaolinux.com.br/script/Diario-Oficial-da-Uniao-Download-facilitado
>
> T+
>
> Valtoir
>
> Em 13 de fevereiro de 2013 17:47, Petterson Faria <
> address@hidden> escreveu:
>
>
> > Eles podiam ter um webservice e tal.
> > Mas estou dando uma olhada no que aproveitar da busca deles...
> >
> > http://pesquisa.in.gov.br/imprensa/core/start.action
> >
> >
> > --
> > Atenciosamente,
> > *Petterson Faria*
> >
> > "Há momentos em que a maior sabedoria, é parecer não saber nada" (Sun
> Tzu)
> >
> >
> >
> > 2013/2/13 Tiago Peczenyj address@hidden>
> >
> > > **
>
> > >
> > >
> > > agradeça ao governo q não libera um formato mais simples de ler como...
> > txt
> > >
> > > mas processar PDF é realmente uma tarefa herculea. vc tem sorte,
> poderiam
> > > ser apenas scans.
> > >
> > > 2013/2/13 Petterson Faria address@hidden>
> > >
> > >
> > > > Estava testando esse agora.
> > > > Converteu "legal"
> > > > A codificação aceita parametros "Latin1, UTF-8, etc"
> > > > Vou fazer uns testes e ver como fica.
> > > >
> > > > Percebi que ele pega um "bloco" e joga tudo em uma linha.
> > > > Ou seja, terei que abusar nos cuts
> > > >
> > > >
> > > > --
> > > > Atenciosamente,
> > > > *Petterson Faria*
> > >
> > > >
> > > > "Há momentos em que a maior sabedoria, é parecer não saber nada" (Sun
> > > Tzu)
> > > >
> > > >
> > > >
> > > > 2013/2/13 Jorge Barros de Abreu address@hidden>
> > > >
> > > > > **
> > >
> > > > >
> > > > >
> > > > > Sugiro o pdftotext.
> > > > >
> > > > > Converta em um arquivo temporário tipo texto puro e faça a busca
> > nele.
> > > > >
> > > > > Verifique como é que ele trata a acentuação.
> > > > >
> > > > > Até.
> > > > > --
> > > > > Data Estelar 2456334,335787
> > > > > http://sites.google.com/site/ficmatinf
> > > > > Desejo-lhe Paz, Vida Longa e Prosperidade.
> > > > > São Bem Vindas Mensagens no Formato texto UTF-8 com Acentos.
> > > > >
> > > > >
> > > >
> > > >
> > > > [As partes desta mensagem que não continham texto foram removidas]
> > > >
> > > >
> > > >
> > > > ------------------------------------
> > >
> > > >
> > > > ----------------------------------------------------------
> > > > Esta lista não admite a abordagem de outras liguagens de programação,
> > > como
> > > > perl, C etc. Quem insistir em não seguir esta regra será moderado sem
> > > > prévio aviso.
> > > > ----------------------------------------------------------
> > > > Sair da lista: address@hidden
> > >
> > > > ----------------------------------------------------------
> > > > Esta lista é moderada de acordo com o previsto em
> > > > http://www.listas-discussao.cjb.net
> > > > ----------------------------------------------------------
> > > > Servidor Newsgroup da lista: news.gmane.org
> > > > Grupo: gmane.org.user-groups.programming.shell.brazil
> > > >
> > > > Links do Yahoo! Grupos
> > > >
> > > >
> > > >
> > >
> > > --
> > > Tiago B. Peczenyj
> > > Linux User #405772
> > >
> > > http://about.me/peczenyj
> > >
> > > [As partes desta mensagem que não continham texto foram removidas]
> > >
> > >
> > >
> >
> >
> > [As partes desta mensagem que não continham texto foram removidas]
> >
> >
> >
> > ------------------------------------
> >
> > ----------------------------------------------------------
> > Esta lista não admite a abordagem de outras liguagens de programação,
> como
> > perl, C etc. Quem insistir em não seguir esta regra será moderado sem
> > prévio aviso.
> > ----------------------------------------------------------
> > Sair da lista: address@hidden
> > ----------------------------------------------------------
> > Esta lista é moderada de acordo com o previsto em
> > http://www.listas-discussao.cjb.net
> > ----------------------------------------------------------
> > Servidor Newsgroup da lista: news.gmane.org
> > Grupo: gmane.org.user-groups.programming.shell.brazil
> >
> > Links do Yahoo! Grupos
> >
> >
> >
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>  
>


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]