shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] procurar livro


From: MrBiTs
Subject: Re: [shell-script] procurar livro
Date: Sun, 19 Feb 2006 07:11:09 -0300
User-agent: Thunderbird 1.5 (X11/20051201)

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

caio ferreira wrote:
>       All
> 
>       Possuo uma série de livros e estou querendo catalogar os mesmo.
> 
>       Para fazer o cadastramento estou utilizando o software Tellico. para 
> fazer
> o cadastramento faço a pesquisa pelo número ISBN e adiciono o livro no
> sistema. O problema é que a maioria dos livros são em português e o
> software consulta a base de Amazon, com isso o software não esta
> encontrando a maioria dos livros. Mas se eu for no site da Livraria Cultura
> e procurar no sistema de busca[1] e procurar pelo ISBN eu encontro o livro.
> O problema é que procurar livro por livro vai demorar muito. Alguém por
> acaso saberia me dizer se é possível:
> 
> A-acessar o site de procurar da Livraria Cultura via links2/w3m/lynxs;
> B-passar o número ISBN para o browser;
> C-obter o resultado;
> D-filtrar o dado;
> E-gravar em um arquivo;
> 
>       Alguém por acaso teria alguma idéia de como eu poderia fazer isso ?
> 
>       Desde já obrigado.
> 
> 1-http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=35CF5805&uid=

Tá facil :)

wget
"http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=3603BB3E&uid=&parceiro=IROJOJ&bmodo=&palavratitulo=&modobuscatitulo=pc&palavraautor=&modobuscaautor=pc&palavraeditora=&palavraISBN=12345&n1n2=&cidioma=&precomax=0&ordem=disponibilidade
"

Veja que o método do form de procura é um método GET simples, ou seja,
todas as variáveis de procura são passadas na própria URL. Basta
substituir 12345 apos ISBN= pelo ISBN que você quer e pronto.

Depois disso, obviamente entra um trabalho seu de análise do código HTML
 para filtrá-lo. Para limpar as tags HTML do resultado, você pode fazer
um sed 's/<[^>]*>//g' arquivo_resultado.html. Daí para frente, é só
trabalho de filtar a informação.

[]'s


- --
GPG Public Key
http://keyserver.veridis.com:11371/export?id=-6037232142263389818

         \\|||//
         (.) (.)
- ----ooOO--( )--OOoo-----
      MrBiTs
http://www.mrbits.com.br
  address@hidden
- ------------------------
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.1 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFD+EQ8rDdxWm3R8YYRAqPzAJ4x9gtia5VSyoyx7UZ5aO9hwHwwSwCaAkeS
o0RgCMj2FqIBhEPHX0j8v7Q=
=5vjc
-----END PGP SIGNATURE-----


reply via email to

[Prev in Thread] Current Thread [Next in Thread]