[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] procurar livro
From: |
caio ferreira |
Subject: |
Re: [shell-script] procurar livro |
Date: |
Sun, 19 Feb 2006 09:30:08 -0300 |
User-agent: |
Mozilla Thunderbird 1.0.7 (X11/20051017) |
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
MrBiTs escreveu:
> caio ferreira wrote:
> > All
>
> > Possuo uma série de livros e estou querendo catalogar os mesmo.
>
> > Para fazer o cadastramento estou utilizando o software Tellico. para
> fazer
> > o cadastramento faço a pesquisa pelo número ISBN e adiciono o livro no
> > sistema. O problema é que a maioria dos livros são em português e o
> > software consulta a base de Amazon, com isso o software não esta
> > encontrando a maioria dos livros. Mas se eu for no site da Livraria Cultura
> > e procurar no sistema de busca[1] e procurar pelo ISBN eu encontro o livro.
> > O problema é que procurar livro por livro vai demorar muito. Alguém por
> > acaso saberia me dizer se é possível:
>
> > A-acessar o site de procurar da Livraria Cultura via links2/w3m/lynxs;
> > B-passar o número ISBN para o browser;
> > C-obter o resultado;
> > D-filtrar o dado;
> > E-gravar em um arquivo;
>
> 1-http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=35CF5805&uid=
>
>
> Tá facil :)
>
> wget
> "http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=3603BB3E&uid=&parceiro=IROJOJ&bmodo=&palavratitulo=&modobuscatitulo=pc&palavraautor=&modobuscaautor=pc&palavraeditora=&palavraISBN=12345&n1n2=&cidioma=&precomax=0&ordem=disponibilidade
>
>
> Veja que o método do form de procura é um método GET simples, ou seja,
> todas as variáveis de procura são passadas na própria URL. Basta
> substituir 12345 apos ISBN= pelo ISBN que você quer e pronto.
>
> Depois disso, obviamente entra um trabalho seu de análise do código HTML
> para filtrá-lo. Para limpar as tags HTML do resultado, você pode fazer
> um sed 's/<[^>]*>//g' arquivo_resultado.html. Daí para frente, é só
> trabalho de filtar a informação.
É isso mesmo.
O problema esta sendo trabalhar com o resultado, não existe algo do tipo
"Título:O Guia do Mochileiro das Galaxia". O nome do autor aparece algumas
linhas depois da palavra Título.
Poderia enviar em anexo um arquivo que contem o resultado ?
Desde já obrigado.
- --
.''`. Caio Abreu Ferreira
: :' : GNU/Linux Debian
`. `'` fingerprint 0B5 0357 B80C E53C 5EF6 9D58 2D1B 0602 45E5 183A
`- Key ID 0x45E5183A
Linux Couter 327834
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.2 (GNU/Linux)
iD8DBQFD+GTQLRsGAkXlGDoRAtBzAKCEMUM2lcCeQMuojUE7ef5inAWHSQCdGsBM
d/Sj9PzwVvrmlwxftIqZ240=
=HL+T
-----END PGP SIGNATURE-----