[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Editar HTML com SED
From: |
mop |
Subject: |
Re: [shell-script] Editar HTML com SED |
Date: |
Tue, 03 Apr 2007 23:01:40 -0300 |
Considerando que minha bola não foi muito fora, me atrevo a dizer que
talvez haja um lugar melhor para você pegar a informação desejada.
Normalmente páginas de notÃcias têm links para news feeder correspondente,
identificados como rss, xml, etc. Embora haja algumas diferenças sutis entre
formatos, um único script poderá tratar todos. Bastará você passar um
único parâmetro, o endereço do feeder. Além disso, por ser algo padronizado,
não depende da fonte.
Veja no topo da página que usei como exemplo o link RSS. O canal de news
correspondente é:
http://g1.globo.com/Rss2/0,,AS0-6174,00.xml
Veja o código dela, será uma barbada.
Se eu entendi bem, você quer ir um nÃvel além dessa página, possivelmente
o que você quer a a própria página da notÃcia. Você consegue isso
brincando, usando esses canais especÃficos e um script bem simples. A ordem
é cronológica reversa, quer dizer, você vai baixando até encontrar o
primeiro link já baixado anteriormente, podendo abortar imediatamente o
processo.
Se não existir um canal rss com o que quer, realmente vai ter de garimpar na
página.
Boa diversão para shell e conectividade.
Sucesso!
------------------------------------------------------------------
>From: "Alain M." <address@hidden>
>O objetivo era perto disso, tanto que tua dica vai me ajudar. Eu quero
>pegar outra parte da tela e as telas seguintes... Já tenho algo
>funcionando, vou enviar em seguida, para quem interessar
- Re: [shell-script] Editar HTML com SED,
mop <=