Re: Script pega endereço (link) em página HTTP

shell-script-pt

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Script pega endereço (link) em página HTTP

From:	marlon_mca
Subject:	Re: Script pega endereço (link) em página HTTP
Date:	Mon, 01 Dec 2008 18:25:43 -0000
User-agent:	eGroups-EW/0.82

Amigo, 
tenta isso:

for ARQUIVO in pagina[1234].html
do
        tr '\n' ' ' < "$ARQUIVO" |
                awk 'gsub("<[^/]", "\n&")' |
                fgrep -i ">$TEXTO</a>" |
                tr A-Z a-z |
                tr -d \" |
                sed 's/.*href=// ; s/>.*//'
done

Marlon

--- Em address@hidden, "podestafox" <podestafox@...>
escreveu
>
> Olá pessoal, o que estou tentando fazer e não obtive sucesso, foi
> criar um script, que procure em uma página na internet, uma
> determinada URL. Tentei em Python. Mas não gerava certo pois o link
> que quero extrair fica em uma tag JAVASCRIPT e simplesmente não
> carregava corretamente.
> 
> Por exemplo:
> 
> # Envia o comando para ler o banco de links à procurar
> ~$ ./script-busca-link links.txt
> 
> # Neste arquivo "links.txt", eu tenho a lista de páginas. Exemplo
> http://www.site.com/8767899098
> http://www.site.com/8767899345
> http://www.site.com/8767899567
> http://www.site.com/8767891233
> 
> É nestas páginas que ele vai procurar o link no código fonte. E que
> começa com http://  e termina com .flv ou .mp4 o link que quero
> extrair. Exemplo:
> 
> <script>url_param='http://92837928374/9823748723.flv';<script>
> 
> 
> E vai gravar em um outro arquivo com o nome de baixarconteudo.txt o
> link de cada página buscada >> exemplo:
> 
> http://92837928374/9823748723.flv
> http://92837928374/982374asdsa8723.flv
> 
> Tentei usar o wget para baixar a página em html para o /tmp
> O find para buscar o html depois de baixa-lo
> O grep para procurar dentro do html: http://*.(flv|mp4)
> e passar para o /tmp/baixarconteudo.txt com >>
> 
> Alguém sabe como fazer a mágica acontecer?
>

[Prev in Thread]

Current Thread

[Next in Thread]

Re: Script pega endereço (link) em página HTTP, marlon_mca <=

Prev by Date: Re: [shell-script] Re: Script pega endereço (link) em página HTTP
Next by Date: [OT] Contador
Previous by thread: Re: [shell-script] Re: Script pega endereço (link) em página HTTP
Next by thread: [OT] Contador
Index(es):
- Date
- Thread