[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Script pega endereço (link) em página HTTP
From: |
podestafox |
Subject: |
Script pega endereço (link) em página HTTP |
Date: |
Fri, 28 Nov 2008 05:01:07 -0000 |
User-agent: |
eGroups-EW/0.82 |
Olá pessoal, o que estou tentando fazer e não obtive sucesso, foi
criar um script, que procure em uma página na internet, uma
determinada URL. Tentei em Python. Mas não gerava certo pois o link
que quero extrair fica em uma tag JAVASCRIPT e simplesmente não
carregava corretamente.
Por exemplo:
# Envia o comando para ler o banco de links à procurar
~$ ./script-busca-link links.txt
# Neste arquivo "links.txt", eu tenho a lista de páginas. Exemplo
http://www.site.com/8767899098
http://www.site.com/8767899345
http://www.site.com/8767899567
http://www.site.com/8767891233
É nestas páginas que ele vai procurar o link no código fonte. E que
começa com http:// e termina com .flv ou .mp4 o link que quero
extrair. Exemplo:
<script>url_param='http://92837928374/9823748723.flv';<script>
E vai gravar em um outro arquivo com o nome de baixarconteudo.txt o
link de cada página buscada >> exemplo:
http://92837928374/9823748723.flv
http://92837928374/982374asdsa8723.flv
Tentei usar o wget para baixar a página em html para o /tmp
O find para buscar o html depois de baixa-lo
O grep para procurar dentro do html: http://*.(flv|mp4)
e passar para o /tmp/baixarconteudo.txt com >>
Alguém sabe como fazer a mágica acontecer?
- Script pega endereço (link) em página HTTP,
podestafox <=