|
From: | Alain M. |
Subject: | Re: [shell-script] Editar HTML com SED |
Date: | Mon, 12 Mar 2007 11:03:01 -0300 |
User-agent: | Thunderbird 1.5.0.7 (X11/20060909) |
Oi Bruno, Sim os "ids" dos divs são específicos.Respondi na minha própria mensagem porque tem o exemplo simplificado em baixo, um exemplo do texto original seria esta página:
http://g1.globo.com/Noticias/0,,MUL9810-5603-1853,00.htmle manda salvar como... ou abre direto o código fonte. Por exemplo nesta página eu quero apagar os tags:
<div id="glbBarra" <div id="lateral">O exemplo abaixo deveria servir para testes, acho que contém todos os casos encontrados
Espero encontrar uma solução sem ter que escrever um programa sm C... Alain Alain M. escreveu:
Ok, Bruno, não fui claro novamente, vou tentar de novoNa página, tem vários tags quecomeçam com "<div" eu quero tirar uma delas, no meu exemplo a que começa com '<div id="Label"' até o "</div>" *correspondente*.Só que dentro desse div tem outro div, então tem que achar o correspondente, independentemente de quantos tem aninhados dentro.Alain Bruno Gunter Fricke escreveu:Alain, Você precisa encontrar um ponto em comum em seu texto para usar o sed. Você quer manter algumas "divs" e outras não. Não tem como fazer o que você deseja se não for informado exatamente o que você precisa cortar do texto. Agradeço pelas dicas, mas acho que me expliquei mal. Dica do Tiago: sed '/^<div/,/^<\/div/d' arquivo Dica do Flavio: tr '\n' '#' < txt | sed 's/<.*>//' | tr '#' '\n'Na verdade eu quero é tirar um TAG específico no meio de uma página grande em html. Refiz meu exemplo para ficar mais claro, eu preciso tirar o TAG que começa com: <div id="Label"-----Original----- texto que fica <div class="Lxx">também fica</div> <div id="Label" class="x1024"> mais texto <div class="Label2"></div> lixo</div> mais um que fica <div class="Lyy">ficante ídem</div> -----editado------ texto que fica <div class="Lxx">também fica</div> mais um que fica <div class="Lyy">ficante ídem</div>Só por curiosidade, a idéia é limpar páginas para ler offline no Palm. Por exemplo:http://g1.globo.com/Noticias/0,,MUL9810-5603-1853,00.html Mais uma vez, grato, Alain
[Prev in Thread] | Current Thread | [Next in Thread] |