Oi Bruno,
Sim os "ids" dos divs são específicos.
Respondi na minha própria mensagem porque tem o exemplo simplificado em
baixo, um exemplo do texto original seria esta página:
http://g1.globo.com/Noticias/0,,MUL9810-5603-1853,00.html
e manda salvar como... ou abre direto o código fonte. Por exemplo nesta
página eu quero apagar os tags:
<div id="glbBarra"
<div id="lateral">
O exemplo abaixo deveria servir para testes, acho que contém todos os
casos encontrados
Espero encontrar uma solução sem ter que escrever um programa sm C...
Alain
Alain M. escreveu:
Ok, Bruno, não fui claro novamente, vou tentar de novo
Na página, tem vários tags quecomeçam com "<div" eu quero tirar uma
delas, no meu exemplo a que começa com '<div id="Label"' até o "</div>"
*correspondente*.
Só que dentro desse div tem outro div, então tem que achar o
correspondente, independentemente de quantos tem aninhados dentro.
Alain
Bruno Gunter Fricke escreveu:
Alain,
Você precisa encontrar um ponto em comum em seu texto para usar o sed.
Você quer manter algumas "divs" e outras não. Não tem como fazer o que você
deseja se não for informado exatamente o que você precisa cortar do texto.
Agradeço pelas dicas, mas acho que me expliquei mal.
Dica do Tiago: sed '/^<div/,/^<\/div/d' arquivo
Dica do Flavio: tr '\n' '#' < txt | sed 's/<.*>//' | tr '#' '\n'
Na verdade eu quero é tirar um TAG específico no meio de uma página
grande em html. Refiz meu exemplo para ficar mais claro, eu preciso
tirar o TAG que começa com: <div id="Label"
-----Original-----
texto que fica <div class="Lxx">também fica</div>
<div id="Label" class="x1024">
mais texto
<div class="Label2"></div>
lixo</div>
mais um que fica <div class="Lyy">ficante ídem</div>
-----editado------
texto que fica <div class="Lxx">também fica</div>
mais um que fica <div class="Lyy">ficante ídem</div>
Só por curiosidade, a idéia é limpar páginas para ler offline no Palm.
Por exemplo:
http://g1.globo.com/Noticias/0,,MUL9810-5603-1853,00.html
Mais uma vez, grato,
Alain
---------------------------------------------------------------------
Esta lista não admite a abordagem de outras liguagens de programação, como
perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio
aviso.
---------------------------------------------------------------------
Sair da lista: address@hidden
---------------------------------------------------------------------
Esta lista é moderada de acordo com o previsto em
http://www.listas-discussao.cjb.net
---------------------------------------------------------------------
Servidor Newsgroup da lista: news.gmane.org
Grupo: gmane.org.user-groups.programming.shell.brazil
Links do Yahoo! Grupos