[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Retirar tags html
From: |
César Vianna |
Subject: |
Retirar tags html |
Date: |
Wed, 30 Jan 2008 20:35:49 -0200 |
Preciso remover as tags de um html e só imprimir o texto.
cat teste.html
<tag1> abc </tag1> <tag2>
<tag3> abcdef </tag2></tag3>
Tentei com:
sed "s/<.*>\(.*\)/\1/g" teste.html
mas como o * é guloso, o resultado é vazio.
tentei assim
sed "s/<.*>\(.*\)<\/.*>/\1/g" teste.html
mas o resultado é apenas a primeira ocorrência
abc
Alguma dica?
[As partes desta mensagem que não continham texto foram removidas]
- Retirar tags html,
César Vianna <=