shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Retirar tags html


From: César Vianna
Subject: Retirar tags html
Date: Wed, 30 Jan 2008 20:35:49 -0200

Preciso remover as tags de um html e só imprimir o texto.

cat teste.html

<tag1> abc </tag1> <tag2>
<tag3> abcdef </tag2></tag3>

Tentei com:

sed "s/<.*>\(.*\)/\1/g" teste.html

mas como o * é guloso, o resultado é vazio.

tentei assim
sed "s/<.*>\(.*\)<\/.*>/\1/g" teste.html

mas o resultado é apenas a primeira ocorrência
abc


Alguma dica?


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]