|
From: | Janduy Euclides |
Subject: | Re: [shell-script] Re: Extração de dados em HTML |
Date: | Wed, 10 May 2017 08:22:43 -0300 |
Caro Andre
Se não pode usar um dos browsers em modo texto ou html2text,
talvez possa usar com awk:
awk '/user\./ {printf $0;for(i=1;i<=4;i++) getline; print}' arquivo.html | sed 's/^[[:blank:]]*//;s/[[:blank:]]*$//;s/<[^>]*>//g;s/[[: blank:]]\{2,\}/ /g'
ou sed:
sed -n '/user\./{N;N;N;N;s/\n//g;p}' arquivo.html | sed 's/^[[:blank:]]*//;s/[[:blank:]]*$//;s/<[^>]*>//g;s/[[: blank:]]\{2,\}/ /g'
Foi isso que entendi, isso serve?
[]'s
Itamar
[Prev in Thread] Current Thread [Next in Thread]
- Extração de dados em HTML, andrelucio . fc, 2017/05/09
- Re: [shell-script] Extração de dados em HTML, Julio C. Neves, 2017/05/09
- Re: Extração de dados em HTML, andrelucio . fc, 2017/05/09
- Re: [shell-script] Extração de dados em HTML, Julio C. Neves, 2017/05/09
- Re: Extração de dados em HTML, andrelucio . fc, 2017/05/09
- Re: [shell-script] Re: Extração de dados em HTML, Fernando Mercês, 2017/05/09
- Re: [shell-script] Re: Extração de dados em HTML, Alfredo Casanova, 2017/05/09
- Re: Extração de dados em HTML, andrelucio . fc, 2017/05/10
- Re: Extração de dados em HTML, itamarnet, 2017/05/09
- Re: [shell-script] Re: Extração de dados em HTML, Janduy Euclides <=
- Re: [shell-script] Re: Extração de dados em HTML, itamarnet, 2017/05/10
- Re: [shell-script] Re: Extração de dados em HTML, Janduy Euclides, 2017/05/10
- Re: Extração de dados em HTML, andrelucio . fc, 2017/05/10
- Re: [shell-script] Re: Extração de dados em HTML, phfbettega, 2017/05/11
Re: [shell-script] Extração de dados em HTML, phfbettega, 2017/05/09
- Prev by Date: Re: [shell-script] Extração de dados em HTML
- Next by Date: Re: [shell-script] Re: Extração de dados em HTML
- Previous by thread: Re: Extração de dados em HTML
- Next by thread: Re: [shell-script] Re: Extração de dados em HTML
- Index(es):