shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Pegar apenas a URL


From: flavio_fsf
Subject: Re: Pegar apenas a URL
Date: Fri, 30 Sep 2011 21:51:45 -0000
User-agent: eGroups-EW/0.82


parece que vocês já resolveram o problema.
aqui eu consegui fazer o mesmo da seguinte forma:

shopt -s extglob

link="$1"
lixo=${link#http://}
lixo=${lixo%%/*}
lixo=${lixo%.??+(?)}

if [[ "$lixo" = *.*.* ]]
then
    lixo=${lixo#*.}
fi

if [[ "$lixo" = *.* ]] 
then
    lixo="${lixo%.*}."
else
    lixo="http://";
fi

link=${link#*$lixo}
link=${link%%/*}
echo "$link"


no caso ele pega um link por vez, mas da pra adapta-lo pra pegar um arquivo 
inteiro. A saída utilizando os links que você colocou no pastebin ficaria:

unix.com
blaa.com.br
claa.com.br
dlaa.com
ela.co.uk
flaa.com
glaa.com
hlaa.com
ilaa.net.jp
jlaa.net
dominio23.com

Abraços.


--- Em address@hidden, Fernando Mercês <nandu88@...> escreveu
>
> haha acho que resolve mesmo, Rodrigo. Só jogar pra um cut -d/ -f3 se
> precisar cortar endereços do tipo:
> 
> http://www.tchau.com.br
> http://www.tchau.com.br/nada/tudo/lala/lele
> 
> Ou fazer o cut antes, tanto faz, mas a tua expressão matou! ;-)
> 
> Que acha de submeter para incluir nas funcoeszz? Eu acho que isso é bem
> útil.
> 
> Abraço.
> 
> Att,
> 
> Fernando Mercês
> Linux Registered User #432779
> www.mentebinaria.com.br
> softwarelivre-rj.org
> @MenteBinaria
> ------------------------------------
> Participe do I Hack'n Rio
>                  hacknrio.org
> ------------------------------------
> 
> 
> 2011/9/30 Rodrigo Boechat <rodrigo.boechat.tenorio@...>
> 
> > **
> >
> >
> > Wow!!!
> > Sed só não faz chover porque ainda não implementaram uma função para
> > fazer água!
> > Kkkkkkkkkkkkkkkkkk
> >
> > Atualizei o PasteBin novamente. Agora acredito que todos nossos
> > problemas foram resolvidos.
> > http://pastebin.com/Fa4XYqz2
> > <http://pastebin.com/Fa4XYqz2>:) :) :)
> >
> > Agora, Fernando, diga que isso resolve, por favor!
> > :D
> >
> > Rodrigo Boechat
> >
> > Em 30-09-2011 10:02, Fernando Mercês escreveu:
> >
> > > Flavio, mas assim não funciona para, por exemplo:
> > > http://webmail.correios.com.br (deveria retornar só o domínio, sem o
> > > 'webmail'). ;-)
> > >
> > > Abraço.
> > >
> > > Att,
> > >
> > > Fernando Mercês
> > > Linux Registered User #432779
> > > www.mentebinaria.com.br
> > > softwarelivre-rj.org
> > > @MenteBinaria
> > > ------------------------------------
> > > Participe do I Hack'n Rio
> > > hacknrio.org
> > > ------------------------------------
> > >
> > >
> > > 2011/9/30 flavio_fsf<flavio.fsf.souza@...>
> > >
> > >> **
> >
> > >>
> > >>
> > >>
> > >>
> > >> estou postando novamente para corrigir um deslize meu no último post.
> > >> na segunda linha da solução que propus estava assim:
> > >>
> > >> link=${link##*www.}
> > >>
> > >> mude para:
> > >>
> > >> link=${link#*www.}
> > >>
> > >> retirando um "#" da linha.
> > >>
> > >> a mudança é para evitar problemas.
> > >>
> > >> imagine que um webmaster criou uma página com o nome "www.html".
> > >> a url completa seria algo do tipo:
> > >>
> > >> http://www.sitequalquer.com/www.html
> > >>
> > >> se usarmos a construção "${link##*www.}" , resultaria em "html".
> > >> ou seja, essa construção é mais gulosa, removeria até o ultimo "www." .
> > >>
> > >> se quiser saber mais sobre isso pesquise sobre "expansão de parâmetros"
> > no
> > >> google.
> > >>
> > >> então as três linhas ficariam:
> > >>
> > >> link="$1"
> > >> link=${link#*www.}
> > >> link=${link%%/*}
> > >>
> > >> aí sim o resultado seria "sitequalquer.com"
> > >>
> > >>
> > >> --- Em address@hidden, Fernando Mercês<nandu88@>
> > >> escreveu
> > >>> Haha, persistência é tudo, Rodrigo. Parabéns. Eu também não consegui
> > >>> resolver de maneira simples, por isso escrevi a função.
> > >>>
> > >>> Abraço.
> > >>> Em 29/09/2011 15:47, "Rodrigo Boechat"<rodrigo.boechat.tenorio@>
> > >>> escreveu:
> > >>>
> > >>>
> > >>> [As partes desta mensagem que não continham texto foram removidas]
> > >>>
> > >>
> > >>
> > >
> > > [As partes desta mensagem que não continham texto foram removidas]
> > >
> > >
> > >
> > > ------------------------------------
> >
> > >
> > > ----------------------------------------------------------
> > > Esta lista não admite a abordagem de outras liguagens de programação,
> > como perl, C etc. Quem insistir em não seguir esta regra será moderado sem
> > prévio aviso.
> > > ----------------------------------------------------------
> > > Sair da lista: address@hidden
> > > ----------------------------------------------------------
> > > Esta lista é moderada de acordo com o previsto em
> > http://www.listas-discussao.cjb.net
> > > ----------------------------------------------------------
> > > Servidor Newsgroup da lista: news.gmane.org
> > > Grupo: gmane.org.user-groups.programming.shell.brazil
> > >
> > > Links do Yahoo! Grupos
> >
> > >
> > >
> > >
> >
> > [As partes desta mensagem que não continham texto foram removidas]
> >
> >  
> >
> 
> 
> [As partes desta mensagem que não continham texto foram removidas]
>




reply via email to

[Prev in Thread] Current Thread [Next in Thread]