shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] Selecionar arquivos duplicados


From: Eri Ramos Bastos
Subject: Re: [shell-script] Selecionar arquivos duplicados
Date: Thu, 30 Apr 2009 09:38:42 -0300

Deve ter jeito melhor, mas esse funciona:

$ cat asdf
e07be9609b0ac4975722916bb3da47f5  ./GBM/cebola/cebola superex 1.ppt
e07be9609b0ac4975722916bb3da47f5  ./GBM/cenoura/cenoura superex 1.ppt
0bd338fddc4edc627f95eca0f78e96df  ./GBM/cebola/cebola2002.ppt
3445c95f79bd8979c97d8947133e0d20  ./GBM/cebola/cebola2002b.ppt
119c574defe4648ca8d96d0857763980  ./GBM/cebola/resultados monte alto.xls
4a73f4cdf550a3dc76e2c95308bcf69b  ./GBM/cebola/resultados vista alegre.xls
3445c95f79bd8979c97d8947133e0d20  ./GBM/batata/cebola2002b.ppt

$  sort -k1d asdf |awk '{print $2 " "$1}'|uniq -f1 -D
./GBM/batata/cebola2002b.ppt 3445c95f79bd8979c97d8947133e0d20
./GBM/cebola/cebola2002b.ppt 3445c95f79bd8979c97d8947133e0d20
./GBM/cebola/cebola e07be9609b0ac4975722916bb3da47f5
./GBM/cenoura/cenoura e07be9609b0ac4975722916bb3da47f5


[]'s
Eri Ramos Bastos

2009/4/30 Cristiano Ferrari <address@hidden>:
> Ilustres, bom dia.
>
> Estou fazendo uma faxina em meu servidor de arquivos e comecei por remover 
> arquivos duplicados. Tipo aqueles que um usuário manda por e-mail para toda a 
> empresa e 95% dos funcionários acham que precisam gravar uma cópia deles em 
> sua pasta particular, "por precaução".
>
> Como os nomes podem variar para o mesmo conteúdo, criei um script que gera um 
> hash MD5 de todos os arquivos. A saída dele é uma lista parecida com isto:
>
> e07be9609b0ac4975722916bb3da47f5  ./GBM/cebola/cebola superex 1.ppt
> 0bd338fddc4edc627f95eca0f78e96df  ./GBM/cebola/cebola2002.ppt
> 3445c95f79bd8979c97d8947133e0d20  ./GBM/cebola/cebola2002b.ppt
> 119c574defe4648ca8d96d0857763980  ./GBM/cebola/resultados monte alto.xls
> 4a73f4cdf550a3dc76e2c95308bcf69b  ./GBM/cebola/resultados vista alegre.xls
>
> Agora, preciso ordenar esta lista pelo hash. Porém eu gostaria, depois de 
> ordenado, te ter uma listagem apenas com os arquivos que possuem o mesmo 
> hash. Dá para fazer isso com facilidade usando o recurso de tabela dinâmica 
> do excel.
>
> Mas... eu queria aprender a fazer em shell.
>
> Alguma idéia?
>
>
>
>
> ------------------------------------
>
> ---------------------------------------------------------------------
> Esta lista não admite a abordagem de outras liguagens de programação, como 
> perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio 
> aviso.
> ---------------------------------------------------------------------
> Sair da lista: address@hidden
> ---------------------------------------------------------------------
> Esta lista é moderada de acordo com o previsto em 
> http://www.listas-discussao.cjb.net
> ---------------------------------------------------------------------
> Servidor Newsgroup da lista: news.gmane.org
> Grupo: gmane.org.user-groups.programming.shell.brazil
>
> Links do Yahoo! Grupos
>
>
>


reply via email to

[Prev in Thread] Current Thread [Next in Thread]