[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Re: Dados parcialmente duplicados
From: |
Fabiano Caixeta Duarte |
Subject: |
Re: [shell-script] Re: Dados parcialmente duplicados |
Date: |
Fri, 26 Jun 2009 07:54:19 -0300 |
2009/6/25 Eri Ramos Bastos <address@hidden>:
> Vamos lá:
>
> O arquivo original é esse: http://pastebin.com/m79c990bf
>
> Cada entrada contém 4 campos, separados em colunas. ex:
>
> 6361 37881605748 C-770860 46606975
>
> Cada entrada pode ser única:
>
> $ sort arquivo |uniq |wc -l
> 26
>
> Pode ser totalmente duplicada:
>
> $ sort arquivo |uniq -d|wc -l
> 7
>
> Ou pode as colunas 1, 2 e 4 serem iguais e a coluna 3 diferente. E é
> nisso que estou interessado. (**)
>
> O exemplo que mandei no corpo mandar o resultado após a execução do
> script, onde:
>
> 6361 34662277560 46606975 2
>
> 6361 -> coluna 1 do arquivo original
> 34662277560 -> coluna 2 do arquivo original
> 46606975 -> coluna 3 do arquivo original
> 2 -> número de vezes que (**) aconteceu
>
> A solução do Fabiano é muito parecida com a que eu cheguei, mas não é
> isso ainda, pois também conta os que todos os campos são iguais, que
> pra mim não interessa.
>
> []'s
> Eri
Isto não havia sido dito na descrição original do problema ;)
sort arquivo | uniq | awk '{print $1,$2,$4}' | uniq -c
--
Fabiano Caixeta Duarte
Especialista em Redes de Computadores
Linux User #195299
Ribeirão Preto - SP