[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Re: Dados parcialmente duplicados
From: |
Eri Ramos Bastos |
Subject: |
Re: [shell-script] Re: Dados parcialmente duplicados |
Date: |
Thu, 25 Jun 2009 19:19:11 -0300 |
Vamos lá:
O arquivo original é esse: http://pastebin.com/m79c990bf
Cada entrada contém 4 campos, separados em colunas. ex:
6361 37881605748 C-770860 46606975
Cada entrada pode ser única:
$ sort arquivo |uniq |wc -l
26
Pode ser totalmente duplicada:
$ sort arquivo |uniq -d|wc -l
7
Ou pode as colunas 1, 2 e 4 serem iguais e a coluna 3 diferente. E é
nisso que estou interessado. (**)
O exemplo que mandei no corpo mandar o resultado após a execução do
script, onde:
6361 34662277560 46606975 2
6361 -> coluna 1 do arquivo original
34662277560 -> coluna 2 do arquivo original
46606975 -> coluna 3 do arquivo original
2 -> número de vezes que (**) aconteceu
A solução do Fabiano é muito parecida com a que eu cheguei, mas não é
isso ainda, pois também conta os que todos os campos são iguais, que
pra mim não interessa.
[]'s
Eri
2009/6/25 César A. K. Grossmann <address@hidden>:
> --- Em address@hidden, Eri Ramos Bastos <bastos.eri@...> escreveu
>>
>> Expliquei? :)
>>
>
> Não suficientemente. A gente está tendo que adivinhar o que você quer.
>
> Diz aí, você quer que o script trabalhe com o arquivo original ou com uma
> versão do arquivo sem o campo 3, por exemplo?
>
> O último campo da saída tem o número 2, o que é este número?
>