[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Dados parcialmente duplicados
From: |
Eri Ramos Bastos |
Subject: |
Re: Dados parcialmente duplicados |
Date: |
Thu, 25 Jun 2009 17:07:42 -0300 |
Desculpa pessoal,
Quis facilitar e acabei complicando.
O que tá lá no pastebin é o arquivo do jeito que tenho hoje.
O exemplo que coloquei no corpo do email é o output esperado do script
ao tratar o arquivo lá do pastebin
Expliquei? :)
[]'s
Eri
2009/6/25 Eri Ramos Bastos <address@hidden>:
> Olá, lista
>
> Estou tentando encontrar dados parcialmente duplicados num arquivo,
> mas estou levando uma boa surra.
> Foi bem fácil encontrar os totalmente duplicados usando sort e awk,
> mas não consigo extrair os parcialmente duplicados.
>
> Os dados estão nesse formato aqui: http://pastebin.com/m79c990bf
>
> O que eu quero saber é quais dados estão sendo repetidos na primeira,
> segunda e última coluna, mas são únicos na terceira coluna. Preciso
> contar esses dados baseado na segunda coluna, de forma que no arquivo
> exemplo o resultado do script seria:
>
> $ ./script raw-file.txt
> 6361 34662277560 46606975 2
> 6361 36612632553 46606975 2
> 6361 36620505642 46606975 2
>
>
> Alguma dica?
>
> []'s
> Eri
>