[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Tratamento de texto
From: |
Sérgio Roberto |
Subject: |
Tratamento de texto |
Date: |
Thu, 15 Feb 2007 08:29:26 -0300 |
User-agent: |
Thunderbird 1.5.0.9 (Windows/20061207) |
Bom dia,
Estou com um problema e gostaria de obter ajuda dos colegas da lista.
Eu recebo mensalmente um arquivo contendo todas as normas de um
determinado tribunal federal, em formato texto. São jurisprudências.
É um arquivo de 190 MB (de texto) que quando é atualizado é remetido
integralmente de novo para mim. Logo, esses 190 MB crescem mês à mês.
Pelas contas há cerca de 500.000 normas dentro deste arquivo.
Eu desenvolvi um script para quebrar esse arquivo em várias partes
menores, com 2 MBs, para que eu pudesse comparar as alterações
nas normas, usando o comando "split" dentro do Shell Script. Contudo,
observei que é há uma linha em particular dentro desse arquivo:
" *** Quebra de Registro *** "
Então, tive a idéia de quebrar esse arquivo de 190 MB não em partes
iguais de 2 MB mas por normas. Ou seja, cada vez que o script
encontrar a linha acima, ele irá gerar um novo arquivo em determinado
diretório. Gostaria de uma ajuda para começar a fazer isso já que
ainda não entendi muito bem como o shell script funcionaria neste
caso.
Sds
Sérgio
_______________________________________________________________________
Essa mensagem é destinada exclusivamente ao seu destinatário e pode
conter informações confidenciais, protegidas por sigilo profissional ou
cuja divulgação seja proibida por lei. O uso não autorizado de tais
informações é proibido e está sujeito às penalidades cabíveis.
This message is intended exclusively for its addressee and may contain
information that is confidential and protected by a professional
privilege or whose disclosure is prohibited by law. Unauthorized use of
such information is prohibited and subject to applicable penalties.
[As partes desta mensagem que não continham texto foram removidas]
- Tratamento de texto,
Sérgio Roberto <=