|
From: | Luiz Roberto Ferreira |
Subject: | Re: [shell-script] Problema com arquivo muito grande |
Date: | Sat, 26 Apr 2014 23:27:06 -0300 |
Galera bom dia,Estou fazendo um script para limpar uma base de números. Porém o arquivo que consta os números em blacklist é muito grande e tem quase 3 milhões de linhas. Fiz um script que usa o SED para dividir esse arquivo em partes, armazenar em uma variável e após usa o AWK para procurar ocorrências e limpar o segundo arquivo.Estou passando pelo seguinte problema, quando divido o arquivo em mil linhas tenho o seguinte erro:awk: line 1: runaway regular _expression_ / 551195116 ...Com cem mil linhas:./limpa_base.sh: line 27: /usr/bin/awk: Argument list too longAgradeco desde já pela ajuda.Segue o script:#!/bin/bashwork=$(wc -l /bkp/limpabase/blacklist)last=$(echo $work | cut -d' ' -f 1)dir=/bkp/limpabaseinput=$dir/blacklist# Incluir numeros a basefind /home/mnt/limpabase/baselimpa.csv -mtime +1 -exec rm -Rf '{}' \; 2> /dev/null;if [ -s $dir/inclusao ]thenmv $dir/inclusao $dir/inclusao.tmp;cat $dir/inclusao.tmp >> $dir/blacklist;rm -f $dir/inclusao.tmp;fiif [ -s $dir/broadcast ]; theni=1f=100000mv $dir/broadcast $dir/broadcast.tmp;while truedoj=$(sed -n "$i,$f"p $input);#echo $jawk "!/ $j /" $dir/broadcast.tmp >> $dir/baseif [ $f -gt $last ]; thensort $dir/base | uniq >> $dir/baselimpa.csv;rm -f $dir/broadcast.tmp;> $dir/base;exit ;filet i=i+100000 ;let f=f+100000 ;donefi
[Prev in Thread] Current Thread [Next in Thread]
- Problema com arquivo muito grande, Thiago Tato, 2014/04/26
- Re: Problema com arquivo muito grande, itamarnet, 2014/04/26
- Re: [shell-script] Re: Problema com arquivo muito grande, Thiago Tato, 2014/04/26
- Re: [shell-script] Re: Problema com arquivo muito grande, Julio C. Neves, 2014/04/26
- Re: [shell-script] Problema com arquivo muito grande, Luiz Roberto Ferreira <=
- Prev by Date: Re: [shell-script] Re: Problema com arquivo muito grande
- Next by Date: Bash 4.3.11 quebrou a expansão ${var~} ?
- Previous by thread: Re: [shell-script] Re: Problema com arquivo muito grande
- Next by thread: Bash 4.3.11 quebrou a expansão ${var~} ?
- Index(es):