|
From: | Tiago Peczenyj |
Subject: | Re: [shell-script] Detectar codificação de texto |
Date: | Thu, 5 Feb 2015 18:27:04 -0200 |
Robson AlexandreAtenciosamenteonde tentei filtrar os caracteres de controle [[:cntrl:]], os não imprimíveis [^[:print:]], mas sem resposta ao filtro.Tentei o file -i sem sucesso.Gostaria de saber uma forma de identificar o encoding das strings, ou das linhas do arquivo para saber quais arquivos estão com sua codificação errada.Boa tarde a todos,estou com uma lista de arquivos gerada pelo find onde alguns arquivos tem sua nomenclatura em ISO8859 e outros em UTF8. Como exemplo as duas linhas correspondentes estão neste arquivo:
Preserva��o de Material de Informatica.pdf
Preservação de Material de Informatica.pdf
Mas se criar um arquivo temporário com a linha, o file -i resulta:
Preserva��o de Material de Informatica.pdf
text/plain; charset=iso-8859-1
E com a linha na codificação correta
Preservação de Material de Informatica.pdf
text/plain; charset=utf-8
Tentei um cat -A nessas linhas que resultaram:
PreservaM-gM-co de Material de Informatica.pdf$
PreservaM-CM-'M-CM-#o de Material de Informatica.pdf$Se eu uso o 'iconv -f latin1 -t utf8' ele acaba convertendo tudo, inclusive o que já está em UTF8.Alguém poderia dar alguma dica?--
[Prev in Thread] Current Thread [Next in Thread]
- Detectar codificação de texto, Robson Alexandre, 2015/02/05
- Re: [shell-script] Detectar codificação de texto, Tiago Peczenyj <=
- Re: [shell-script] Detectar codificação de texto, Robson Alexandre, 2015/02/06
- Re: [shell-script] Detectar codificação de texto, Marcelo F Andrade, 2015/02/06
- Re: [shell-script] Detectar codificação de texto, Fernando Mercês, 2015/02/06
- Re: [shell-script] Detectar codificação de texto, Rodrigo Tenorio, 2015/02/06
- Prev by Date: Detectar codificação de texto
- Next by Date: Re: [shell-script] Duvida array em loop
- Previous by thread: Detectar codificação de texto
- Next by thread: Re: [shell-script] Detectar codificação de texto
- Index(es):