És útil quan tenim fitxers en un format de codificació i llavors treballem en un sistema operatiu que utilitza un altre format de codificació. A vegades passa que veiem caracters extranys. Aquí exposo 2 maneres de canviar el format de codificació de fitxers.
Per exemple si estem treballant en un sistema operatiu que utilitza UTF-8 i tenim fitxers en ISO-8859-1 pot ser que els fitxers amb accents o altres signes com ", ^, i d'altres els veiem deformats amb signes d'interrogació per exemple.
El problema és que si intento copiar o editar o el que sigui aquests arxius amb ?, el sistema operatiu no em deixa pel que, o dono per perdut l'arxiu(s) o el canvio de codificació perque ja es vegi com era (amb un ', ^ o el que sigui) i el pugui tractar. Així doncs si volem canviar el format d'un arxiu:
xddxdd@debian:~$ iconv --from-code=ISO-8859-1 --to-code=UTF-8 ./oldfile.htm > ./newfile.html
Si ho vulguessim fer al revés o amb altres formats, hauriem de canviar els paràmetres lògicament.
El problema és si tenim 2368432 arxius en un directori i el seus respectius subdirectoris. Canviar "manualment" cada arxiu pot ser una tasca realment tediosa. Això ho podem subsanar amb:
xddxdd@debian:~$ convmv -r --notest -f iso-8859-1 -t utf-8 *
Nota: També podem fer-ho només per a un arxiu canviant el * pel nom de l'arxiu en qüestió.
Notis que executant aquesta comanda, converteix tots els fitxers del directori i també dels respectius subdirectoris recursivament.
Nota: Les 2 comandes es poden trobar als repositoris de Debian en els paquets libc-bin i convmv.
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario