Bajar y corregir los datos de COVID19 del MSN Argentina
Bajamos el archivo:
wget https://sisa.msal.gov.ar/datos/descargas/covid-19/files/Covid19Casos.csv
Le sacamos los caracteres extraños y/o inválidos que suele tener
tr -cd '\11\12\40-\176' < Covid19Casos.csv > Corregido.csv
Los encabezados los podemos extraer así:
head -n 1 Corregido.csv | awk -F',' '{for(i=1;i<=NF;i++){ print i,$i}}' > encabezados.csv
Alternativas al problema de los caracteres inválidos
wget https://sisa.msal.gov.ar/datos/descargas/covid-19/files/Covid19Casos.csv
Le sacamos los caracteres extraños y/o inválidos que suele tener
tr -cd '\11\12\40-\176' < Covid19Casos.csv > Corregido.csv
Los encabezados los podemos extraer así:
head -n 1 Corregido.csv | awk -F',' '{for(i=1;i<=NF;i++){ print i,$i}}' > encabezados.csv
Alternativas al problema de los caracteres inválidos
Todo lo que no sea letra o numero se reemplaza por algo ("_"):
mv 'file' $(echo 'file' | sed -e 's/[^A-Za-z0-9._-]/_/g')
mv 'file' $(echo 'file' | sed -e 's/[^A-Za-z0-9._-]/_/g')
Si el file viene de windows:
convmv -r -f windows-1252 -t UTF-8 .
convmv -r -f ISO-8859-1 -t UTF-8 .
convmv -r -f cp-850 -t UTF-8 .
https://serverfault.com/questions/348482/how-to-remove-invalid-characters-from-filenames
https://serverfault.com/questions/348482/how-to-remove-invalid-characters-from-filenames
Comentarios
Publicar un comentario