Bajar y corregir los datos de COVID19 del MSN Argentina

Bajamos el archivo:
wget https://sisa.msal.gov.ar/datos/descargas/covid-19/files/Covid19Casos.csv

Le sacamos los caracteres extraños y/o inválidos que suele tener
tr -cd '\11\12\40-\176' < Covid19Casos.csv > Corregido.csv

Los encabezados los podemos extraer así:
head -n 1 Corregido.csv | awk -F',' '{for(i=1;i<=NF;i++){ print i,$i}}' > encabezados.csv


Alternativas al problema de los caracteres inválidos 

Todo lo que no sea letra o numero se reemplaza por algo ("_"):
mv 'file' $(echo 'file' | sed -e 's/[^A-Za-z0-9._-]/_/g')

Si  el file viene de windows:
convmv -r -f windows-1252 -t UTF-8 . 
convmv -r -f ISO-8859-1 -t UTF-8 . 

Comentarios

Entradas populares de este blog

Hacer una peli con un montón de imágenes

Resolver numéricamente el péndulo simple