Día 6: Lectura y Escritura de Archivos

Día 6: Lectura y Escritura de Archivos

Bienvenida

¡Hola nuevamente! 📂 Hoy aprenderemos a leer y escribir archivos en diferentes formatos usando Pandas. Esta habilidad es fundamental para trabajar con datos reales en proyectos de machine learning. ¡Comencemos!


Lectura de Archivos

# Leer un archivo CSV
df_csv = pd.read_csv('archivo.csv')

# Leer un archivo Excel
df_excel = pd.read_excel('archivo.xlsx')

# Leer un archivo JSON
df_json = pd.read_json('archivo.json')

# Leer un archivo HTML
df_html = pd.read_html('archivo.html')

Escritura de Archivos

# Guardar un DataFrame como CSV
df.to_csv('archivo_guardado.csv', index=False)

# Guardar un DataFrame como Excel
df.to_excel('archivo_guardado.xlsx', index=False)

# Guardar un DataFrame como JSON
df.to_json('archivo_guardado.json')

# Guardar un DataFrame como HTML
df.to_html('archivo_guardado.html')

La propiedad index=False se utiliza para indicar que no se desea guardar el índice del DataFrame en el archivo.

Manejo de Archivos Grandes

# Leer un archivo grande en bloques
chunks = pd.read_csv('archivo_grande.csv', chunksize=1000)
for chunk in chunks:
    print(chunk.head())

Preguntas del Día 6

Prueba tus conocimientos sobre Pandas

¿Qué función se utiliza para leer un archivo CSV en Pandas?

¿Qué parámetro se usa para evitar guardar el índice al exportar un DataFrame a CSV?

Ejercicios con Pandas

  • Lee un archivo CSV y guárdalo en formato Excel.
  • Lee un archivo grande en bloques y procesa cada bloque.

¡Gran trabajo hoy! 🎉 Ahora puedes leer y escribir archivos en diferentes formatos, una habilidad clave para trabajar con datos reales. Mañana aprenderemos sobre series temporales , fundamentales para análisis basados en tiempo. ¡Nos vemos pronto! 😊