Día 3: Manipulación de Datos - Missing Values y Transformaciones

Día 3: Manipulación de Datos - Missing Values y Transformaciones

Bienvenida

¡Hola de nuevo! 🌟 Hoy aprenderemos a manejar valores faltantes y realizar transformaciones en Pandas. Estos conceptos son esenciales para limpiar y preparar datos antes de entrenar modelos de machine learning. ¡Vamos allá!


Manipulación de Datos con Pandas

Pandas es una biblioteca de Python que proporciona una amplia gama de funciones para trabajar con datos. Algunas de las principales funciones que puedes utilizar son:

Detección de Valores Faltantes

Pandas proporciona varias funciones para manejar valores faltantes en tus datos:

Sentencia isna()

Identifica valores faltantes.

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

print(df.isna())  # Imprime: [False, False, False]

Sentencia isnull()

Identifica valores faltantes.

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

print(df.isnull())  # Imprime: [False, False, False]

Eliminación de Valores Faltantes

Pandas proporciona varias funciones para manejar valores faltantes en tus datos:

Sentencia dropna()

Elimina filas con valores faltantes.

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, None], 'C': [7, None, 9]})

df, df.dropna() # Output: [1  4  7]

Puedes usar dropna() para eliminar filas con valores faltantes.

Sentencia fillna()

Rellena valores faltantes con un valor especificado.

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, None], 'C': [7, None, 9]})

df, df.fillna(0) # Output: [1  4  7]

Si deseas rellenar los valores de una columna especifica con un valor especificado, puedes usar la sentencia fillna().

import pandas as pd

df = pd.DataFrame({'A': [1, None, 3], 'B': [4, 5, 6], 'C': [7, None, 9]})

df['A'] = df['A'].fillna(df['A'].mean())

Puedes usar fillna() para rellenar valores faltantes con un valor especificado.

Transformaciones de Datos

Pandas proporciona varias funciones para realizar transformaciones en tus datos:

Sentencia apply()

Aplica una función a cada elemento de una columna.

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

df['A'] = df['A'].apply(lambda x: x * 2)

Sentencia map()

Aplica una función a cada elemento de una columna.

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

df['A'] = df['A'].map({1: 'a', 2: 'b', 3: 'c'})

Sentencia replace()

Reemplaza valores faltantes con un valor especificado.

import pandas as pd 

df = pd.DataFrame({'A': [1, None, 3], 'B': [4, 5, 6], 'C': [7, None, 9]})

df['A'] = df['A'].replace({None: 0})

Preguntas del Día 3

Prueba tus conocimientos sobre Pandas

¿Qué método se utiliza para identificar valores faltantes en un DataFrame?

¿Qué función se usa para rellenar valores faltantes con un valor específico?

Ejercicios con Pandas

  • Identifica y elimina filas con valores faltantes en un DataFrame.
  • Imputa valores faltantes en una columna usando la media y la mediana.
  • Aplica una transformación de datos a una columna del DataFrame.

¡Gran trabajo hoy! 🎉 Ahora sabes cómo manejar valores faltantes y transformar datos en Pandas. Mañana aprenderemos sobre agrupación y agregación , habilidades clave para extraer insights de grandes conjuntos de datos. ¡Nos vemos pronto! 😊