Los datos son una parte importante de nuestro mundo. De hecho, el 90 por ciento de los datos del mundo se crearon solo en los últimos tres años. Muchos gigantes tecnológicos han comenzado a contratar cientÃficos de datos para analizar datos y extraer información útil para las decisiones comerciales. Actualmente, Python es el lenguaje más importante para el análisis de datos y muchas de las herramientas estándar de la industria están escritas en Python. Pandas, una de las librerÃas más populares de Python, es una de las herramientas bajo demanda más esenciales que cualquier aspirante a analista de datos necesita aprender. Pandas, tiene como objetivo ser el bloque de construcción fundamental de alto nivel para realizar análisis de datos prácticos del mundo real en Python; esta es la declaración de la misión de Pandas. Pandas, se usa a menudo junto con otras librerÃas de Python para ciencia de datos. De hecho, Pandas se basa en la librerÃa "NumPy", por lo que gran parte de la estructura entre ellos es similar. Pandas, también se usa con "SciPy" para el análisis estadÃstico o con "Matplotlib" para el graficar los datos y sus análisis. Pandas se puede utilizar por sà solo con un editor de texto o con Júpyter Notebook, que es el entorno ideal para el modelado de datos más complejo. Pandas está disponible para la mayorÃa de las versiones de Python. Piensa en Pandas como el hogar de tus datos, donde puedes limpiar, analizar y transformar tus datos, todo en un solo lugar. Pandas es, esencialmente, un reemplazo más poderoso para Excel. A manera de resumen, con Pandas puedes hacer cosas como calcular fácilmente estadÃsticas sobre datos, tales como, encontrar el promedio, la distribución y la mediana de las columnas, utilizar herramientas de visualización de datos como "Matplotlib" para crear fácilmente barras de gráficos, histogramas y más. Limpiar datos filtrando columnas por criterios particulares o eliminando valores fácilmente. Manipular datos de manera flexible mediante operaciones como fusionar, unir, remodelar y más. Leer, escribir y almacenar los datos limpios como una base de datos, ya sea en archivo "txt" o archivo "CSV". Pandas, es una parte importante del análisis de datos y actualmente ocupa el cuarto lugar entre las librerÃas más populares y queridas. También, ocupa un lugar destacado entre las herramientas de programación más buscadas, una señal segura de que Pandas es una herramienta buscada por los desarrolladores de todo el mundo. Aprender Pandas es un paso importante para convertirse en analista de datos. Ya sea que estés creando modelos complejos de aprendizaje automático o, simplemente, desees organizar tu presupuesto mensual en una hoja de cálculo de Excel, debes saber cómo manipular y analizar tus datos. Y antes de trabajar en cualquier algoritmo de aprendizaje automático, uno debe comprender sus datos y el problema. Dentro de las etapas que se tienen que llevar a cabo para desarrollar un proyecto de ciencia de datos, una de las más importantes es "EDA". El proceso de utilizar resúmenes numéricos y visualizaciones para explorar sus datos e identificar posibles relaciones entre variables se denomina "Análisis exploratorio de datos", "EDA", por sus siglas en inglés. El análisis exploratorio de datos, es un proceso de investigación en el que se usan estadÃsticas de resumen y herramientas gráficas para llegar a conocer los datos y comprender lo que se puede averiguar de ellos. Con Pandas, el propósito de EDA es comprender mejor los datos y, posteriormente, con la visualización de los datos, mejorar la visibilidad y el entendimiento de los mismos. Si bien, hoy en dÃa existen muchas herramientas para manipular los datos, hoy vamos a hablar sobre una de las más utilizadas y amigables para los principiantes, nos referimos a Pandas.