Los métodos estadísticos son una parte clave de la ciencia de datos, pero pocos científicos de datos tienen formación estadística formal.. Los cursos y libros sobre estadística básica rara vez cubren el tema desde una perspectiva de ciencia de datos.. La segunda edición de esta popular guía añade ejemplos exhaustivos en Python, proporciona orientación práctica sobre la aplicación de métodos estadísticos a la ciencia de datos, le dice cómo evitar su uso indebido y le da consejos sobre lo que es importante y lo que no.
Muchos recursos de ciencia de datos incorporan métodos estadísticos pero carecen de una perspectiva estadística más profunda.. Si está familiarizado con los lenguajes de programación R o Python y tiene alguna exposición a la estadística, esta referencia rápida llena el vacío en un formato accesible y legible.
Con este libro, aprenderás:
Por qué el análisis exploratorio de datos es un paso preliminar clave en la ciencia de datos
Cómo el muestreo aleatorio puede reducir el sesgo y producir un conjunto de datos de mayor calidad, incluso con big data
Cómo los principios del diseño experimental producen respuestas definitivas a las preguntas
Cómo utilizar la regresión para estimar resultados y detectar anomalías
Técnicas de clasificación clave para predecir a qué categorías pertenece un registro
Métodos estadísticos de aprendizaje automático que "aprenden" de los datos
Métodos de aprendizaje no supervisado para extraer significado de datos no etiquetados
Sobre el Autor
Peter Bruce es el Fundador y Director Académico del Instituto para la Educación Estadística en Statistics.com, que ofrece alrededor de 80 cursos de estadística y análisis, aproximadamente la mitad de los cuales están dirigidos a científicos de datos.. Es autor o coautor de varios libros de estadística y análisis, y obtuvo su licenciatura en Princeton, y maestrías en Harvard y la Universidad de Maryland.
^
Andrew Bruce, Científico de Investigación Principal en Amazon, tiene más de 30 años de experiencia en estadística y ciencia de datos en la academia, el gobierno y los negocios.. Coautor de Análisis de ondículas aplicado con S-PLUS, obtuvo su licenciatura en Princeton y su doctorado en estadística en la Universidad de Washington
^
Peter Gedeck, Científico de Datos Senior en Collaborative Drug Discovery, se especializa en el desarrollo de algoritmos de aprendizaje automático para predecir propiedades biológicas y fisicoquímicas de candidatos a fármacos.. Coautor de Minería de datos para análisis de negocios, obtuvo doctorados en Química por la Universidad de Erlangen-Núremberg en Alemania y en Matemáticas por la Fernuniversität Hagen, Alemania.