Trabajando el Pipeline de Machine Learning con PyCaret Parte 3

Daniel Morales
Por Daniel Morales - Screencast # 7
Sep 02, 2023


create_model es la función más granular de PyCaret y a menudo es la base de la mayoría de las funcionalidades de PyCaret
Como su nombre lo indica, esta función entrena y evalúa un modelo utilizando una validación cruzada que puede ser establecida con el parámetro fold
La salida imprime una cuadrícula de puntuación que muestra por Fold la precisión, AUC, Recall, Precision, F1, Kappa y MCC.
Para el resto de este tutorial, trabajaremos con los siguientes modelos como nuestros modelos candidatos. 
Las selecciones son sólo para fines ilustrativos y no significan necesariamente que sean los de mayor rendimiento o ideales para este tipo de datos
Decision Tree Classifier ('dt')
K Neighbors Classifier ('knn')
Random Forest Classifier ('rf')
Hay 18 clasificadores disponibles en la biblioteca modelos de PyCaret. 
Para ver la lista de todos los clasificadores, compruebe la documentación o utilice la función de models() para ver la biblioteca.
Fíjese que la puntuación media de todos los modelos coincide con la puntuación impresa en compare_models().
Esto se debe a que las métricas impresas en la cuadrícula de puntuación compare_models() son las puntuaciones medias de todos los folds

“Trabajando el Pipeline de Machine Learning con PyCaret Parte 3”
– Daniel Morales twitter social icon Tweet

Compartir este artículo:

0 Comentarios

Crear un comentario
Ingresar para Comentar
divider graphic

Otros Tutoriales

Sep 09, 2023

Trabajando el Pipeline de Machine Learning con PyCaret Parte 4

Antes de finalizar el modelo, es aconsejable realizar una comprobación final mediante la predicción del conjunto de test/hold-out y la revisión de ...

Daniel Morales
Por Daniel Morales
Aug 26, 2023

Trabajando el Pipeline de Machine Learning con PyCaret Parte 2

Ahora vamos a configurar el ambiente de PycaretLa función setup() inicializa el entorno en pycaret y crea la tubería de transformación para prepara...

Daniel Morales
Por Daniel Morales
Aug 19, 2023

Trabajando el Pipeline de Machine Learning con PyCaret Parte 1

Parte #1 - Introducción a la librería, dataset a trabajar e importancia en la división de los datosParte #2 - N-Fold Cross-validation, setup() y co...

Daniel Morales
Por Daniel Morales
Partners

graphical divider
Icon

Únete a nuestra comunidad privada en Slack

Manténgase al día participando de ésta gran comunidad de data scientists en latinoamérica. Hablamos sobre los retos, proyectos y competiciones en data science, trabajos en data science, cómo practicar las habilidades, qué podemos aprender y mucho más!

 
Te enviaremos un link de invitación a tu email inmediatamente.
arrow-up icon