Harpillera

El embolsado, también conocido como agregación de arranque, es una técnica de conjunto de aprendizaje automático que combina a varios alumnos para reducir la variación y mejorar la generalización. Generalmente se implementa para mejorar el rendimiento de las técnicas de aprendizaje supervisado. En el embolsado, se crean submuestras de todo el conjunto de datos, con reemplazo, y cada modelo se entrena en una submuestra diferente. Luego, los resultados de los múltiples modelos se combinan para formar una predicción final.

La idea detrás del embolsado es reducir la varianza del modelo de predicción. La varianza se refiere al grado en que la salida del modelo de predicción diferirá, dados diferentes conjuntos de datos. Una variación alta puede provocar un sobreajuste, lo que significa que el modelo es demasiado sensible a pequeños cambios en el conjunto de datos de entrada. El embolsado funciona para reducir la variación tomando múltiples muestras de los datos y entrenando múltiples modelos con ellas. Los modelos tienen en cuenta la incertidumbre inherente a las predicciones y los puntos de datos que tienen mayor influencia se promedian en todos los modelos. Esto reduce la variación y evita problemas debido a características no generalizables.

El ensacado se utiliza generalmente en combinación con algoritmos basados en árboles de decisión y también se puede aplicar a otras formas de aprendizaje automático. Es más eficaz cuando hay una gran cantidad de ejemplos de capacitación y cuando sólo unos pocos de ellos son necesarios para una toma de decisiones eficaz. El embolsado también se puede utilizar para reducir los efectos del sobreajuste, reduciendo la cantidad de parámetros en un algoritmo.

El ensacado ha demostrado ser una técnica muy poderosa para mejorar la precisión y el rendimiento de generalización de los modelos de aprendizaje automático. Si bien no siempre es necesario, es una forma rentable de aprovechar al máximo un conjunto de datos.

Fuentes:
Birhanu, N.; Doshi, V.; Mishra, B. (2017). Introducción a las técnicas de conjunto. Revista de Big Data, 4(4). doi:10.1186/s40537-017-0075-z.

Suganthi, R.; Krishnaveni, G. (2016). Ensacado: un poderoso método conjunto para mejorar la precisión de los algoritmos de clasificación. Revista internacional de aplicaciones informáticas, 135 (4). Obtenido de https://pdfs.semanticscholar.org/e7de/ebda0f0d6f145d82a7e8cef6864b1e00e2b4.pdf.

Elija y compre proxy

Personalice su paquete de servidor proxy sin esfuerzo con nuestro formulario fácil de usar. Elija la ubicación, la cantidad y el término del servicio para ver los precios de los paquetes instantáneos y los costos por IP. Disfrute de flexibilidad y comodidad para sus actividades en línea.

Elija su paquete de proxy

Elija y compre proxy