¿Qué es el aprendizaje automático y en qué se diferencia el aprendizaje automático de la IA?

.
February 22, 2022
¿Qué es el aprendizaje automático y en qué se diferencia el aprendizaje automático de la IA?

Dependiendo de a quién le preguntes, obtendrás definiciones algo diferentes de lo que es el aprendizaje automático. Esto no debería sorprendernos demasiado, dado que se trata de un campo candente y en rápido desarrollo. Además, siempre existe la tentación de etiquetar algo como aprendizaje automático para elevar el estatus de un proyecto, independientemente de si califica como aprendizaje automático o no. La tendencia a utilizar el nombre de aprendizaje automático como etiqueta de marketing para un proyecto o servicio contribuye a la confusión sobre lo que constituye el verdadero aprendizaje automático.

Un error común es definir el aprendizaje automático según el algoritmo o la técnica utilizada (por ejemplo, Random Forest o XGBoost como aprendizaje automático), mientras que la regresión logística u otras técnicas estadísticas clásicas no lo son. En realidad, casi cualquier técnica de modelado puede considerarse aprendizaje automático en función de cómo se utilice, aunque algunas técnicas pueden resultar más fáciles y eficaces que otras a la hora de implementar el aprendizaje automático real.

Las definiciones más utilizadas para el aprendizaje automático se pueden clasificar en dos categorías. La primera se centra en la capacidad de ajustar un modelo sin instrucciones específicas; la siguiente definición de SAS encajaría en esa categoría

«El aprendizaje automático es un método de análisis de datos que automatiza la creación de modelos analíticos».

Fuente: https://www.sas.com/en_us/insights/analytics/machine-learning.html

Según esta definición, se podría argumentar que Random Forest es aprendizaje automático, mientras que la regresión logística no lo es. Sin embargo, si combinamos la regresión logística con el código para automatizar el proceso de selección de variables, imputación de datos y transformación de variables, se ajustaría a la definición anterior.

La segunda categoría de definiciones se centra en la capacidad de aprender y mejorar a medida que se dispone de nuevos datos en los casos en que el modelo no es estático sino que cambia con el tiempo debido a la presencia de nueva información. La definición que figura a continuación resume sucintamente este concepto.

«El aprendizaje automático es el concepto de que un programa de computadora puede aprender y adaptarse a nuevos datos sin interferencia humana».

Fuente: https://www.merriam-webster.com/dictionary/machine%20learning

Si bien esta definición es en cierto modo más estricta que la anterior, un modelo de regresión simple con sus parámetros ajustados automáticamente para adaptarse a los nuevos datos calificaría como aprendizaje automático. Sin embargo, un modelo de Random Forest implementado sin un mecanismo para actualizarse automáticamente con nuevos datos no calificaría como aprendizaje automático.

Según cualquiera de las dos definiciones, el aprendizaje automático es un tipo de modelo predictivo basado en datos que intenta predecir los resultados futuros y se puede utilizar para resolver una amplia gama de problemas empresariales. ¿Cómo se relaciona esto con la inteligencia artificial (IA)?

La mayoría de las definiciones de IA son similares a la proporcionada por Britannica, como se muestra a continuación:

Inteligencia artificial (IA), la capacidad de una computadora digital o un robot controlado por computadora para realizar tareas comúnmente asociadas con seres inteligentes.

Fuente: https://www.britannica.com/technology/artificial-intelligence

Para que algo se considere Inteligencia Artificial, se requiere un cierto nivel de inteligencia para realizar una acción que pueda basarse en algún tipo de modelo de aprendizaje automático. En este contexto, yo diría que la segunda definición de aprendizaje automático es la más adecuada. Sin la capacidad de mejorar el modelo en función de los resultados y los nuevos datos, no consideraría que el sistema fuera particularmente inteligente, independientemente del algoritmo que se utilizara para ajustar los datos.

Aquí hay un ejemplo real de marketing para combinarlo todo. Un modelo de segmentación por correo directo desarrollado a partir de datos históricos de campañas y utilizado para puntuar un archivo de clientes potenciales no se consideraría realmente aprendizaje automático, independientemente de la técnica utilizada, al menos no según la segunda definición más estricta.

Por otro lado, un modelo de segmentación en línea que se actualice continuamente a medida que los consumidores accedan al sitio web y compren productos sería aprendizaje automático. Si se desarrolla un algoritmo para utilizar este modelo para realizar ofertas automáticamente en diferentes palabras de búsqueda y optimizar las ofertas en relación con un presupuesto de marketing determinado, entonces se trata de un sistema de inteligencia artificial.

Dependiendo de a quién le preguntes, obtendrás definiciones algo diferentes de lo que es el aprendizaje automático. Esto no debería sorprendernos demasiado, dado que se trata de un campo candente y en rápido desarrollo. Además, siempre existe la tentación de etiquetar algo como aprendizaje automático para elevar el estatus de un proyecto, independientemente de si califica como aprendizaje automático o no. La tendencia a utilizar el nombre de aprendizaje automático como etiqueta de marketing para un proyecto o servicio contribuye a la confusión sobre lo que constituye el verdadero aprendizaje automático.

Un error común es definir el aprendizaje automático según el algoritmo o la técnica utilizada (por ejemplo, Random Forest o XGBoost como aprendizaje automático), mientras que la regresión logística u otras técnicas estadísticas clásicas no lo son. En realidad, casi cualquier técnica de modelado puede considerarse aprendizaje automático en función de cómo se utilice, aunque algunas técnicas pueden resultar más fáciles y eficaces que otras a la hora de implementar el aprendizaje automático real.

Las definiciones más utilizadas para el aprendizaje automático se pueden clasificar en dos categorías. La primera se centra en la capacidad de ajustar un modelo sin instrucciones específicas; la siguiente definición de SAS encajaría en esa categoría

«El aprendizaje automático es un método de análisis de datos que automatiza la creación de modelos analíticos».

Fuente: https://www.sas.com/en_us/insights/analytics/machine-learning.html

Según esta definición, se podría argumentar que Random Forest es aprendizaje automático, mientras que la regresión logística no lo es. Sin embargo, si combinamos la regresión logística con el código para automatizar el proceso de selección de variables, imputación de datos y transformación de variables, se ajustaría a la definición anterior.

La segunda categoría de definiciones se centra en la capacidad de aprender y mejorar a medida que se dispone de nuevos datos en los casos en que el modelo no es estático sino que cambia con el tiempo debido a la presencia de nueva información. La definición que figura a continuación resume sucintamente este concepto.

«El aprendizaje automático es el concepto de que un programa de computadora puede aprender y adaptarse a nuevos datos sin interferencia humana».

Fuente: https://www.merriam-webster.com/dictionary/machine%20learning

Si bien esta definición es en cierto modo más estricta que la anterior, un modelo de regresión simple con sus parámetros ajustados automáticamente para adaptarse a los nuevos datos calificaría como aprendizaje automático. Sin embargo, un modelo de Random Forest implementado sin un mecanismo para actualizarse automáticamente con nuevos datos no calificaría como aprendizaje automático.

Según cualquiera de las dos definiciones, el aprendizaje automático es un tipo de modelo predictivo basado en datos que intenta predecir los resultados futuros y se puede utilizar para resolver una amplia gama de problemas empresariales. ¿Cómo se relaciona esto con la inteligencia artificial (IA)?

La mayoría de las definiciones de IA son similares a la proporcionada por Britannica, como se muestra a continuación:

Inteligencia artificial (IA), la capacidad de una computadora digital o un robot controlado por computadora para realizar tareas comúnmente asociadas con seres inteligentes.

Fuente: https://www.britannica.com/technology/artificial-intelligence

Para que algo se considere Inteligencia Artificial, se requiere un cierto nivel de inteligencia para realizar una acción que pueda basarse en algún tipo de modelo de aprendizaje automático. En este contexto, yo diría que la segunda definición de aprendizaje automático es la más adecuada. Sin la capacidad de mejorar el modelo en función de los resultados y los nuevos datos, no consideraría que el sistema fuera particularmente inteligente, independientemente del algoritmo que se utilizara para ajustar los datos.

Aquí hay un ejemplo real de marketing para combinarlo todo. Un modelo de segmentación por correo directo desarrollado a partir de datos históricos de campañas y utilizado para puntuar un archivo de clientes potenciales no se consideraría realmente aprendizaje automático, independientemente de la técnica utilizada, al menos no según la segunda definición más estricta.

Por otro lado, un modelo de segmentación en línea que se actualice continuamente a medida que los consumidores accedan al sitio web y compren productos sería aprendizaje automático. Si se desarrolla un algoritmo para utilizar este modelo para realizar ofertas automáticamente en diferentes palabras de búsqueda y optimizar las ofertas en relación con un presupuesto de marketing determinado, entonces se trata de un sistema de inteligencia artificial.