Con el lanzamiento de ChatGPT por parte de OpenAI y todo el bombo y platillo, hay una corriente de pánico en la comunidad de PNL.
Este miedo se alimenta principalmente por el impacto percibido de ChatGPT en las comunidades no técnicas; existe la percepción, sea cierta o no, de que estos algoritmos van a cambiarlo todo. Sin duda, ChatGPT lo cambia todo. En esta breve entrada de blog, quiero argumentar que, aunque ChatGPT y sus ramificaciones son maravillas tecnológicas y cambiarán lo que hacemos en el futuro, no hay por qué entrar en pánico. Todavía estamos a años de que sustituya las innovaciones y funcionalidades del amplio campo del procesamiento del lenguaje natural (PNL).
El pánico está bien fundado. El LLM de GPT está cambiando por completo el campo de juego, y estamos en la infancia de estos algoritmos de inteligencia artificial, pero este es un cambio similar al lanzamiento de Google o del ordenador personal de escritorio. En la comunidad científica de datos, creo que se trata de la escalabilidad de las máquinas impulsadas por gradientes (GBM). Una vez que las máquinas digitales se adaptan a los sistemas de producción, cabe preguntarse por qué alguien utilizaría métodos lineales como la regresión logística (en el caso de la clasificación, el mismo argumento se aplica a la regresión) para la predicción, excepto en casos muy específicos en los que es necesaria la interpretación, la velocidad de puntuación o la inferencia.
ChatGPT es una versión de un modelo de lenguaje grande (LLM) generativo preentrenado (GPT). Si bien no hay suficiente espacio en este breve blog para desmitificar estos algoritmos, a un alto nivel, estos modelos predicen la siguiente palabra de una entrada determinada (normalmente una pregunta) una y otra vez hasta que la oración, el párrafo o la conversación concluya. Los modelos están entrenados en un amplio corpus de lenguaje natural; la última versión de ChatGPT, GPT-4, se publicó hace solo un par de semanas y se entrena en «Internet» y, básicamente, en toda la información en inglés que existe. Al predecir la siguiente palabra (una y otra vez), el algoritmo produce una respuesta escrita que suena natural. Además, al capacitarse en Internet, las respuestas son esencialmente un concurso de popularidad. Sin embargo, en lugar de encontrar las principales páginas web como la mayoría de los motores de búsqueda, los algoritmos buscan la siguiente palabra.
El procesamiento del lenguaje natural (PNL) es una rama de la ciencia de datos que se centra en el análisis y el procesamiento del lenguaje natural, ya sea hablado o escrito. La definición de PNL suele ser más específica y sinónimo de inteligencia artificial, que otorga a las computadoras la capacidad de comprender y producir palabras escritas o habladas de la misma manera que lo hacen los humanos. Preferimos una definición más amplia porque hay muchos algoritmos útiles de PNL que no se basan en redes neuronales, aprendizaje profundo u otros algoritmos similares a los del cerebro. En Blend360 hemos estado desarrollando experiencia y algoritmos en el campo de la PNL desde nuestros inicios. La figura de la derecha muestra los algoritmos que implementamos con nuestros clientes. Muchos de estos algoritmos se basan en algoritmos de aprendizaje profundo, pero otros no.
Estos algoritmos aún tienen su lugar y resuelven problemas muy importantes que solicitan nuestros clientes. Los LLM no los reemplazarán a todos y, en muchos casos, un LLM será exagerado y sobrediseñado para este caso de uso.
GPT4 y la mayoría de los demás LLM, formados en Internet, son buenos sustitutos de una búsqueda en Google o de una conversación general, pero no pueden, por ejemplo, ayudar a una empresa a automatizar su servicio de atención al cliente. No está lista para usar. La formación de un LLM en un conjunto de datos propietario se denomina adaptación de dominio. Para automatizar su servicio al cliente, una empresa necesita un gran corpus de datos de servicio al cliente para capacitar al LLM. Los chatbots tradicionales se utilizan en este sentido y son una combinación de modelos y reglas empresariales. Un LLM que prediga la próxima palabra en lugar de la respuesta completa revolucionará el servicio de atención al cliente, pero aun así necesitará capacitarse para dominios específicos.
En Blend360 estamos explorando formas en las que los LLM pueden aprovecharse para nuestros clientes de manera práctica y apropiada. Tratamos el desafío de cada cliente como algo único y creemos que las soluciones listas para usar y únicas son ineficaces, excepto en las situaciones más genéricas. Por ello, estamos explorando métodos para utilizar los LLM en situaciones únicas, de forma rentable y a escala, y para capacitar a los LLM en función de los datos de nuestros clientes e incorporarlos a los ecosistemas de nuestros clientes.
Los LLM están revolucionando el espacio de la PNL, pero debemos considerarlos como una herramienta más (aunque es una herramienta muy importante) y no como un sustituto de toda la caja de herramientas. Hemos agregado activamente esta herramienta a nuestro conjunto de herramientas y estamos trabajando con los clientes para implementarla.
Si desea obtener más información, háganoslo saber enviándonos un mensaje a NLP@blend360.com.
Blend360 crea conjuntamente soluciones de ciencia de datos con los clientes para lograr sus objetivos comerciales. Los clientes son los héroes de nuestra historia y les proporcionamos las herramientas y la experiencia necesarias para tener éxito. Usamos análisis avanzados, aprendizaje automático e inteligencia artificial para tomar decisiones basadas en datos que impulsen el crecimiento y la innovación. Como líderes del sector de la ciencia de datos, colaboramos con empresas de todos los tamaños para crear soluciones innovadoras que marquen la diferencia.
Con el lanzamiento de ChatGPT por parte de OpenAI y todo el bombo y platillo, hay una corriente de pánico en la comunidad de PNL.
Este miedo se alimenta principalmente por el impacto percibido de ChatGPT en las comunidades no técnicas; existe la percepción, sea cierta o no, de que estos algoritmos van a cambiarlo todo. Sin duda, ChatGPT lo cambia todo. En esta breve entrada de blog, quiero argumentar que, aunque ChatGPT y sus ramificaciones son maravillas tecnológicas y cambiarán lo que hacemos en el futuro, no hay por qué entrar en pánico. Todavía estamos a años de que sustituya las innovaciones y funcionalidades del amplio campo del procesamiento del lenguaje natural (PNL).
El pánico está bien fundado. El LLM de GPT está cambiando por completo el campo de juego, y estamos en la infancia de estos algoritmos de inteligencia artificial, pero este es un cambio similar al lanzamiento de Google o del ordenador personal de escritorio. En la comunidad científica de datos, creo que se trata de la escalabilidad de las máquinas impulsadas por gradientes (GBM). Una vez que las máquinas digitales se adaptan a los sistemas de producción, cabe preguntarse por qué alguien utilizaría métodos lineales como la regresión logística (en el caso de la clasificación, el mismo argumento se aplica a la regresión) para la predicción, excepto en casos muy específicos en los que es necesaria la interpretación, la velocidad de puntuación o la inferencia.
ChatGPT es una versión de un modelo de lenguaje grande (LLM) generativo preentrenado (GPT). Si bien no hay suficiente espacio en este breve blog para desmitificar estos algoritmos, a un alto nivel, estos modelos predicen la siguiente palabra de una entrada determinada (normalmente una pregunta) una y otra vez hasta que la oración, el párrafo o la conversación concluya. Los modelos están entrenados en un amplio corpus de lenguaje natural; la última versión de ChatGPT, GPT-4, se publicó hace solo un par de semanas y se entrena en «Internet» y, básicamente, en toda la información en inglés que existe. Al predecir la siguiente palabra (una y otra vez), el algoritmo produce una respuesta escrita que suena natural. Además, al capacitarse en Internet, las respuestas son esencialmente un concurso de popularidad. Sin embargo, en lugar de encontrar las principales páginas web como la mayoría de los motores de búsqueda, los algoritmos buscan la siguiente palabra.
El procesamiento del lenguaje natural (PNL) es una rama de la ciencia de datos que se centra en el análisis y el procesamiento del lenguaje natural, ya sea hablado o escrito. La definición de PNL suele ser más específica y sinónimo de inteligencia artificial, que otorga a las computadoras la capacidad de comprender y producir palabras escritas o habladas de la misma manera que lo hacen los humanos. Preferimos una definición más amplia porque hay muchos algoritmos útiles de PNL que no se basan en redes neuronales, aprendizaje profundo u otros algoritmos similares a los del cerebro. En Blend360 hemos estado desarrollando experiencia y algoritmos en el campo de la PNL desde nuestros inicios. La figura de la derecha muestra los algoritmos que implementamos con nuestros clientes. Muchos de estos algoritmos se basan en algoritmos de aprendizaje profundo, pero otros no.
Estos algoritmos aún tienen su lugar y resuelven problemas muy importantes que solicitan nuestros clientes. Los LLM no los reemplazarán a todos y, en muchos casos, un LLM será exagerado y sobrediseñado para este caso de uso.
GPT4 y la mayoría de los demás LLM, formados en Internet, son buenos sustitutos de una búsqueda en Google o de una conversación general, pero no pueden, por ejemplo, ayudar a una empresa a automatizar su servicio de atención al cliente. No está lista para usar. La formación de un LLM en un conjunto de datos propietario se denomina adaptación de dominio. Para automatizar su servicio al cliente, una empresa necesita un gran corpus de datos de servicio al cliente para capacitar al LLM. Los chatbots tradicionales se utilizan en este sentido y son una combinación de modelos y reglas empresariales. Un LLM que prediga la próxima palabra en lugar de la respuesta completa revolucionará el servicio de atención al cliente, pero aun así necesitará capacitarse para dominios específicos.
En Blend360 estamos explorando formas en las que los LLM pueden aprovecharse para nuestros clientes de manera práctica y apropiada. Tratamos el desafío de cada cliente como algo único y creemos que las soluciones listas para usar y únicas son ineficaces, excepto en las situaciones más genéricas. Por ello, estamos explorando métodos para utilizar los LLM en situaciones únicas, de forma rentable y a escala, y para capacitar a los LLM en función de los datos de nuestros clientes e incorporarlos a los ecosistemas de nuestros clientes.
Los LLM están revolucionando el espacio de la PNL, pero debemos considerarlos como una herramienta más (aunque es una herramienta muy importante) y no como un sustituto de toda la caja de herramientas. Hemos agregado activamente esta herramienta a nuestro conjunto de herramientas y estamos trabajando con los clientes para implementarla.
Si desea obtener más información, háganoslo saber enviándonos un mensaje a NLP@blend360.com.
Blend360 crea conjuntamente soluciones de ciencia de datos con los clientes para lograr sus objetivos comerciales. Los clientes son los héroes de nuestra historia y les proporcionamos las herramientas y la experiencia necesarias para tener éxito. Usamos análisis avanzados, aprendizaje automático e inteligencia artificial para tomar decisiones basadas en datos que impulsen el crecimiento y la innovación. Como líderes del sector de la ciencia de datos, colaboramos con empresas de todos los tamaños para crear soluciones innovadoras que marquen la diferencia.