Explorando Snowflake Arctic: el LLM de código abierto para empresas

Luke Turanski & Rob Fuller
.
May 16, 2024
Explorando Snowflake Arctic: el LLM de código abierto para empresas

El 24 de abril de 2024, Snowflake anunció su modelo de lenguaje grande (LLM) de nivel empresarial: Arctic. A menudo nos preguntan acerca de los nuevos modelos a medida que salen a la venta, pero no todos los días reciben tanta atención empresarial como la que ha generado Arctic. Para los clientes de Blend y los entusiastas de la IA que se pregunten el impacto que Arctic tendrá en la escena de la LLM: este artículo es para ti.

En primer lugar, veamos los aspectos más destacados del modelo: Arctic surgió con la promesa de un rendimiento sólido, bajos costos de capacitación, una arquitectura híbrida novedosa y una perspectiva colaborativa hacia los materiales y el código de código abierto. Arctic da un paso adelante innovador para los LLM empresariales.

Vale la pena señalar que todos los LLM del mercado representan un increíble equilibrio de ventajas y desventajas:

Arquitectura del Ártico

Arquitectónicamente, el Ártico es bastante interesante. Snowflake ha optado por una gran cantidad de parámetros repartidos en un enfoque mixto de expertos, con tamaños de expertos bastante pequeños. Esto equivale a requisitos de GPU de gran tamaño, pero a un rendimiento de alta velocidad.  

Funcionalmente, las puntuaciones de Arctic destacan en la generación de SQL, la codificación, el seguimiento de instrucciones y el sentido común. Están bien alineados con las ventajas y desventajas que las empresas buscan en los LLM. Cuando diseñamos aplicaciones empresariales, buscamos un alto grado de confiabilidad de salida. Como resultado, nos preocupa menos la cobertura para los casos de uso general. Snowflake denomina a este equilibrio «inteligencia empresarial».

El resultado aquí es un conjunto de compensaciones bien específicas; es posible que el Ártico no tenga una gran cantidad de conocimientos amplios como otros LLM, pero se centra en realizar tareas críticas para el negocio y hacerlo con rapidez. Basándonos en esto, predecimos que este modelo será más eficiente a la hora de adaptarse a las necesidades de concurrencia de las grandes empresas (pero no a la hora de desplegarlo en la periferia).

Para dar contexto, estas son algunas de las puntuaciones comparativas que Snowflake ha compartido y son consistentes con nuestras pruebas iniciales. A continuación encontrará una buena descripción general de las ventajas y desventajas entre rendimiento y enfoque.

Imagen de Snowflake

Anticipamos que el Ártico se destacará en las siguientes áreas

Copiloto de Snowflake de alta precisión

Escritura de código API

Desarrollo de aplicaciones nativas

Abriendo puertas con código abierto

En los últimos años, Snowflake ha ampliado sus servicios más allá de un producto moderno de bases de datos relacionales, evolucionando hasta convertirse en una plataforma integral de datos y nube. La empresa ha enriquecido su conjunto de funciones (p. ej. Desarrollo de aplicaciones nativas, operaciones de aprendizaje automático y más) que abren el camino para aplicaciones personalizadas, aprendizaje automático y modelos de inteligencia artificial que tienen un acceso perfecto a los datos subyacentes.

Gracias a la versión de código abierto de Arctic, Snowflake permite a los clientes crear pilas personalizadas al combinar este LLM con una selección de modelos patentados (a través de asociaciones) o cualquier otro modelo de código abierto que se adapte de forma única a cualquier caso de uso específico. Sin mencionar que Arctic está incorporando su nuevo Características de Cortex.

Casos de uso iniciales en el Ártico

Hay casos de uso claros del Ártico como una herramienta interna y un medio para mejorar los productos de datos que puede aprovechar hoy. Por ejemplo, puedes empezar con:

Y eso es solo el principio. Los equipos pueden anticiparse al acelerar las tareas tediosas, lo que les permite dedicar más tiempo al diseño y a la toma de decisiones. En última instancia, el uso eficaz del Ártico aumentará la productividad de los equipos de desarrollo de Snowflake.

Además de beneficiar a los equipos internos, también vemos posibilidades con el intercambio de datos en salas limpias y las aplicaciones personalizadas en Streamlit.

En una sala limpia de datos, o en un entorno general para compartir datos de forma segura, un proveedor de datos puede obtener nuevos consumidores todos los días que no conocen los conjuntos de datos y los posibles análisis que se pueden derivar. Snowflake Arctic podría ser un asistente virtual que guíe a los nuevos consumidores a través de la experimentación, la comprensión de los datos, la investigación, el análisis y el consumo de datos. Esto elimina la sobrecarga impuesta al proveedor de datos para permitir la democratización de los datos de manera efectiva. Una sala limpia es un entorno ideal para ofrecer funcionalidad a los usuarios externos y, al mismo tiempo, imponer pautas de acceso a los datos y a los modelos.

En las aplicaciones personalizadas (quizás creadas en Streamlit), se pueden facilitar las consultas de datos más flexibles al habilitar conceptos de consulta dinámicos (visuales o basados en el lenguaje), lo que permite que Arctic resuelva el problema necesario.

Encontrar los casos de uso correctos y aprovechar un modelo de alto rendimiento dentro del ecosistema de Snowflake crea una variedad de posibilidades. Para los equipos empresariales, Arctic es otro modelo con el que le recomendamos que experimente y se adapte a sus casos de uso especializados. Si tiene la capacidad informática necesaria, ajúnela y aprovéchela también fuera del ecosistema de Snowflake.

Snowflake: El futuro de GenAI

El anuncio de Snowflake Arctic, junto con características adyacentes, como Córtex de copos de nieve, Streamlit en Snowflake, Copo de nieve ML, y Servicios de contenedores Snowflake, debería entusiasmar tanto a las tiendas de inteligencia artificial como a las de Snowflake. Snowflake se está preparando para convertirse en una solución integral que vincule los datos, la inteligencia artificial y la interacción humana de forma coherente. En conclusión, Arctic es otra señal que demuestra que Snowflake comprende las necesidades empresariales y entiende claramente el uso de la IA generativa en los casos de uso empresarial.

Blend puede ayudarlo a navegar por los entresijos de Resolución de problemas basada en la IA; ya sea estrategia, integración o ajuste fino de los modelos para lograr el rendimiento necesario. Creemos que el futuro pertenece a quienes crecen con la IA. Conéctese con nosotros hoy mismo.

El 24 de abril de 2024, Snowflake anunció su modelo de lenguaje grande (LLM) de nivel empresarial: Arctic. A menudo nos preguntan acerca de los nuevos modelos a medida que salen a la venta, pero no todos los días reciben tanta atención empresarial como la que ha generado Arctic. Para los clientes de Blend y los entusiastas de la IA que se pregunten el impacto que Arctic tendrá en la escena de la LLM: este artículo es para ti.

En primer lugar, veamos los aspectos más destacados del modelo: Arctic surgió con la promesa de un rendimiento sólido, bajos costos de capacitación, una arquitectura híbrida novedosa y una perspectiva colaborativa hacia los materiales y el código de código abierto. Arctic da un paso adelante innovador para los LLM empresariales.

Vale la pena señalar que todos los LLM del mercado representan un increíble equilibrio de ventajas y desventajas:

Arquitectura del Ártico

Arquitectónicamente, el Ártico es bastante interesante. Snowflake ha optado por una gran cantidad de parámetros repartidos en un enfoque mixto de expertos, con tamaños de expertos bastante pequeños. Esto equivale a requisitos de GPU de gran tamaño, pero a un rendimiento de alta velocidad.  

Funcionalmente, las puntuaciones de Arctic destacan en la generación de SQL, la codificación, el seguimiento de instrucciones y el sentido común. Están bien alineados con las ventajas y desventajas que las empresas buscan en los LLM. Cuando diseñamos aplicaciones empresariales, buscamos un alto grado de confiabilidad de salida. Como resultado, nos preocupa menos la cobertura para los casos de uso general. Snowflake denomina a este equilibrio «inteligencia empresarial».

El resultado aquí es un conjunto de compensaciones bien específicas; es posible que el Ártico no tenga una gran cantidad de conocimientos amplios como otros LLM, pero se centra en realizar tareas críticas para el negocio y hacerlo con rapidez. Basándonos en esto, predecimos que este modelo será más eficiente a la hora de adaptarse a las necesidades de concurrencia de las grandes empresas (pero no a la hora de desplegarlo en la periferia).

Para dar contexto, estas son algunas de las puntuaciones comparativas que Snowflake ha compartido y son consistentes con nuestras pruebas iniciales. A continuación encontrará una buena descripción general de las ventajas y desventajas entre rendimiento y enfoque.

Imagen de Snowflake

Anticipamos que el Ártico se destacará en las siguientes áreas

Copiloto de Snowflake de alta precisión

Escritura de código API

Desarrollo de aplicaciones nativas

Abriendo puertas con código abierto

En los últimos años, Snowflake ha ampliado sus servicios más allá de un producto moderno de bases de datos relacionales, evolucionando hasta convertirse en una plataforma integral de datos y nube. La empresa ha enriquecido su conjunto de funciones (p. ej. Desarrollo de aplicaciones nativas, operaciones de aprendizaje automático y más) que abren el camino para aplicaciones personalizadas, aprendizaje automático y modelos de inteligencia artificial que tienen un acceso perfecto a los datos subyacentes.

Gracias a la versión de código abierto de Arctic, Snowflake permite a los clientes crear pilas personalizadas al combinar este LLM con una selección de modelos patentados (a través de asociaciones) o cualquier otro modelo de código abierto que se adapte de forma única a cualquier caso de uso específico. Sin mencionar que Arctic está incorporando su nuevo Características de Cortex.

Casos de uso iniciales en el Ártico

Hay casos de uso claros del Ártico como una herramienta interna y un medio para mejorar los productos de datos que puede aprovechar hoy. Por ejemplo, puedes empezar con:

Y eso es solo el principio. Los equipos pueden anticiparse al acelerar las tareas tediosas, lo que les permite dedicar más tiempo al diseño y a la toma de decisiones. En última instancia, el uso eficaz del Ártico aumentará la productividad de los equipos de desarrollo de Snowflake.

Además de beneficiar a los equipos internos, también vemos posibilidades con el intercambio de datos en salas limpias y las aplicaciones personalizadas en Streamlit.

En una sala limpia de datos, o en un entorno general para compartir datos de forma segura, un proveedor de datos puede obtener nuevos consumidores todos los días que no conocen los conjuntos de datos y los posibles análisis que se pueden derivar. Snowflake Arctic podría ser un asistente virtual que guíe a los nuevos consumidores a través de la experimentación, la comprensión de los datos, la investigación, el análisis y el consumo de datos. Esto elimina la sobrecarga impuesta al proveedor de datos para permitir la democratización de los datos de manera efectiva. Una sala limpia es un entorno ideal para ofrecer funcionalidad a los usuarios externos y, al mismo tiempo, imponer pautas de acceso a los datos y a los modelos.

En las aplicaciones personalizadas (quizás creadas en Streamlit), se pueden facilitar las consultas de datos más flexibles al habilitar conceptos de consulta dinámicos (visuales o basados en el lenguaje), lo que permite que Arctic resuelva el problema necesario.

Encontrar los casos de uso correctos y aprovechar un modelo de alto rendimiento dentro del ecosistema de Snowflake crea una variedad de posibilidades. Para los equipos empresariales, Arctic es otro modelo con el que le recomendamos que experimente y se adapte a sus casos de uso especializados. Si tiene la capacidad informática necesaria, ajúnela y aprovéchela también fuera del ecosistema de Snowflake.

Snowflake: El futuro de GenAI

El anuncio de Snowflake Arctic, junto con características adyacentes, como Córtex de copos de nieve, Streamlit en Snowflake, Copo de nieve ML, y Servicios de contenedores Snowflake, debería entusiasmar tanto a las tiendas de inteligencia artificial como a las de Snowflake. Snowflake se está preparando para convertirse en una solución integral que vincule los datos, la inteligencia artificial y la interacción humana de forma coherente. En conclusión, Arctic es otra señal que demuestra que Snowflake comprende las necesidades empresariales y entiende claramente el uso de la IA generativa en los casos de uso empresarial.

Blend puede ayudarlo a navegar por los entresijos de Resolución de problemas basada en la IA; ya sea estrategia, integración o ajuste fino de los modelos para lograr el rendimiento necesario. Creemos que el futuro pertenece a quienes crecen con la IA. Conéctese con nosotros hoy mismo.