Deepseek chatbot beats Openai en la clasificación de la tienda de aplicaciones


Durante el fin de semana, la compañía china de IA Deepseek lanzó una aplicación de chat AI que incluye un modelo de IA de “razonamiento” comparable al O1 de OpenAI, causando un revuelo entre las compañías de IA estadounidenses a medida que Deepseek se elevó a la cima de la App Store de Apple.

Deepseek es una empresa con sede en Hangzhou, China, que proporciona modelos de IA generativos e integración de IA. Sus primeros productos para hacer olas en el mercado estadounidense son los profundos y R1 tipo GPT-4, un “modelo de razonamiento” avanzado. Como ChatgptDeepseek-v3 y R1 responden rápidamente las indicaciones en idioma natural.

Las acciones de Nvidia y Microsoft cayeron el lunes después del Buzzy debut. En general, el mercado de valores reflejó una caída repentina en la confianza en los fabricantes de IA de EE. UU. El éxito de Deepseek provocó una conversación sobre si las restricciones estadounidenses sobre el acceso chino a los chips de IA limitan o alentaron la competencia.

Para los profesionales de la tecnología, Deepseek ofrece otra opción para escribir código o mejorar la eficiencia en torno a las tareas diarias. Junto con que el modelo R1 de Deepseek sea capaz de explicar su razonamiento, se basa en una familia de modelos de código abierto a los que se puede acceder en GitHub.

¿Qué es notable de Deepseek?

Al igual que el O1 de OpenAI (anteriormente conocido como Strawberry), el modelo de razonamiento ralentiza sus capacidades de predicción para “razonar” a través de su trabajo, lo que le ayuda a proporcionar respuestas más precisas. En particular, los modelos de razonamiento han obtenido bien en puntos de referencia para matemáticas y codificación.

Deepseek dijo Deepseek-v3 anotó más alto que GPT-4O en las pruebas MMLU y Humaneval, dos de una batería de evaluaciones que comparan las respuestas de AI.

Deepseek dijo que uno de sus modelos cuesta $ 5.6 millones para entrenaruna fracción del dinero que a menudo gastado en proyectos similares en Silicon Valley.

Se puede acceder a Deepseek-V3 y R1 a través de la App Store o en un navegador. Los visitantes del sitio Deepseek pueden seleccionar el modelo R1 para respuestas más lentas a preguntas más complejas. Cuando se selecciona, el modelo R1 crea largas respuestas que explican en un estilo de conversación cómo llegó a sus conclusiones.

Hasta el lunes por la mañana, el sitio advirtió al sitio de chat de Deepseek puede verse interrumpido, aunque el chatbot funcionaba normalmente.

Deepseek también ofrece un APII, que funciona a través del SDK de OpenAI o el software compatible con el OpenAI SDK.

Ver: OpenAi anunciado Operadorun agente de IA que puede tomar acciones de varios pasos en un navegador web, como elegir vuelos.

¿Qué significa el lanzamiento de Deepseek’s V3 y R1 para la industria de la IA?

“Podemos esperar completamente que se construya un ecosistema de aplicaciones en R1, así como en varios proveedores de nubes globales que ofrecen sus modelos como una API consumible”, dijo el analista vicepresidente de Gartner, Arun Chandrasekaran, en un correo electrónico a TechRepublic. “El éxito futuro de Deepseek se basa en su capacidad para innovar continuamente (en lugar de ser un éxito único), construir un ecosistema de desarrolladores en sus productos y superar las barreras culturales, dada su país de origen”.

Chandrasekaran dijo que el bajo costo, la eficiencia, los resultados de referencia de Deepseek y los pesos abiertos lo hacen notable.

Deepseek-V3 fue entrenado en 2.048 GPU NVIDIA H800. Los fabricantes estadounidenses no están, según las reglas de exportación establecidas por la administración Biden, a los que se les permite vender chips de capacitación de IA de alto rendimiento a empresas con sede en China.

“El poder potencial y el desarrollo de bajo costo de Deepseek están poniendo en tela de juicio los cientos de miles de millones de dólares cometidos en los Estados Unidos”, dijo Ivan Feinseth, analista de mercado de Tigress Financial, según una nota para los clientes adquiridos por ABC News.

Deepseek se diferencia aún más al ser un código abiertoProyecto impulsado por la investigación, mientras que OpenAi se centra cada vez más en los esfuerzos comerciales.

“Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto, y como código abierto, un regalo profundo para el mundo”, “, el capitalista de aventura de Silicon Valley, Marc Andreessen, publicó en X el viernes.

Gartner dijo que la industria mundial de semiconductores de IA alcanzará los $ 114,048 en 2025. Gartner predijo el El poder requerido para que los centros de datos ejecuten servidores de IA recién agregados Llegará a 500 Terawatt-Hours para 2027.

Deepseek presenta modelos multimodales

El lunes, Deepseek siguió su éxito con otra sorpresa: la Janus-Pro Familia de modelos multimodales. Estos modelos pueden analizar y generar imágenes.

Leave a Reply

Your email address will not be published. Required fields are marked *