¿Qué es GPT-4 y de qué es capaz?


GPT-4 es un sistema de inteligencia artificial de gran escala que puede imitar el habla y el razonamiento humanos. Lo hace entrenándose en una vasta biblioteca de comunicación humana existente, desde obras clásicas de literatura hasta grandes franjas de Internet.

La inteligencia artificial de este tipo se basa en su entrenamiento para predecir qué letra, número u otro carácter es probable que aparezca en la secuencia. Esta hoja de referencia explora GPT-4 desde un alto nivel: cómo acceder a GPT-4 para uso comercial o de consumo, quién lo creó y cómo funciona.

¿Qué es GPT-4?

GPT-4 es un gran modelo multimodal que puede imitar prosa, arte, video o audio producido por un ser humano. GPT-4 puede resolver problemas escritos o generar texto o imágenes originales. GPT-4 es la cuarta generación de El modelo de base de OpenAI.

La API GPT-4, así como las API GPT-3.5 Turbo, DALL·E y Whisper, ahora están disponibles de forma general a partir del 7 de julio de 2023.

El 13 de mayo, OpenAI reveló GPT-4ola próxima generación de GPT-4, que es capaz de producir contenidos de voz y vídeo mejorados.

A partir de julio, la organización ofrece un modelo más pequeño, GPT-4o mini. Cuesta menos (15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida) que el modelo base y está disponible en la API de asistentes, la API de finalización de chat y la API de lotes, así como en todos los niveles de ChatGPT. Por ahora, solo maneja texto y visión.

¿Quién es el propietario de GPT-4?

GPT-4 es propiedad de OpenAI, una empresa de inteligencia artificial independiente con sede en San Francisco. OpenAI se fundó en 2015; comenzó como una organización sin fines de lucro, pero desde entonces ha pasado a un modelo con fines de lucro. OpenAI ha recibido financiación de Elon Musk, Microsoft, Amazon Web Services, Infosys y otros patrocinadores corporativos e individuales.

OpenAI también ha producido ChatGPTun chatbot gratuito que surgió del modelo de la generación anterior, GPT-3.5, y DALL-E, un modelo de aprendizaje profundo que genera imágenes. A medida que la tecnología mejora y aumenta sus capacidades, OpenAI revela cada vez menos sobre cómo se entrenan sus soluciones de IA.

¿Cuando se lanzó GPT-4?

OpenAI anunció el lanzamiento de GPT-4 el 14 de marzo de 2023. GPT-4 estuvo inmediatamente disponible para los suscriptores de ChatGPT Plus, mientras que otros usuarios interesados ​​​​debieron unirse a una lista de espera para acceder.

VER: Salesforce incorporó la IA generativa a su Ventas y servicio de campo productos. (TechRepublic)

¿Cómo puedo acceder a GPT-4?

La versión pública de GPT-4 está disponible en Sitio del portal ChatGPT.

El 7 de julio de 2023, OpenAI realizó la API GPT-4 Disponible para uso general para “todos los desarrolladores de API existentes con un historial de pagos exitosos”. OpenAI también espera abrir el acceso a nuevos desarrolladores a fines de julio de 2023. Los límites de velocidad pueden aumentar después de ese período dependiendo de la cantidad de recursos computacionales disponibles.

En agosto de 2023, GPT-4 se empaquetó como parte de ChatGPT EmpresaLos usuarios de la suscripción orientada a empresas reciben el uso ilimitado de una red de alta velocidad a GPT-4.

¿Cuánto cuesta utilizar GPT-4?

Para una persona, la suscripción a ChatGPT Plus cuesta $20 por mes.

El precio de la API GPT-4 de solo texto comienza en $0,03 por cada 1000 tokens de solicitud (un token equivale aproximadamente a cuatro caracteres en inglés) y $0,06 por cada 1000 tokens de finalización (salida), dijo OpenAI. (OpenAI explica más sobre cómo se cuentan los tokens aquí.)

VER: Política ética de la inteligencia artificial (Premium de TechRepublic)

También está disponible una segunda opción con mayor extensión de contexto (aproximadamente 50 páginas de texto), conocida como gpt-4-32k. Esta opción cuesta $0,06 por cada 1000 tokens de solicitud y $0,12 por cada 1000 tokens de finalización.

Otros servicios de asistencia de IA como Microsoft Copilot y Copilot X de GitHub ahora funcionan en GPT-4.

¿Cuáles son las capacidades de GPT-4?

Al igual que su predecesor, GPT-3.5, la principal característica de GPT-4 es su salida en respuesta a preguntas en lenguaje natural y otras indicaciones. OpenAI dice GPT-4 puede “seguir instrucciones complejas en lenguaje natural y resolver problemas difíciles con precisión”. En concreto, GPT-4 puede resolver problemas matemáticos, responder preguntas, hacer inferencias o contar historias. Además, GPT-4 puede resumir grandes fragmentos de contenido, lo que podría resultar útil para casos de referencia para consumidores o de uso comercial, como por ejemplo, cuando una enfermera resume los resultados de su visita a un cliente.

OpenAI probó la capacidad de GPT-4 para repetir información en un orden coherente utilizando varias evaluaciones de habilidades, incluidos los exámenes AP y Olympiad y el Uniform Bar Examination. Obtuvo el 90.° percentil en el examen de abogacía y el 93.° percentil en el examen SAT Evidence-Based Reading & Writing. GPT-4 obtuvo diferentes puntajes en los exámenes AP.

Estas no son verdaderas pruebas de conocimiento; en cambio, ejecutar GPT-4 a través de pruebas estandarizadas muestra la capacidad del modelo para formar respuestas que suenan correctas a partir de la masa de escritura y arte preexistentes con los que fue entrenado.

GPT-4 predice qué token es probable que aparezca a continuación en una secuencia. (Un token puede ser una sección de una cadena de números, letras, espacios u otros caracteres). Si bien OpenAI no habla de los detalles específicos del entrenamiento de GPT-4, los LLM generalmente se entrenan traduciendo primero la información de un conjunto de datos en tokens; luego, el conjunto de datos se limpia para eliminar datos confusos o repetitivos. A continuación, las empresas de IA generalmente emplean personas para aplicar el aprendizaje de refuerzo al modelo, lo que empuja al modelo hacia respuestas que tienen sentido común. Los pesos, que, en términos muy simples, son los parámetros que le indican a la IA qué conceptos están relacionados entre sí, se pueden ajustar en esta etapa.

La API de finalización de chat y sus actualizaciones

El API de finalización de chat permite a los desarrolladores utilizar la API GPT-4 a través de un formato de texto libre. Con ella, pueden crear chatbots u otras funciones que requieran una conversación de ida y vuelta. La API Chat Completions estuvo disponible por primera vez en junio de 2020.

En enero de 2024, la API de finalización de chat se actualizará para utilizar modelos de finalización más nuevos. Los modelos ada, babbage, curie y davinci de OpenAI se actualizarán a la versión 002, mientras que las tareas de finalización de chat que utilicen otros modelos pasarán a gpt-3.5-turbo-instruct.

Puesta a punto del GPT-3.5 Turbo y otras novedades

El 22 de agosto de 2023, OpenAPI anunció la disponibilidad de Ajuste fino para GPT-3.5 TurboEsto permite a los desarrolladores personalizar modelos y probar esos modelos personalizados para sus casos de uso específicos.

En enero de 2023, OpenAI lanzó la última versión de su API de moderación, que ayuda a los desarrolladores a identificar texto potencialmente dañino. La última versión se conoce como text-moderation-007 y funciona de acuerdo con las normas de OpenAI. Mejores prácticas de seguridad.

¿Cuáles son las limitaciones de GPT-4 para las empresas?

Al igual que otras herramientas de IA de su tipo, GPT-4 tiene limitaciones. Por ejemplo, no comprueba si sus afirmaciones son precisas. Su entrenamiento con texto e imágenes de Internet puede hacer que sus respuestas sean absurdas o provocativas. Sin embargo, OpenAI cuenta con controles digitales y capacitadores humanos para intentar que el resultado sea lo más útil y adecuado posible para la empresa.

Además, GPT-4 tiende a crear “alucinaciones”, que es el término que utiliza la inteligencia artificial para referirse a las imprecisiones. Sus palabras pueden tener sentido en secuencia, ya que se basan en probabilidades establecidas por lo que se entrenó al sistema, pero no están verificadas ni conectadas directamente con eventos reales. OpenAI está trabajando para reducir la cantidad de falsedades que produce el modelo.

Otra limitación importante es la cuestión de si la información corporativa confidencial que se introduce en GPT-4 se utilizará para entrenar el modelo y exponer esos datos a terceros. Microsoft, que tiene un acuerdo de reventa con OpenAI, planea ofrecer instancias privadas de ChatGPT a corporaciones a finales del segundo trimestre de 2023, según Un informe de abril.

Al igual que GPT-3.5, GPT-4 no incorpora en su léxico información más reciente que septiembre de 2021. Uno de los competidores de GPT-4, Google Bard, sí tiene información actualizada al minuto porque está entrenado en Internet actual.

La IA puede sufrir un colapso del modelo cuando se entrena con datos creados por ella misma; este problema se está volviendo más común a medida que proliferan los modelos de IA.

GPT-4 frente a GPT-3.5 o ChatGPT

El segundo modelo más reciente de OpenAI, GPT-3.5, difiere de la generación actual en algunos aspectos. OpenAI no ha revelado el tamaño del modelo con el que se entrenó GPT-4, pero dice que se trata de “más datos y más computación” que los miles de millones de parámetros con los que se entrenó ChatGPT. GPT-4 también ha demostrado más destreza a la hora de escribir una variedad más amplia de materiales, incluida la ficción.

GPT-4 tiene un mejor rendimiento que ChatGPT en las pruebas estandarizadas mencionadas anteriormente. Las respuestas a las indicaciones que se le dan al chatbot pueden ser más concisas y más fáciles de analizar. OpenAI señala que GPT-3.5 Turbo iguala o supera a GPT-4 en ciertas tareas personalizadas.

Además, GPT-4 es mejor que GPT-3.5 a la hora de tomar decisiones empresariales, como la programación o la elaboración de resúmenes. GPT-4 tiene “un 82 % menos de probabilidades de responder a solicitudes de contenido no permitido y un 40 % más de probabilidades de producir respuestas objetivas”. OpenAI dijo.

VER: Aprender Cómo utilizar ChatGPT.(Academia TechRepublic)

Otra gran diferencia entre los dos modelos es que GPT-4 puede manejar imágenesPuede servir como ayuda visual, describiendo objetos del mundo real o determinando los elementos más importantes de un sitio web y describiéndolos.

“En una variedad de dominios, incluidos documentos con texto y fotografías, diagramas o capturas de pantalla, GPT-4 exhibe capacidades similares a las que muestra en entradas de solo texto”, escribió OpenAI en su Documentación de GPT-4.

Las últimas novedades de GPT-4

Microsoft anunció a principios de agosto que la disponibilidad de GPT-4 en Azure OpenAI Service se ha ampliado a Varias nuevas regiones de cobertura.

A partir de noviembre de 2023, los usuarios que ya estén explorando el ajuste fino de GPT-3.5 podrán postularse al programa de acceso experimental de ajuste fino de GPT-4.

OpenAI también lanzó un programa de modelos personalizados que ofrece aún más personalización que la que permite el ajuste fino. Las organizaciones pueden solicitar un número limitado de plazas (cuyo costo inicial es de entre 2 y 3 millones de dólares). aquí.

En la primera conferencia DevDay de OpenAI en noviembre, OpenAI demostró que Turbo GPT-4 Podría manejar Más contenido a la vez (más de 300 páginas de un libro estándar) que GPT-4. GPT-4 Turbo está disponible en versión preliminar a partir de noviembre. OpenAI redujo los precios de GPT-4 Turbo en noviembre de 2023. El precio de GPT-3.5 Turbo se redujo varias veces, la más reciente en Enero de 2024.

El 9 de abril, OpenAI anunció GPT-4 con Vision está generalmente disponible en la API de GPT-4lo que permite a los desarrolladores utilizar un modelo para analizar texto y vídeo con una sola llamada API.



Leave a Reply

Your email address will not be published. Required fields are marked *