La esperada versión de ChatGPT salió el pasado Marzo, abriendo una ventana a las nuevas capacidades del chatbot basado en inteligencia artificial (IA).
Desarrollado por OpenAI, GPT-4 es un modelo de lenguaje grande (LLM) que ofrece mejoras significativas en las capacidades de ChatGPT en comparación con GPT-3, introducido hace menos de dos meses. GPT-4 cuenta con medidas de seguridad y privacidad más sólidas, textos de entrada y salida más largos, y respuestas más precisas, detalladas y concisas para preguntas matizadas. Aunque la salida de GPT-4 sigue siendo textual, una capacidad multimodal que aún no se ha hecho pública permitirá entradas tanto de texto como de imágenes.
Las implicaciones potenciales para las aseguradoras son profundas y solo deberían volverse más pronunciadas a medida que mejora la tecnología. OpenAI seguirá lanzando versiones futuras, permitiendo a las aseguradoras implementar y personalizar más fácilmente las aplicaciones a lo largo de la cadena de valor de los seguros, desde la adquisición de clientes hasta el procesamiento de reclamaciones.
Resultados más significativos
La actualización de GPT-4 está actualmente disponible solo para los suscriptores de ChatGPT Plus. En comparación con GPT-3, la nueva versión responde mejor a las preguntas que dependen del razonamiento y la creatividad. Según OpenAI, GPT-4 logra puntuaciones de rendimiento a nivel humano para muchos tests estandarizados, como una simulación del examen de admisión a la escuela de derecho, el examen de aptitud escolástica y el examen de registro de posgrado. En un examen uniforme simulado para abogados, GPT-4 obtuvo entre el 80-90% en comparación con GPT-3, que cayó en el 10% inferior.
El mes pasado, RGA planteó tres preguntas sobre seguros a GPT-3 con resultados mixtos. Mientras que GPT-3 proporcionó buenas respuestas a preguntas sobre los efectos de la mortalidad a largo plazo de la COVID-19 y el futuro de la distribución digital, tropezó con una consulta más matizada. GPT-3 supuso incorrectamente que los padres adoptivos podrían transmitir una condición genética a sus hijos biológicamente no relacionados. GPT-4 respondió correctamente a las tres preguntas, proporcionando más detalles para las dos respuestas correctas sin añadir sustancialmente a la longitud de la respuesta.
En un conjunto de 50 preguntas relacionadas con la suscripción preparadas por RGA, GPT-3 se desempeñó bien en aquellas que trataban estrictamente de anatomía, fisiología, prácticas de seguros de vida o suscripción. Sin embargo, GPT-3 a menudo no podía responder correctamente a las preguntas de disciplinas cruzadas. Además, evaluar los riesgos de suscripción de ciertas aficiones y comorbilidades resultó difícil.
GPT-4 demostró ser en general más preciso que GPT-3. Aunque GPT-3 proporcionó 38 respuestas correctas a las 50 preguntas, GPT-4 pudo responder correctamente a 47. El modelo actualizado proporcionó respuestas más precisas, detalladas y concisas al ajustar o incluso eliminar algunas introducciones y redundancias generadas por GPT-3. En general, cuanto más se alejaban las preguntas del conocimiento general hacia el conocimiento específico de la industria de seguros, más se degradaban las respuestas de ChatGPT.
Por supuesto, ChatGPT-4 no está libre de errores. OpenAI es la primera en admitir que los humanos deben revisar su trabajo. Por ejemplo, cuando se le preguntó qué partes deben tener un interés asegurable en una póliza y si los agentes pueden realizar pruebas médicas específicas, GPT-4 respondió incorrectamente.
Avanzar con precaución
Aunque GPT-4 ofrece emocionantes oportunidades para los seguros y un sinfín de otras industrias, su potencial proporciona motivo de precaución. Considere esto: En medio de una carrera para incorporar LLM, como GPT-4, en motores de búsqueda, es posible que las consultas a Google, Bing y otros no devuelvan una lista de páginas para leer. En su lugar, los motores podrían presentar una respuesta que sintetiza el material fuente. Tal presentación podría impedir que el usuario lea varios artículos que cubren temas desde diferentes puntos de vista, lo que podría resultar en un cambio sustancial hacia sitios web que proporcionan material fuente original. Por lo tanto, los resultados de la búsqueda podrían carecer de credibilidad al ser sesgados, engañosos o incorrectos.
Las opiniones difieren sobre qué efecto podrían tener los LLM en el futuro de la sociedad. Los luminarios de la IA continúan debatiendo si los LLM tienen la capacidad de crear, planificar o razonar. Casi todos los expertos coinciden en que los LLM trabajan con información existente que no puede expandir las fronteras del entendimiento humano.
También es seguro que esta tecnología seguirá creciendo y las aseguradoras explorarán e identificarán nuevos casos de uso. El desarrollo de GPT-5 ya está en marcha por parte de OpenAI, aunque aún no se ha anunciado la fecha oficial de lanzamiento.