Nuevo estándar para evaluar el rendimiento de la IA en entornos médicos
Se trata de HealthBench, una herramienta de código abierto diseñada para para medir el rendimiento y la seguridad de los modelos de lenguaje grande (LLMs) en escenarios médicos reales. La nueva […]
Continue Reading