Anthropic ha publicado su enfoque evolutivo para evaluar y mitigar el espectro completo de daños potenciales causados por sistemas de IA. El nuevo marco examina impactos físicos, psicológicos, económicos, sociales y de autonomía individual, complementando su Política de Escalado Responsable centrada en riesgos catastróficos.
La empresa implementa esta metodología en funcionalidades como el uso de computadoras y los límites de respuesta del modelo, buscando equilibrar la utilidad con protecciones adecuadas. Anthropic invita a investigadores y expertos a colaborar en esta iniciativa que busca anticipar desafíos emergentes mientras los sistemas se vuelven más capaces.