ai-safety
Constitutional Classifiers: Ako Anthropic chráni AI pred jailbreakmi
Anthropic predstavil Constitutional Classifiers — bezpečnostnú vrstvu blokujúcu jailbreaky v reálnom čase. Druhá generácia CC++ znižuje výpočtový overhead na ~1 % pri zachovaní rekordnej ochrany.