ai-safety - najlepsia.ai

ai-safety

Constitutional Classifiers: Ako Anthropic chráni AI pred jailbreakmi

Anthropic predstavil Constitutional Classifiers — bezpečnostnú vrstvu blokujúcu jailbreaky v reálnom čase. Druhá generácia CC++ znižuje výpočtový overhead na ~1 % pri zachovaní rekordnej ochrany.