Tehdit Manzarası
LLM tabanlı uygulamalar, geleneksel güvenlik modellerinin öngörmediği yeni saldırı yüzeyleri doğurur. Prompt injection en yaygın ve en kritik tehdit vektörüdür.
Temel Tehditler
- Direct Prompt Injection: Kullanıcının sistem talimatlarını geçersiz kılmaya çalışması
- Indirect Injection: Dış içerik (doküman, web sayfası) aracılığıyla modeli yönlendirme
- Data Exfiltration: Sistem prompt veya hassas bağlamı sızdırmaya yönelik sorgular
- Jailbreak: Model güvenlik sınırlarını aşan teknikler
Savunma Katmanları
- Input Validation: Şüpheli pattern tespiti ve sanitizasyon
- Privilege Separation: Sistem prompt ve kullanıcı girdisini net biçimde ayırt eden mimariler
- Output Filtering: Hassas veri kalıplarının çıktıdan temizlenmesi
- Monitoring & Alerting: Anormal sorgu örüntülerinin gerçek zamanlı tespiti