chore: relax moderation prompt for casual chat

Remove unclear-message and low-quality-message warning criteria because this is a casual group. Keep short, ambiguous, informal, and light profanity messages clean unless they target someone or provoke conflict.

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
This commit is contained in:
MythEclipse
2026-05-14 04:36:59 +07:00
parent 9ff1261239
commit 4ff79bea73

View File

@@ -79,7 +79,7 @@ function parseLLMAnalysis(content: string): LLMAnalysis {
} }
return { return {
status: /flagged|bahaya|berisiko|toxic|hate|harassment|violence|sexual|self-harm|illegal|scam|hacking/i.test(content) ? "flagged" : /warn|profanity|oot|tone|sopan/i.test(content) ? "warn" : "clean", status: /flagged|bahaya|berisiko|toxic|hate|harassment|violence|sexual|self-harm|illegal|scam|hacking/i.test(content) ? "flagged" : /warn|provokasi|hinaan|menyerang/i.test(content) ? "warn" : "clean",
flags: [], flags: [],
score: 0, score: 0,
analysis: content.trim() || "Tidak ada analisis dari LLM.", analysis: content.trim() || "Tidak ada analisis dari LLM.",
@@ -101,7 +101,7 @@ async function runLLMAnalysis(texts: string[]): Promise<{ results: LLMAnalysis[]
role: "system", role: "system",
content: `Kamu moderator Discord komunitas. Analisis setiap pesan dengan 3 kategori: content: `Kamu moderator Discord komunitas. Analisis setiap pesan dengan 3 kategori:
- CLEAN: Pesan normal, tidak melanggar aturan - CLEAN: Pesan normal, tidak melanggar aturan
- WARN: Melanggar aturan minor (profanity ringan, tone kurang sopan, pertanyaan tidak jelas) - butuh peringatan tapi tidak dihapus - WARN: Melanggar aturan minor yang menarget orang lain (tone menyerang, hinaan ringan, konflik kecil) - butuh peringatan tapi tidak dihapus
- FLAGGED: Melanggar aturan berat (NSFW, ilegal, hacking, scam, harassment, violence, SARA, gore, spam, promosi judi) - butuh review moderator untuk penghapusan - FLAGGED: Melanggar aturan berat (NSFW, ilegal, hacking, scam, harassment, violence, SARA, gore, spam, promosi judi) - butuh review moderator untuk penghapusan
ATURAN KOMUNITAS LENGKAP: ATURAN KOMUNITAS LENGKAP:
@@ -132,16 +132,17 @@ ATURAN KOMUNITAS LENGKAP:
- Dilarang: hoaks, link berbahaya (phishing/scam), spam - Dilarang: hoaks, link berbahaya (phishing/scam), spam
- Dilarang: promosi, judi, link referral - Dilarang: promosi, judi, link referral
7. LANGSUNG KE INTI PERTANYAAN 7. DISKUSI BERKUALITAS
- Hindari pertanyaan seperti "Boleh nanya?" atau "Permisi, ada orang?"
- Langsung ajukan pertanyaan dengan jelas agar cepat ditanggapi
8. DISKUSI BERKUALITAS
- Berikan jawaban yang relevan, akurat, dan tidak menyesatkan - Berikan jawaban yang relevan, akurat, dan tidak menyesatkan
- Di channel "Area Serius", pertahankan standar tinggi - Di channel "Area Serius", pertahankan standar tinggi
KONTEKS KOMUNITAS:
- Ini grup bercanda/santai, jadi slang, candaan ringan, kata kasar ringan tanpa target, pesan pendek seperti "." atau "P", dan pertanyaan tidak jelas tetap CLEAN
- Jangan beri WARN hanya karena pesan singkat, informal, ambigu, low-quality, atau kurang konteks
- WARN hanya jika ada orang/kelompok yang diserang, dihina, diprovokasi, atau konflik mulai dipancing
PENENTUAN STATUS: PENENTUAN STATUS:
- WARN jika: profanity ringan, tone kurang sopan, pertanyaan tidak jelas, username/profil kurang pantas - WARN jika: hinaan ringan yang menarget orang/kelompok, provokasi konflik kecil, username/profil kurang pantas
- FLAGGED jika: profanity berat, harassment, threats, violence, illegal activity, hacking, scam, NSFW, SARA, gore, spam, judi, LGBT content - FLAGGED jika: profanity berat, harassment, threats, violence, illegal activity, hacking, scam, NSFW, SARA, gore, spam, judi, LGBT content
Balas JSON array dengan schema: [{"status":"clean|warn|flagged","flags":["..."],"score":0..1,"analysis":"ringkasan Bahasa Indonesia + alasan + aksi disarankan"}] Balas JSON array dengan schema: [{"status":"clean|warn|flagged","flags":["..."],"score":0..1,"analysis":"ringkasan Bahasa Indonesia + alasan + aksi disarankan"}]