DarkMoon: Platform Pentesting AI Open-Source untuk Otomatisasi Penilaian Keamanan

Dunia pentesting (penetrasi testing) dulunya sangat bergantung pada keahlian manusia. Para spesialis menghabiskan berhari-hari menjelajahi jaringan atau aplikasi web secara manual, proses yang memakan waktu berminggu-minggu dan biaya konsultan yang mencapai ribuan dolar setiap harinya. Hasilnya pun bervariasi, tergantung pada siapa pentester-nya. Namun, hadirnya otomatisasi berjanji akan menjembatani kesenjangan ini.

Sekarang, semakin banyak proyek menyerahkan pekerjaan ini kepada agen AI yang mampu merencanakan dan mengeksekusi sendiri. Salah satu proyek yang menonjol dalam kelompok ini adalah DarkMoon Open Source AI Pentesting Platform. DarkMoon menjalankan penilaian keamanan secara menyeluruh dan menyediakan laporan berbasis bukti setelah selesai.

Bagaimana DarkMoon Bekerja? Arsitektur yang Cerdas

DarkMoon dirancang dengan memisahkan model yang "berpikir" dari alat yang "bertindak". Ini adalah fondasi penting untuk keamanan dan akurasi.

Sebuah orkestrator bernama OpenCode berkomunikasi dengan model bahasa besar (LLM), merencanakan setiap langkah, lalu mendelegasikan tindakan nyata ke lapisan kontrol yang dibangun di atas Model Context Protocol (MCP). Lapisan MCP ini mengekspos daftar alat yang diizinkan (allow-list) dan menjalankan alat-alat tersebut di dalam kontainer Docker yang terisolasi. Kontainer ini sudah dilengkapi dengan lebih dari lima puluh utilitas keamanan, termasuk Nuclei, sqlmap, BloodHound, dan NetExec. Selain itu, DarkMoon juga memiliki sub-agen khusus yang mencakup aplikasi web, Active Directory, Kubernetes, dan protokol jaringan.

Alur Penilaian Otomatis

Penilaian di DarkMoon mengikuti urutan yang teratur. Pertama, platform ini akan menemukan port dan layanan yang terbuka, lalu melakukan fingerprinting terhadap technology stack. Setelah itu, ia memodelkan attack surface dan mengirimkan sub-agen yang cocok dengan apa yang ditemukan.

Sistem umpan balik reaktif memastikan hasil setiap langkah dikembalikan ke orkestrator. Misalnya, jika situs WordPress terdeteksi di awal, agen CMS akan dipicu. Jika endpoint GraphQL ditemukan kemudian, agen GraphQL akan ditarik masuk. Cakupan penilaian ini selaras dengan metodologi yang sudah mapan, seperti ISO 27001 dan NIST SP 800-115.

Prioritas Keamanan dan Batasan Lingkup

Salah satu kekhawatiran terbesar dalam otomatisasi AI adalah otonomi yang tak terbatas. DarkMoon menangani ini dengan serius. Boutayeb, pemimpin pemeliharaan DarkMoon, menjelaskan bahwa LLM tidak pernah mengeksekusi perintah arbitrer secara langsung. Setiap tindakan melewati server MCP, yang hanya mengekspos daftar alat dan alur kerja yang secara eksplisit diizinkan.

Lingkup penilaian ditentukan oleh pengguna di awal setiap eksekusi, misalnya sebagai target, domain, rentang IP, atau aplikasi. Orkestrator hanya membangun gambaran dari aset yang ditemukan di dalam batas yang diotorisasi tersebut dan menyerahkan eksekusi ke metodologi yang disetujui. Alat baru tidak akan tersedia sampai seseorang menginstalnya, mendaftarkannya di server MCP, dan mengeksposnya ke lapisan orkestrasi. Tujuan desain ini adalah "membuat eksekusi deterministik, dapat diaudit, dan terbatas daripada membiarkan perilaku otonom yang tidak terbatas," kata Boutayeb.

Pilihan Model LLM dan Pertimbangan Biaya

Pertanyaan tentang biaya selalu muncul. Untuk penilaian aplikasi web standar menggunakan model frontier, biayanya sekitar sepuluh dolar dalam biaya API. Tentu saja, keterlibatan yang lebih besar seperti Active Directory atau infrastruktur multi-host akan memakan lebih banyak biaya, karena model terus melakukan penalaran berdasarkan bukti baru, merencanakan langkah-langkah, dan jalur serangan.

DarkMoon mendukung berbagai model LLM, termasuk OpenAI, Anthropic, OpenRouter, dan model lokal melalui Ollama atau llama.cpp. Boutayeb merekomendasikan Claude karena keseimbangan antara kualitas penalaran, stabilitas perencanaan, dan kinerja konteks panjangnya.

Namun, ada sedikit catatan terkait sistem keamanan vendor. Model Anthropic terbaru memiliki klasifikasi yang dapat menginterupsi, menolak, atau diam-diam menurunkan tugas keamanan ofensif, bahkan dalam keterlibatan yang diizinkan. Dalam pengujian DarkMoon, Claude Opus 4.8 mencapai batas-batas tersebut di tengah penilaian, sementara Claude Opus 4.6 menjalankan penilaian hingga selesai tanpa interupsi. Proyek ini menyarankan operator menggunakan Opus 4.6 sebagai pilihan yang paling stabil, dan menyebutkan Program Verifikasi Siber Anthropic sebagai jalur opsional bagi organisasi yang disetujui. Model kecil dalam rentang parameter yang lebih rendah tetap tidak didukung untuk menjalankan tugas otonom ini.

Singkatnya, "Ini bisa sepenuhnya gratis untuk dijalankan jika Anda tetap di lokal, atau beberapa dolar per penilaian jika Anda menginginkan kualitas penalaran tambahan dari model frontier. Setiap pengguna memilih keseimbangan mereka sendiri antara biaya dan kemampuan," kata Boutayeb.

Laporan Berbasis Bukti: Akurasi dan Transparansi

DarkMoon hanya mempromosikan temuan jika ada bukti yang mendukungnya. Sinyal lemah seperti respons HTTP 200 generik, payload yang terefleksi, dan indikator yang ambigu akan diturunkan peringkatnya dan diberi label Unconfirmed.

Temuan yang dikonfirmasi dilengkapi dengan perintah yang dieksekusi, keluaran mentah, pasangan permintaan dan respons HTTP, serta jejak eksekusi yang mendukungnya. Boutayeb menegaskan, "LLM tidak pernah diperlakukan sebagai sumber kebenaran. Bukti yang dikumpulkan dari lingkungan target tetap menjadi sumber kebenaran." Dia menambahkan bahwa tujuan ini menjaga validasi analis, mengurangi triage manual, dan memastikan setiap kesimpulan dapat dilacak dan direproduksi.

DarkMoon tersedia secara gratis di GitHub, memberikan kesempatan bagi siapa saja untuk meningkatkan postur keamanan mereka dengan otomatisasi AI.