Pernahkah Anda bertanya-tanya bagaimana agen AI bisa mengingat konteks percakapan atau tugas yang mereka lakukan dalam jangka panjang? Kemampuan memori yang efektif sangat penting. Banyak alat memori yang ada saat ini bersifat pasif, artinya agen harus bertanya, menganalisis hasilnya, lalu baru memutuskan langkah selanjutnya. Namun, hadirnya Memanto AI mengubah paradigma tersebut.
Memanto AI adalah agen memori aktif yang dirancang khusus untuk memenuhi kebutuhan agen AI. Teknologi ini memungkinkan agen AI memiliki konteks persisten antar sesi, dengan kemampuan retrieval informasi yang canggih dan latensi ingestion nol. Desain Memanto AI berakar dari masukan langsung agen AI yang mengeluhkan celah dalam sistem memori. Keluhan tersebut disaring menjadi enam celah konkret yang kini diatasi oleh Memanto AI.
Mengapa Memanto AI Berbeda?
Memanto AI dibangun untuk tim yang menginginkan memori agen SOTA tanpa kerumitan berbasis grafik. Sistem ini memadukan skema memori semantik dengan mesin retrieval informasional. Ini adalah database semantik tanpa pengindeksan yang menawarkan pencarian exact, retrieval di bawah 90 milidetik, dan penundaan ingestion nol.
Beberapa keunggulan utama Memanto AI meliputi:
- Ketersediaan Instan: Tidak ada waktu tunggu pengindeksan atau biaya ekstra LLM saat menulis memori. Setiap memori dapat langsung dicari begitu disimpan.
- Arsitektur Tanpa Server: Sistem ini dapat menyesuaikan skala hingga nol saat tidak digunakan, sehingga efisien.
- API Sederhana: Hanya memerlukan satu panggilan. Tidak ada pipeline bertahap, tidak ada skema grafik yang perlu dikelola, atau reranker yang harus dihubungkan.
- Retrieval Bersih: Memanto AI dilengkapi dengan 13 kategori memori bawaan, seperti User Profile, Conversational Context, dan Tool Usage. Ini membantu retrieval yang lebih rapi dan deteksi kontradiksi.
Memanto AI juga mampu menghasilkan respons yang didasarkan pada LLM secara langsung dari memori agen Anda, tanpa memerlukan kunci API tambahan.
Pengalaman Pengembang dengan Memanto AI
Memanto AI menghadirkan Command Line Interface (CLI) yang kuat dan ramah pengembang. Anda dapat mengelola memori agen sepenuhnya dari terminal, tanpa perlu server lokal. Untuk menggunakan Memanto AI, Anda memerlukan kunci API Moorcheh yang bisa dibuat di Moorcheh Dashboard. Menariknya, Memanto AI memiliki akses LLM bawaan, sehingga Anda tidak memerlukan kunci API model eksternal terpisah untuk alur kerja memori umum.
Menggunakan Tipe Memori
Anda dapat menggunakan tipe memori untuk mengkategorikan apa yang Anda simpan. Ini membuat retrieval menjadi lebih bersih dan terkontrol.
bash# Menyimpan memori dengan tipe spesifik memanto save "Nama saya John Doe." --type user_profile # Memfilter pencarian berdasarkan tipe memanto search "Siapa nama saya?" --filter_by_type user_profile
Akses Programatik Melalui REST API
Untuk akses programatik, Memanto AI menyediakan REST API berbasis sesi yang bersih. Penting untuk dicatat, Memanto AI belum memiliki server API hosting. Anda perlu menjalankan server lokal terlebih dahulu untuk menggunakan endpoint ini, misalnya: http://127.0.0.1:8000.
Berikut adalah beberapa endpoint API yang tersedia:
| Kategori | Endpoint | Deskripsi |
|---|---|---|
| Agen | /agent/create | Membuat namespace agen baru. |
/agent/list | Mencantumkan semua agen yang tersedia. | |
/agent/get_metadata | Mendapatkan metadata untuk agen spesifik. | |
/agent/delete | Menghapus metadata agen lokal, juga menghapus backup namespace Moorcheh. | |
| Sesi | /session/start | Memulai sesi dan mengembalikan JWT 6 jam. |
/session/end | Mengakhiri sesi secara manual. | |
/session/check_status | Memeriksa status sesi aktif untuk agen. | |
| Memori | /memory/store | Menyimpan memori baru ke dalam database semantik agen. |
/memory/store_batch | Menyimpan hingga 100 memori dalam satu permintaan. | |
/memory/upload_file | Mengunggah file (.pdf, .docx, .xlsx, .json, .txt, .csv, .md). Konten dipecah menjadi bagian-bagian dan dapat dicari. | |
/memory/search_exact | Menjalankan pencarian semantik exact terhadap memori agen. | |
/memory/generate_rag_answer | Menghasilkan jawaban RAG yang didasarkan pada memori agen (memerlukan RAG_PROMPT_TEMPLATE yang dikonfigurasi). |
Untuk operasi yang terkait dengan sesi dan memori, header Authorization: Bearer <JWT> harus dikonfigurasi di Memanto.
Perbandingan Memanto AI
Memanto AI menghadirkan perbedaan signifikan dibanding alat memori tradisional:
| Fitur | Alat Memori Umum | Memanto AI |
|---|---|---|
| Latensi Pengindeksan | Menit | Instan |
| Jenis Pencarian | Perkiraan (approximate search) | Exact search |
| Arsitektur | Stateful | Serverless/stateless |
| Penghematan Komputasi | - | 80% |
Dukungan Penelitian
Memanto AI didukung oleh penelitian peer-reviewed. Untuk hasil benchmark, metodologi, dan detail teknis, Anda dapat melihat makalah mereka di Hugging Face. Sumber daya dan model lainnya juga tersedia di platform yang sama. Jika Anda menggunakan Memanto AI dalam penelitian, disarankan untuk mengutipnya.
Untuk pertanyaan atau umpan balik, tim Memanto AI siap membantu. Informasi lebih lanjut dan panduan pengaturan tambahan juga tersedia di situs web Moorcheh.
