Di ajang tahunan Google I/O 2026 yang digelar pada Selasa, 19 Mei 2026 di Mountain View, California, AS, Google resmi memperkenalkan Gemini Omni. Model kecerdasan buatan terbaru ini hadir sebagai partner kreatif yang akan mengubah cara kita edit video AI. Dengan Google Gemini Omni, proses pembuatan konten visual bergerak menjadi lebih mudah dan intuitif.
Gemini Omni menggabungkan kecerdasan inti Gemini dengan kemampuan media generatif canggih, termasuk mengubah gambar menjadi video dan mengedit video menjadi video baru dengan teknologi AI. Google bahkan menyebutnya sebagai "Nano Banana" untuk video, sebuah gambaran betapa ringkas dan kuatnya alat ini dalam pembuatan video melalui kata-kata.
Memahami Gemini Omni: Model Multimodal untuk Video
Gemini Omni dirancang sebagai model AI multimodal. Ini berarti Gemini Omni dapat menerima berbagai format input, mulai dari teks, gambar, audio, hingga video, lalu mengubahnya menjadi konten visual bergerak yang utuh. Google menyebut Gemini Omni sebagai langkah lanjutan dari Google Veo, model AI terdahulu yang berfokus pada pembuatan dan pengeditan gambar. Kini, kemampuan multimodal tersebut diperluas ke ranah video generatif, dan Gemini Omni akan menggantikan Veo di aplikasi Gemini.
Pengguna dapat memulai pembuatan video dari nol, meremix galeri yang sudah ada, atau mencoba template bawaan. Konsepnya sederhana, ucapkan, saksikan, dan bagikan kreasi Anda.
Kemudahan Edit Video Lewat Percakapan Alami
Salah satu daya tarik utama Gemini Omni adalah kemampuannya mengedit video melalui percakapan alami. Anda cukup mengetik perintah dalam bahasa natural, layaknya sedang mengobrol, dan AI akan langsung menyesuaikan isi video sesuai instruksi. Ini memungkinkan Anda menjadi editor video AI hanya melalui perintah.
Sebagai contoh, Anda bisa meminta Gemini Omni untuk mengubah latar belakang video, mengganti pakaian karakter, atau bahkan mentransfer gaya visual tanpa menghilangkan detail penting. Anda juga dapat menukar karakter, menyesuaikan pencahayaan, atau menstabilkan video hanya dengan memberitahukan apa yang perlu diperbaiki. Sistem AI ini dirancang untuk mengingat konteks, sehingga karakter, objek, dan suasana dalam video tetap konsisten meskipun Anda melakukan banyak revisi. Coba berbagai pilihan gaya untuk melihat banyak kemungkinan dengan sekali ketuk.
Pemahaman Dunia Nyata dan Fisika
Google mengklaim bahwa Gemini Omni memiliki pemahaman yang jauh lebih baik terhadap hukum fisika dibandingkan model AI sebelumnya. Keunggulan ini membuat Gemini Omni lebih andal dalam mensimulasikan gerakan nyata, seperti efek gravitasi pada objek, perpindahan energi kinetik, atau dinamika fluida agar visualisasi video terlihat realistis.
Model ini juga memanfaatkan basis pengetahuan Gemini terkait sejarah, sains, dan konteks dunia nyata, memastikan video yang dihasilkan tetap masuk akal. Gemini Omni bahkan mampu membuat visualisasi konsep abstrak dari perintah teks singkat. Ini memungkinkan kreasi visual yang mencerminkan logika dunia nyata dan memberikan kontrol pengeditan selangkah demi selangkah melalui percakapan.
Fitur Avatar AI untuk Kreasi Personal
Gemini Omni menghadirkan fitur avatar AI yang memungkinkan Anda membuat versi digital diri Anda sendiri. Avatar ini dapat digunakan untuk memproduksi video AI yang terlihat dan terdengar sangat mirip dengan Anda. Fitur ini sepenuhnya opsional dan aman, memastikan hanya Anda yang dapat menggunakan avatar Anda untuk membuat video. Anda tidak perlu berulang kali mengunggah foto diri untuk membuat konten personal. Para kreator dapat membuat video dari foto dan menambahkan diri ke dalam kreasi mereka dengan cara yang lebih mudah.
Ketersediaan dan Langganan
Gemini Omni tersedia untuk pengguna berusia 18 tahun ke atas. Akses fitur penuh memerlukan paket Google AI Plus, Pro, atau Ultra. Ketersediaan ini berlaku dalam semua bahasa dan di wilayah tempat aplikasi Gemini dapat diakses. Namun, beberapa fitur seperti avatar dan pengeditan video ke video AI mungkin memiliki batasan di negara tertentu.
Model pertama dari keluarga besar ini yang dirilis adalah Gemini Omni Flash. Gemini Omni Flash mulai tersedia secara global untuk pelanggan Google Workspace melalui aplikasi Gemini dan Google Chrome. Selain itu, fitur ini akan hadir tanpa biaya tambahan bagi pengguna YouTube Shorts dan aplikasi YouTube Create mulai minggu ini. Google juga akan menyediakan akses Gemini Omni Flash melalui antarmuka pemrograman aplikasi (API) dalam beberapa minggu ke depan.
Keamanan Konten dengan SynthID
Untuk menekan risiko penyalahgunaan konten hasil rekayasa AI, Google memastikan bahwa semua video buatan Gemini Omni akan dibekali dengan penanda digital SynthID. Ini adalah watermark tidak terlihat yang berfungsi mengidentifikasi konten buatan AI Google.
Kemampuan SynthID kini mencakup gambar, video, dan audio. Anda dapat mengunggah file dan menanyakan apakah file tersebut dibuat menggunakan AI Google. Gemini akan mencari keberadaan SynthID dan menggunakan penalarannya sendiri untuk memberikan respons yang akurat.
Referensi
- https://gemini.google/id/overview/video-generation/?hl=id
- https://teknologi.id/teknologi/google-kenalkan-gemini-omni-edit-video-ai-kini-tinggal-ketik-prompt
