banner 728x250
Techno  

Google Rilis Whisk: AI yang Bisa Gabungkan Gambar, Ini Cara Kerjanya!

Google buat Whisk, AI untuk gabungkan gambar dengan prompt gambar. Foto: x.com/Google
Google buat Whisk, AI untuk gabungkan gambar dengan prompt gambar. Foto: x.com/Google
banner 120x600
banner 468x60

Tuturpedia.com – Melalui laman X resmi Google hari Selasa (17/12/2024), Google mengabarkan bahwa pihaknya meluncurkan AI bernama Whisk yang dapat menggabungkan beberapa detail gambar menjadi satu.

Berbeda dengan AI pada umumnya, Whisk tidak bergantung sepenuhnya pada deskripsi teks terperinci. AI ini memungkinkan pengguna untuk membuat dan memodifikasi gambar menggunakan perintah visual.

“Hari ini, kami meluncurkan eksperimen AI generasi terbaru kami di @labsdotgoogle: Whisk. Alih-alih menghasilkan gambar dengan perintah teks yang panjang dan terperinci, Whisk memungkinkan Anda untuk meminta perintah dengan gambar. Cukup seret gambar dan mulailah berkreasi,” tulis Google melalui laman X, Selasa (17/12/2024).

Mengutip sebuah posting blog Google pada Kamis (19/12/2024), dikatakan bahwa Whisk memungkinkan pengguna memasukkan gambar untuk subjek, satu untuk adegan, dan satu lagi untuk gaya. 

Kemudian, pengguna dapat mencampurnya kembali untuk menciptakan sesuatu yang unik sesuai selera masing-masing, pengguna bisa menambahkan gambar lain, seperti boneka digital hingga pin enamel atau stiker.

Selain itu, Google juga menjelaskan, karena Whisk hanya mengekstrak beberapa fitur utama dari gambar yang diinput, sehingga mungkin Whisk menghasilkan hasil yang berbeda dari yang diharapkan pengguna. Misalnya, gambar yang dihasilkan dapat memiliki variasi tinggi, berat, gaya rambut, atau warna kulit. 

Menyadari bahwa detail ini mungkin penting untuk sebuah proyek, Google memungkinkan pengguna untuk melihat dan mengedit perintah yang mendasarinya kapan saja.

Bagaimana Cara Kerja Whisk?

Singkatnya, Whisk akan membantumu membuat gambar baru dari gabungan tiga gambar yang kamu input. Dikutip dari laman Marketing 4 E-commerce, tiga gambar yang diinput pengguna merupakan gambaran dari tiga elemen utama, di antaranya:

  • Gambar subjek: Mewakili objek atau karakter utama.
  • Gambar pemandangan: Menentukan konteks atau latar belakang di mana subjek akan diintegrasikan.
  • Gambar gaya: Menyediakan estetika visual, seperti ilustrasi cat air, desain minimalis, atau seni digital.

Setelah pengguna memasukkan tiga gambar yang mereka inginkan, Google akan menggabungkan model Gemini dengan generator gambar terbarunya, Imagen 3. Generator ini akan menginterpretasikan gambar dan menulis deskripsi terperinci tentangnya. 

Deskripsi itu menjadi masukan bagi model untuk menghasilkan hasil akhir yang menangkap esensi subjek sekaligus memungkinkan penemuan kembali yang kreatif. Dengan cara ini, pengguna dapat bereksperimen dengan berbagai kombinasi untuk mengeksplorasi berbagai gaya, pengaturan, dan variasi.

Bagaimana? Apakah Whisk berhasil membuatmu tertarik, Tuturpedians?***

Penulis: Anna Novita Rachim

Editor: Annisaa Rahmah