KONTEKS.CO.ID – Perusahaan teknologi terkemuka seperti OpenAI, Microsoft, dan Adobe telah memperkenalkan chatbot AI yang mendapat dukungan model bahasa besar atau LLM. Atau Large Language Model yang dapat mengubah teks menjadi gambar.
Inovasi ini semakin berkembang dengan Google yang mengambil langkah lebih maju dalam menghadirkan AI VideoPoet yang mampu mengubah teks menjadi video.
Perusahaan berbasis di California, Amerika Serikat, ini telah meluncurkan AI VideoPoet yang menghasilkan klip video berdasarkan teks yang pengguna masukan.
Mengutip dari Gadgets Now, Google Research mencontohkan cara kerja AI ini. Dalam contoh skenario, mereka meminta VideoPoet untuk membuat serangkaian petunjuk yang kemudian diubah menjadi klip video.
Klip-klip ini kemudian tersatukan menjadi sebuah film pendek yang disebarkan dalam format YouTube Shorts.
Menurut Google, VideoPoet adalah metode pemodelan sederhana yang menggunakan model bahasa autoregresif atau LLM untuk menghasilkan video berkualitas tinggi.
Model ini terdiri dari beberapa komponen yang terlatih secara terpisah untuk tugas berbeda, namun terintegrasi dalam satu LLM. Salah satu komponen utamanya adalah tokenizer video MAGVIT V2 dan tokenizer audio SoundStream.
Proses Kerja VideoPoet Google
Tokenizer-video dan tokenizer-audio ini mengonversi gambar, video, dan klip audio menjadi serangkaian kode diskrit dalam kosakata terpadu. Kode-kode ini dapat terprediksi oleh model bahasa berbasis teks, memungkinkan integrasi dengan berbagai jenis data, termasuk teks.
LLM mempelajari berbagai modalitas untuk memprediksi token video atau audio berikutnya dalam urutan.
Google menyebutkan bahwa tujuan pembelajaran generatif multimodal terimplementasikan dalam pelatihan LLM.
Ini termasuk perubahan teks menjadi video, teks menjadi gambar, gambar menjadi video, kelanjutan bingkai video, pengecatan video, stilisasi video, dan video menjadi audio.
Implikasi Terobosan Ini dalam Dunia Teknologi
Pengenalan AI VideoPoet oleh Google menandai langkah besar dalam pengembangan kecerdasan buatan.
Kemampuan untuk mengubah teks menjadi video dengan kualitas tinggi membuka pintu bagi berbagai aplikasi, baik dalam bidang kreatif maupun pemasaran.
Inovasi semacam ini dapat tergunakan dalam produksi video konten, periklanan, dan bahkan dalam pengajaran atau presentasi untuk menyajikan informasi secara visual yang menarik.
Dengan demikian, kemajuan dalam AI VideoPoet dari Google menjanjikan pengembangan lebih lanjut dalam cara kita berinteraksi dengan media visual dan membuka jalan bagi lebih banyak terobosan yang mengubah cara kita melihat dan menggunakan kecerdasan buatan.***
Simak breaking news dan berita pilihan Konteks langsung dari ponselmu. Konteks.co.id WhatsApp Channel
Baca berita pilihan konteks.co.id lainnya di:
"Google News"