@stmik_amikbandung: Microsoft telah merilis VibeVoice-1.5B, sebuah model kecerdasan buatan (AI) teks-ke-suara (Text-to-Speech - TTS) open-source yang secara signifikan meningkatkan standar dalam generasi audio sintetis. Inovasi utamanya terletak pada kemampuannya untuk menghasilkan audio berdurasi panjang hingga 90 menit tanpa putus, serta mendukung simulasi percakapan hingga empat pembicara yang berbeda dalam satu sesi. Kemampuan ini jauh melampaui batasan model TTS tradisional. Selain itu, VibeVoice-1.5B juga dilengkapi dengan kapabilitas canggih seperti kontrol emosi, sintesis lintas bahasa (antara Inggris dan Mandarin), bahkan kemampuan untuk menghasilkan nyanyian, menjadikannya sebuah terobosan untuk aplikasi seperti podcast AI dan audio naratif. Dirilis di bawah lisensi MIT yang sangat permisif, teknologi canggih ini kini tersedia secara bebas untuk digunakan oleh para peneliti dan pengembang, termasuk untuk tujuan komersial. VibeVoice-1.5B dibangun di atas arsitektur yang efisien, menggabungkan Large Language Model (LLM) dengan decoder difusi yang ringan, sehingga dapat dijalankan bahkan pada perangkat keras kelas konsumen. Meskipun model saat ini memiliki beberapa batasan—seperti hanya terlatih dalam bahasa Inggris dan Mandarin serta belum dioptimalkan untuk aplikasi real-time—rilis ini dipandang sebagai sebuah tonggak sejarah. Ini membuka jalan bagi pengembangan aplikasi audio percakapan generasi baru dan menegaskan komitmen Microsoft dalam mendorong inovasi di ranah AI open-source. Sumber : marktechpost --- Jangan Lupa untuk Mendaftar dengan Promo 1jt Bisa Kuliah di STMIK "AMIKBANDUNG" dan Dapatkan Beasiswa Sampai Lulus! Mau booking promonya ? Yuk hubungi admin kami ya! 📞 : 0822 - 61 - 400200 📞 : 0811 - 239 - 1136 #stmikamikbandung #SatujutaSAB #pmbSAB

129

There are no more comments for this video.

To see more videos from user @stmik_amikbandung, please go to the Tikwm homepage.