Google'ın IA modeli VEO 3, diyaloglar ve ses efektleri ile hiper gerçekçi videolar yapar

Suzan

New member
Google Deepmind birkaç günlüğüne piyasaya sürüldü Veo 3Yeni bir yapay zeka modeli, ultra gerçekçi videolar üretebilen Basit metin açıklamaları.

Ancak gerçek yenilik başka bir şey: ilk kez, üretken dönemde, bu videolara eşlik ediyor senkronize bir ses diyaloglar, ses efektleri ve çevresel sesler içerir.

Sessizden sese geçiş 1920'lerde sinemada devrim yarattıkça, bu yüzden 3 görsel anlatıyı dönüştürmeyi vaat ediyor yapay zeka tarafından üretildi.

Şimdiye kadar modeller Metin-Video Kısa ve görsel olarak güvenilir klipler üretmeyi başardılar, ancak sessiz. Şimdi bu sınır aşıldı.

Silent'e veda edin video üretimi: VEO 3'ü tanıtmak – yerel ses üretimi ile. ?

Kalite Veo 2'den yükseldi ve şimdi diyalog beteween karakterleri, ses efektleri ve arka plan gürültüsü ekleyebilirsiniz.

Veo 3 şimdi @Geminiapp Google AI Ultra için … pic.twitter.com/7ccxebsly

– Google (@google) 20 Mayıs 2025
Veo 3 nedir


Google DeepMind tarafından geliştirilen veo 3 güçlü bir modeldir Metin-Video Gerçekçi videolarda metin istemlerini – ayrıca statik görüntüleri – dönüştürebilir 8 saniyeye kadar4K'ya kadar çözünürlük ve görüntülerle birlikte ses üretildi.

Videolarda bulunan insanlar, hayvanlar ve nesneler doğal olarak hareket eder, Gerçek dünyanın fiziğinin simülasyonuVe dudaklar konuşulan kelimelerle uyumlu (neredeyse her zaman mükemmel) hareket ediyor.

Sonuç? Bir sinematografik ekip tarafından çekilmiş gibi görünen, ancak tamamen AI tarafından yaratılan klipler.

Kim kullanabilir


Şu anda, Veo 3 sadece Gemini aracılığıyla kullanılabilir, Google'ın sohbet botuaracılığıyla erişilebilir Gemini.google.com Veya iOS ve Android için resmi uygulama aracılığıyla. Ancak erişim, kullanıcılar için ayrılmıştır. ultra zemin (Ayda 249 dolar), şimdilik mevcut sadece Amerika Birleşik Devletleri'nde (ve önizleme Bizim gibi, okuyuculara anlatmak için onu test etmeniz gerekenler için).

Fakat Veo 3 İtalyanları şaşırtıcı derecede iyi yönetiyor: İstemleri anlıyor, ancak bu konuda hiç şüphemiz yoktu ve doğru için diyalogları yorumluyor ve dilimizde güvenilir bir ses üretmeye geliyor.

Google I/O 2025'te açıklanan 14 ana haber



İtalyan teknoloji editoryal personeli tarafından

21 Mayıs 2025

Google I/O 2025'te açıklanan 14 ana haber

VEO ile Testlerimiz 3


VEO 3'ü ile test ediyoruz gerçeküstü istemler Ancak sonuç olarak gerçekçi videolar verdi.

Bir deneyde, AI'dan bir gazetecinin ciddi bir tonda genel yapay zekanın (AGI) nihayet “trafik, otopark ve delikler sorununu” çözdüğünü duyurduğu sahte bir TG1 oluşturmasını istedik.

8 saniyelik son video ikna edicidir: ses doğaldır, labial mükemmelliğe senkronize edilir ve görsel stil, son bir haberlerin duyurulmasını güvenilir bir şekilde taklit eder.

Başka bir testte, iki podcaster arasında bir diyalog simüle ettik: “AGI'ya gidecek miyiz?“, Biri soruyor.”Evet, ama AGI alacağız … Tati“, Diğer cevaplar.

Ton, nefes, taklit: Her şey tutarlı, her şey gerçek görünüyor ve makineye sunduğumuz oynak endikasyonlara karşılık geliyor.

Veo 3'ün gücü tam burada: Kesin diyaloglarla sahnelerakışkan animasyonlar ve yüksek düzeyde görsel -işitsel verim, Video o Manuel animasyon. Sadece iyi bir istem gerekiyor. Ve belki de mükemmel sonuçlar elde etmek için sinematografik dil hakkında temel bir bilgi.

Sizi bu kadar özel yapan nedir?


Video jeneratörlerinin hızla gelişen panoramasında, Veo 3 ses sayesinde Sora di Openai veya pist gibi rakiplerden öne çıkıyor: sadece senkronize değil, aynı zamanda istemden başlayarak tamamen üretildi.

Örneğin, yağmurda bir takip sahnesini tarif ederseniz, Veo 3 sadece su koşu ve sıçramalarında otomobil üretmekle kalmaz, aynı zamanda yağmurun, kornanın gerçekçi sesini, motorun da ekler. Sürükleyici etki toplamdır. Şu anda, başka hiçbir model ses ve görüntü arasındaki bu tutarlılığa ulaşmıyor.

Google'ın Veo3'ü düşürdüğünden ve insanlar zaten vahşi şeyler yarattığından beri 24 saatten az.

13 çılgın örnek

1. NYC'de bisiklet süren bir zürafapic.twitter.com/ktgdnwol99

– Techhalla (@techhalla) 21 Mayıs 2025
Fırsatlar (ve riskler)


Veo 3, İçeriğin oluşturulması.

Bağımsız yönetmenler karmaşık sahneler üretebilir Milyoner bütçesi olmadan; Öğretmenler ve yayılanlar tarihi veya bilimi açıklamak için sürükleyici videolar oluşturabilir; Sanatçılar, reklamcılık ve iletişimciler birkaç dakika içinde yapabilir Görsel projeler ilk düşünülemez.

Ama madalyanın tersi de var: i derin dip. Bu videoların aşırı gerçekçiliği, potansiyel dolandırıcılık ve bu teknolojiyi iletebilecek dezenformasyon endişesini arttırıyor.

Veo 3 ile oluşturulan bir video, bir kişinin aslında asla telaffuz etmediği bir şey söylemiş olabilir. Gerçeklik ve kurgu arasındaki çizgi, bu bakış açısından, Giderek daha ince.

Bize de oldu Sahte TG1: “RAI” etiketi orijinalle aynı olmasa da, bağlam, mükemmel ton ve dudak, BM özenli bir gözlemciye, sosyal ağlarda benzer bir videoya girdiği için inandırıcıdır.

Son olarak, kritik bir yön Herhangi bir filigranın yokluğu O VEO 3 tarafından üretilen videolarda ayırt edici işaret: Hiçbir şey yapay bir zeka tarafından üretildiğini göstermez, bu da onları gerçek çekimlerden potansiyel olarak ayırt edilemez hale getirmez.