Gemini Live: Glasovi koji više ne zvuče kako trebaju

Gemini Live: Glasovi koji više ne zvuče kako trebaju📷 © Tech&Space
- ★Capella glas više nije britanski kao ranije
- ★Promjene od verzije 3.1 Flash Live
- ★Korisnici žale na nekonzistentnu kvalitetu
Googleov Gemini Live dobio je nadogradnju 3.1 Flash Live – i s njom problem koji korisnici primjećuju svaki tjedan: glasovi više ne zvuče kao što su trebali. Posebno je pogođena opcija Capella, koja je do sada nudila upečatljiv britanski naglasak, a sada zvuči kao loše kalibrirana imitacija.
Problem nije univerzalni – neki glasovi ostaju netaknuti u brzim glasovnim kontrolama ili s Android Auto integracijom, što ukazuje na selektivne bugove, a ne na svjesnu promjenu dizajna. Razlog leži, prema dostupnim informacijama, u nadogradnjama osnovnih AI modela.
Google je u zadnjih nekoliko mjeseci uveo nova poboljšanja u Gemini – ali čini se da su ta poboljšanja imala nuspojave na glasovne profile. Korisnici na forumima poput Reddita i Googleovih podrških stranica žale se na neprirodne kadence, promijenjene tonove i čak naglaske koji više ne odgovaraju originalnim presetovima.
Ovdje se otvara klasičan reality gap: što god bila namjera, isporučena kvaliteta ne odgovara očekivanjima. A to nije samo pitanje estetike – za korisnike koji koriste Gemini Live za duže interakcije, poput čitanja knjiga ili vožnje, nekonzistentan glas postaje frustrirajući.
Google još nije komentirao problem, ali pitanje je koliko će ova greška utjecati na povjerenje u AI asistente kao pouzdane alate, a ne samo kao work in progress projekte.

Demo nasuprot deploymenta: Zašto Googleov AI asistent gubi identitet📷 © Tech&Space
Demo nasuprot deploymenta: Zašto Googleov AI asistent gubi identitet
Čudno je da se problem pojavljuje i nestaje tjednima, što sugerira da Google možda eksperimentira s modelima u produkciji – ili pak ima problema s verzioniranjem. Prema 9to5Google, dio korisnika izvještava da se glasovi vraćaju na originalne postavke nakon ponovnog pokretanja uređaja, ali to nije trajno rješenje.
Drugim riječima, korisnici su postali beta testeri bez svoje volje. Da je ovo samo pitanje preferencija, problem ne bi bio toliko značajan.
Ali ovdje se radi o hype filter momentu: Google je Gemini Live predstavio kao premium iskustvo s visoko prilagodljivim glasovima, a sada ti isti glasovi zvuče kao da su generirani u žurbi. To nije samo tehnički detalj – to je signal o prioritizaciji u razvoju.
Ako se glasovi, kao ključna komponenta interakcije, mogu tako lako pokvariti, što onda znači za složenije funkcije? Konkurenti poput Appleovog Siri ili Amazonovog Alexa imaju svoje probleme, ali barem su dosljedni.
Googleov slučaj je zanimljiv jer ukazuje na to da brzi razvoj AI modela može narušiti korisničko iskustvo u segmentima koji su već bili stabilni. Razvojni timovi se možda fokusiraju na agentic funkcije ili multilingvalne sposobnosti, ali zaboravljaju da su osnovne stvari – poput glasova – one koje korisnici koriste svaki dan.
Ovo pitanje može imati velike posljedice za budućnost AI asistenata. Ako se problem ne riješi, korisnici će izgubiti povjerenje u tehnologiju. Google mora brzo reagirati i riješiti problem kako bi spriječio dalje komplikacije. U suprotnom, konkurencija će iskoristiti slabost i preuzeti tržišni udio.