Google spustil službu Gemini Live. Umí mluvit jako člověk! V čem překonává ChatGPT?

Zdroj obrázku: https://blog.google/products/gemini/google-gemini-update-may-2024/

Google konečně představil svou nejnovější inovaci v oblasti umělé inteligence – službu Gemini Live. zaujala odbornou i laickou veřejnost svou schopností komunikovat způsobem, který se velmi blíží přirozené lidské řeči. Jedná se o významný krok vpřed v oblasti hlasových asistentů, kde technologie, jako je Google Assistant, Siri nebo Alexa, byly dlouho standardem. Nicméně Gemini Live přináší nový rozměr, který může výrazně změnit způsob, jakým interagujeme s našimi zařízeními.

Gemini Live způsobí revoluci v umělé komunikaci

Gemini Live je hlasový asistent poháněný pokročilými jazykovými modely, který dokáže mluvit přirozeně, s realistickými intonacemi a dokonce i se zaváháními či výrazy, které jsou typické pro lidskou řeč. To, co tento nástroj odlišuje od ostatních, je schopnost nejen poskytovat informace, ale také vést volně plynoucí konverzace, které se mohou blížit rozhovorům mezi dvěma lidmi.

Tento nový asistent je dostupný pro uživatele v anglicky mluvících zemích prostřednictvím aplikace Google Gemini, která je k dispozici na zařízeních s operačním systémem Android. Aby mohli uživatelé využívat plný potenciál Gemini Live, je nutné si předplatit službu Gemini Advanced, která stojí 19,99 USD měsíčně. Tato investice však přináší revoluční způsob, jakým mohou lidé interagovat se svými zařízeními.

Funkce a možnosti Gemini Live

Jednou z nejzajímavějších funkcí Gemini Live je možnost volby mezi různými hlasy, jako jsou Vega, Ursa a Nova. Tyto hlasy byly vytvořeny tak, aby nejen zněly přirozeně, ale také aby vyhovovaly různým preferencím uživatelů. Díky těmto možnostem mohou uživatelé přizpůsobit svého asistenta tak, aby nejlépe vyhovoval jejich potřebám a vkusu.

Google ve své demo ukázce na YouTube představil několik možných využití Gemini Live. Asistent může například pomoci s přípravou na pracovní pohovory, s budováním pozitivních návyků nebo s brainstormováním nových nápadů. Tato široká škála možností ukazuje, že Gemini Live není jen další hlasový asistent, ale multifunkční nástroj, který může výrazně usnadnit každodenní život.

V čem je lepší než produkt od OpenAI?

V květnu 2024 představila společnost OpenAI svůj pokročilý ChatGPT ve hlasovém režimu, který také disponuje schopností přirozené lidské řeči. Nicméně Gemini Live přináší několik klíčových výhod, které by mohly Google katapultovat na vrchol tohoto rychle se rozvíjejícího trhu. Jedním z hlavních faktorů je masivní uživatelská základna společnosti Google. Podle serveru VentureBeat má Google přes 3 miliardy aktivních uživatelů na zařízeních Android a 2,2 miliardy aktivních uživatelů na zařízeních iOS. Tato obrovská uživatelská základna dává Googlu nepopiratelnou výhodu při zavádění nových technologií, jako je právě Gemini Live.

Další výhodou Gemini Live je jeho schopnost zpracovávat složité úkoly rychleji a efektivněji díky modelům, jako je Gemini 1.5 Flash. Tyto modely byly navrženy tak, aby poskytovaly rychlejší a kvalitnější odpovědi, což je klíčové pro uživatele, kteří vyžadují okamžitou a spolehlivou odezvu.

Jakým směrem se bude technologie ubírat nyní?

Sissie Hsiao, viceprezidentka a generální manažerka pro Gemini zkušenosti a Google Assistant, uvedla, že ačkoli AI otevírá nové možnosti, přináší s sebou i nové výzvy. Podle ní například používání velkých jazykových modelů, které lépe interpretují přirozený jazyk a zvládají složité úkoly, může znamenat, že jednoduché úkoly mohou trvat o něco déle. Navíc, generativní umělá inteligence je sice dostatečně flexibilní, aby zvládla širokou škálu úkolů, ale může se někdy chovat nečekaně nebo poskytovat nepřesné informace.

Právě z těchto důvodů se Google rozhodl začlenit pokročilé modely, které minimalizují tyto potenciální problémy a zajišťují, že Gemini Live poskytuje co nejpřesnější a nejspolehlivější výsledky. Hsiao však zdůrazňuje, že jsme teprve na začátku objevování všech možností, jak může AI asistent poháněný umělou inteligencí být užitečný.

Gemini Live každopádně představuje významný krok vpřed v oblasti umělé inteligence a hlasových asistentů. S jeho schopností komunikovat přirozeně a vést volně plynoucí konverzace, má potenciál stát se nezbytným nástrojem pro miliony uživatelů po celém světě. Google tímto krokem nejen že odpovídá na konkurenční výzvy ze strany OpenAI, ale také ukazuje svou schopnost inovovat a přinášet na trh produkty, které mohou měnit způsob, jakým interagujeme s technologií. S pokračujícím vývojem a zdokonalováním této technologie se můžeme těšit na další vzrušující pokroky v oblasti umělé inteligence, které mohou dramaticky ovlivnit náš každodenní život.

Zdroj: https://venturebeat.com/ai/googles-ai-surprise-gemini-live-speaks-like-a-human-taking-on-chatgpt-advanced-voice-mode/