Google Gemini: Nová generace umělé inteligence

Také poslední dobou slyšíte mnoho o Google Gemini? Google představil revoluční novinku v oblasti umělé inteligence, rodinu multimodálních jazykových modelů s názvem Gemini, která bude pravděpodobně konkurovat sérii GPT od OpenAI. Tato technologie slibuje posun v interakci s počítači a otevírá dveře k novým možnostem v mnoha oblastech.

Gemini navazuje na úspěch modelů LaMDA a PaLM 2. Byl vyvinut v Google DeepMind a poprvé představen v prosinci 2023. Od té doby se stal horkým tématem v technologickém světě.

Gemini se stále vyvíjí, ale už teď je dostupná v několika verzích:

  • Gemini Ultra: Největší a nejschopnější model pro náročné úkoly.
  • Gemini Pro: Vhodný pro širokou škálu úkolů a optimalizovaný pro škálování.
  • Gemini Nano: Nejmenší a nejefektivnější model pro použití na mobilních zařízeních.

Podle Googlu, Gemini Ultra, jeho největší a nejschopnější nový model, překonává model OpenAI GPT-4 v řadě textových, obrazových, kódovacích a uvažovacích úloh. Gemini Ultra bude k dispozici prostřednictvím nové chatovací funkce AI nazvané Bard Advanced. Gemini Pro, je nyní dostupné veřejnosti prostřednictvím chatovacího rozhraní Bard od Googlu. Nejmenší Gemini Nano poběží na smartphonu Pixel 8 Pro.

Všechny tři modely mohou zpracovávat text, obrázky, zvuk a video a vytvářet textové a obrazové výstupy. Google také začne integrovat modely Gemini do svých dalších produktů a služeb, jako je internetové vyhledávání a reklamy.

Na konferenci Google I/O 10. května 2023 byl Gemini, velký jazykový model (LLM) prezentován jako výkonnější nástupce PaLM 2. Na rozdíl od jiných modelů se Gemini neomezuje pouze na text. Je multimodální, tzn. dokáže zpracovávat různé typy dat současně: text, obrázky, zvuk, video a kód. Tato unikátní vlastnost mu umožňuje řešit komplexní úkoly, které byly pro dosavadní jazykové modely nedostupné.

Vývoj Gemini je výsledkem spolupráce DeepMind a Google Brain, které se nedávno sloučily. Generální ředitel DeepMind, Demis Hassabis, v rozhovoru pro Wired zdůraznil pokročilé funkce Gemini a vyjádřil přesvědčení, že model překoná ChatGPT od OpenAI.

Gemini v sobě spojuje sílu AlphaGo s nejmodernějšími technologiemi jazykových modelů Google-DeepMind.  Co je to AlphaGo? První počítačový program, který porazil mistra světa Go.

Po úspěchu AlphaGo tým DeepMind hledal složitější hry, které zachycují různé prvky inteligence. V roce 2019 předvedli AlphaStar , první systém umělé inteligence, který porazil profesionálního hráče ve hře StarCraft II, která je považována za jednu z nejnáročnějších her v reálném čase (RTS) a jeden z nejdéle hraných e-sportů všech dob. Tým také vynalezl WaveNet , realistický model převodu textu na řeč a mnoho dalších. V roce 2017 Brain vynalezl architekturu Transformer , elegantní systém neuronových sítí, které jsou základem téměř všech velkých jazykových modelů a způsobily revoluci v oblasti umělé inteligence.

Gemini je stále ve fázi vývoje, ale jeho potenciál je obrovský. Může znamenat revoluci v oblasti zpracování jazyka a otevřít dveře k novým a inovativním aplikacím v mnoha oblastech lidské činnosti.

 

Autor/ka obrázku: Freepik.com