A Google nemrégiben leplezte le a Gemini-t, válaszként a GPT-4-re, egy generatív MI megoldást, amely beépítésre kerül a Google Bard chatbotjába. A Gemini egy nagyméretű nyelvi modell (Large Language Model – LLM), jelenleg az 1.0-s verziójában elérhető.

Ez a modell az első a Google új generációs MI modelljei közül, amelyeket az emberek környezettel való interakcióinak és válaszainak módja inspirált. A projekt a Google DeepMind és a Google Research részlegeinek együttműködéséből született. A Gemini egy multimodális integrált MI, amelyet a Google előzetesen betanított és különféle használati módokra és értelmezési formákra hangolt.

A Gemini képes értelmezni a legtöbb beviteli típust, a szövegtől a hangon és képeken át. Programozásra is alkalmas, specializálódva Python, Java, C++ és Go nyelvekre. A Gemini egy speciális változata képes még az AlphaCode 2 kódgenerálására is, a generatívAI utódjára. Az AlphaCode 2 kétszer annyi nehéz kérdést oldott meg, mint elődje.

A Gemini rugalmas és képes működni óriási adatközpontokban, valamint mobiltelefonokon is. Három változatban érkezik: Nano, Pro és Ultra. A Nano mobil eszközökön fut és helyi feladatokat lát el, a Pro változat sokoldalúbb és hamarosan integrálásra kerül a Google termékeibe, beleértve a Bardot is. A Bard maantól kezdve egy speciális Pro változatot kínál, amely fokozott megértést, tervezést és gondolkodást biztosít.

A fejlett chatbot 170 országban lesz elérhető. 2024-ben érkezik az Ultra változat, amely egy Bard Advanced csomaggal jön extra funkciókkal. A Google Gemini Pro képességeit beépíti az Ads, Chrome, Duet AI, Keresés, Google Cloud Vertex és AI Studio szolgáltatásaiba. Röviden, a Gemini a Pixel 8 Pro-n képes összefoglalni a hallottakat audio felvételeken és javasolt válaszokat kínálni a WhatsApp beszélgetésekben.

Az alapmodell képes középiskolai szintű matematikai problémákat megoldani.