Gemini, nový AI model od Google

AI bola stredobodom pozornosti celý rok 2023, a to nielen pre vývojárov, finančníkov, ale aj laikov. Každý chcel vedieť, čo všetko umelá inteligencia dokáže a ako sa bude dať využiť na uľahčenie života, na stavbu inteligentnejších strojov a celkovo v prospech ľudstva.

Týmto smerom sa vydali aj v spoločnosti Google, ktorý na AI pracujú v rámci svojej služby Google DeepMind. To čo vytvorili, je inšpirované tým, ako ľudia chápu svet a ako s ním komunikujú. AI, ktorá vyzerá menej ako inteligentný softvér a skôr ako niečo užitočné a intuitívne – odborný pomocník alebo asistent. Nedávno preto predstavili Gemini, podľa slov Google najschopnejší a najvšeobecnejší model, aký bol kedy postavený. Gemini je výsledkom rozsiahleho spoločného úsilia tímov naprieč Google, vrátane vývojárov z Google Research. Bol vytvorený od základov ako multimodálny, čo znamená, že dokáže zovšeobecniť a bez problémov pochopiť, fungovať a kombinovať rôzne typy informácií vrátane textu, kódu, zvuku, obrazu a videa.

Gemini je tiež doteraz najflexibilnejší model Google a je schopný efektívne bežať na všetkom od dátových centier až po mobilné zariadenia. Jeho najmodernejšie možnosti majú výrazne zlepšiť spôsob, akým vývojári a podnikoví zákazníci budujú a škálujú pomocou umelej inteligencie. AI model s označením Gemini 1.0, prináša prvú verziu, ktorá je optimalizovaná na rôzne využitia a Google ju rozdelil na nasledujúce kategórie:

Gemini Ultra — najväčší a najschopnejší model pre veľmi zložité úlohy,
Gemini Pro — model na škálovanie v rámci širokej škály úloh,
Gemini Nano – model pre úlohy na bežných zariadeniach.

Najmodernejšie AI, ktoré rozumie textu, obrázkom a videám

Modely Gemini boli testované na širokej škále úloh a podľa toho sa vyhodnocoval ich výkon. Od prirodzeného porozumenia obrazu, zvuku a videa až po matematické uvažovanie, výkon Gemini Ultra prevyšuje súčasné najnovšie výsledky v 30 z 32 široko používaných akademických benchmarkov používaných vo výskume a vývoji veľkých jazykových modelov (LLM). So skóre 90,0% je teda Gemini Ultra prvým modelom, ktorý prekonal ľudských expertov na MMLU (masívne multitaskové jazykové porozumenie), ktorý využíva kombináciu 57 predmetov, ako sú matematika, fyzika, história, právo, medicína a etika. Gemini teda dôkladnejšie premýšľa pred zodpovedaním zložitých otázok, čo vedie k významným zlepšeným výsledkom odpovedí.

Zdroj: Google blog

S porovnávacími testami obrázkov, ktoré boli testované, Gemini Ultra prekonali predchádzajúce najmodernejšie modely bez pomoci systémov optického rozpoznávania znakov (OCR), ktoré extrahujú text z obrázkov na ďalšie spracovanie. Gemini 1.0 bol vyškolený na to, aby rozpoznal a porozumel textu, obrázkom, zvuku a ďalším veciam súčasne, takže lepšie rozumie jemným informáciám a dokáže odpovedať na otázky týkajúce sa komplikovaných tém. Vďaka tomu je obzvlášť dobrý pri vysvetľovaní uvažovania v zložitých predmetoch, ako je matematika a fyzika.

Pokročilé programovanie

Prvá verzia Gemini dokáže porozumieť, vysvetliť a generovať vysokokvalitný kód v najpopulárnejších programovacích jazykoch sveta, ako sú Python, Java, C++ a Go. Jeho schopnosť pracovať v rôznych jazykoch a uvažovať o zložitých informáciách z neho robí jeden z popredných základných modelov kódovania na svete a zaraďuje sa na úroveň Copilot od Microsoftu. Gemini možno použiť aj ako engine pre pokročilejšie kódovacie systémy. Pred dvoma rokmi Google predstavil AlphaCode, prvý systém na generovanie kódu AI, ktorý dosiahol konkurencieschopnú úroveň výkonu v programátorských súťažiach. Pomocou špecializovanej verzie Gemini bol vytvorený pokročilejší systém generovania kódu, AlphaCode 2, ktorý zahŕňa komplexnú aj matematickú a teoretickú informatiku.

Spoľahlivejší, škálovateľnejší a viac efektívny

Gemini 1.0 je vytrénovaný na Google infraštruktúre optimalizovanej pre AI pomocou jednotiek Tensor Processing Units (TPU) v4 a v5e a bol navrhnutý tak, aby bol najspoľahlivejším a najškálovateľnejším modelom na trénovanie a najefektívnejším na obsluhu. Na TPU beží Gemini výrazne rýchlejšie ako predchádzajúce, menšie a menej výkonné modely. Tieto na mieru navrhnuté akcelerátory AI boli srdcom produktov spoločnosti Google založených na AI, ktoré slúžia miliardám používateľov, pre Vyhľadávanie, YouTube, Gmail, Mapy Google, Google Play a Android. Spoločnostiam na celom svete tiež umožnili efektívne trénovať rozsiahle modely umelej inteligencie. Nedávno teda Google predstavil doteraz najvýkonnejší, najefektívnejší a škálovateľný systém TPU, Cloud TPU v5p, ktorý je určený na trénovanie špičkových modelov AI. Táto nová generácia TPU urýchli vývoj Gemini a pomôže vývojárom a podnikovým zákazníkom rýchlejšie trénovať rozsiahle generatívne modely AI, vďaka čomu sa nové produkty a funkcie dostanú k zákazníkom skôr.

Aká bude budúcnosť AI?

Nové AI modely prinášajú do IT sveta mnoho užitočných vecí a sú čoraz viac používané rôznymi užívateľmi, či už na vzdelávanie, tvorbu zaujímavého obsahu pre zákazníkov alebo aj na programovanie. Takisto investori dôverujú tejto technológii čoraz viac, čo znamená prílev peňazí a v konečnom dôsledku aj rozvoj umelej inteligencie a jej adopciu v čoraz viac odvetviach. Vyzerá to teda sľubne, no keďže vešteckú guľu nemáme, musíme si počkať aký reálny prínos bude táto technológia mať.

Zdroj: Google blog