« Vissza

A Google Gemini valóban a ChatGPT riválisa lehet?

Informatikai alapokOnline marketing

Multimodális mesterséges intelligencia

Ez a Gemini megnevezése, ugyanis a Google újdonsága nemcsak szövegek értelmezésére és generálására alkalmas, hanem képek, videók és hanganyagok is a repertoárban szerepelnek. Nem akármilyen adattal próbálták lenyűgözni az embereket, ugyanis az OpenAI világsikert arató szolgáltatását, a ChatGPT-t – állításuk szerint – nagyjából az esetek 90 százalékában lekörözi a Gemini. Erről egy táblázat is megjelent, de egyelőre kérdéses a megbízhatósága.

 

Az ite.hu beszámolója kiemelte, hogy a Gemini 32 ezer karakterig emlékezik a “beszélgetés” előzményeire, ami megkönnyítheti a munkát, pontosabb és jobb eredményeket kaphatunk a közös munka során. A videós értelmezés kapcsán még érdekesebb az a példa, amikor egy labdarúgó rúgását töltötték fel, a Gemini pedig részletezni kezdte, miért rossz a rúgótechnika, és mit lehetne javítani rajta.

 

A prezentálás tehát tényleg érdekes lett, de ahogy a Qubit is beszámolt róla: a képességeket illusztráló videóban finoman szólva is csúsztatott a Google. Kiderült ugyanis, hogy az alábbi felvételen nem úgy instruálták a Geminit, ahogy a videó alapján gondolnánk.

 

A félrevezetésre egy példa: amikor a gumikacsa anyagáról kérdezik a Geminit, akkor a helyes válasz egy szöveges leírás alapján (elárulták neki, hogy a kacsa csipog, ha megnyomják), és nem a felvétel hatására érkezik. Vagyis azt sugallja a videó, hogy a Gemini képes a felvételt értelmezni, pedig egy szöveget értelmez.

 

Ettől persze még lehet zseniális eszköz is a Gemini, de a hitelessége megkérdőjelezhető, ráadásul mi nem is tudjuk próbára tenni, ugyanis az Európai Unióban a GDPR-szabályok miatt egyelőre (2024. január közepén készül a cikk) nem elérhető a szolgáltatás.

 

Három verzióval rendelkezik:

 

  • a Nano az okostelefonokon használható;
  • a Pro a Google különböző szolgáltatásaiba (pl.: Gmail, Google Dokumentumok) épül és számítógépes használatra tervezték;
  • a csúcsmodellnek szánt Ultra pedig olyan képességeket ígér, amelyeket nem is átlag felhasználóknak szánnak, vélhetően cégek tudják majd felhasználni olyan saját szolgáltatásokhoz, amelyek mesterséges intelligencián alapulnak.

 

Természetesen a Google Bard fejlesztéséhez is felhasználják majd a Geminit, jelenleg a Pro verzió tudását építették be, majd az Ultra következik.

 

A Gemini Ultra – amelyet még nem mutattak be, valamikor 2024-ben várható a debütálása – a Google állítása szerint az első olyan mesterséges intelligencia lesz, amely 57 alapvető témakörben (pl.: jog, matematika, orvostudomány) túlszárnyalja az emberi szakértők teljesítményét. Ennek alapja az MMLU, vagyis a Massive Multitask Language Understanding lesz, amely egy teljesen új nyelvi keretrendszer.

 

A Gemini részletes és hivatalos dokumentációja bárki számára elérhető ezen a linken. Hangzatosak az adatok és az ígéretek, amelyek alapján valóban a ChatGPT legkomolyabb riválisa lehet, de kell még idő, hogy kiderüljön, valóban így lesz-e.

Kapcsolódó cikkek