- Google a anunțat lansarea celui mai recent și mai puternic model AI al său, Gemini, care are trei dimensiuni.
- Directorii au declarat marți că Gemini Pro a depășit performanța OpenAI-ului GPT-3.5, dar au ocolit întrebările despre comparaţia cu GPT-4.
- Compania intenționează să licențieze Gemini clienților prin Google Cloud pentru ca aceștia să le folosească în propriile aplicații. De asemenea, va alimenta aplicațiile Google AI destinate consumatorilor, cum ar fi chatbot-ul Bard și Search Generative Experience.
Google a lansat miercuri ceea ce consideră ca fiind cel mai mare și cel mai capabil model de inteligență artificială, în condiţiile în care presiunea crește asupra companiei pentru a răspunde modului în care va monetiza AI, potrivit CNBC.
Modelul Gemini va include o suită de trei dimensiuni diferite: Gemini Ultra, categoria sa cea mai mare și cea mai capabilă; Gemini Pro, care se extinde într-o gamă largă de sarcini; și Gemini Nano, pe care îl va folosi pentru anumite sarcini și dispozitive mobile.
Deocamdată, compania plănuiește să licențieze Gemini clienților prin Google Cloud pentru ca aceștia să le poată utiliza în propriile aplicații. Începând cu 13 decembrie, dezvoltatorii și clienții întreprinderilor pot accesa Gemini Pro prin API-ul Gemini în Google AI Studio sau Google Cloud Vertex AI. Dezvoltatorii Android vor putea utiliza și Gemini Nano. Gemini va fi, de asemenea, folosit pentru a alimenta produsele Google, cum ar fi chatbot-ul Bard și Search Generative Experience, care încearcă să răspundă la interogări de căutare cu text în stil conversațional (SGE nu este încă disponibil pe scară largă).
Gemini Ultra este primul model care depășește experții umani în MMLU (înțelegerea masivă a limbajului multitask), care utilizează o combinație de 57 de subiecte precum matematică, fizică, istorie, drept, medicină și etică pentru a testa atât cunoștințele lumii, cât și abilitățile de rezolvare a problemelor, a spus compania într-o postare pe blog miercuri. Se presupune că poate înțelege nuanța și raționamentul în subiecte complexe.
„Gemini este rezultatul eforturilor de colaborare pe scară largă ale echipelor din Google, inclusiv ale colegilor noștri de la Google Research”, a scris CEO-ul Sundar Pichai într-o postare pe blog miercuri. „A fost construit de la zero pentru a fi multimodal, ceea ce înseamnă că poate generaliza și înțelege fără probleme, poate opera și combina diferite tipuri de informații, inclusiv text, cod, audio, imagine și video.”
Începând de astăzi, chatbot-ul Google Bard va folosi Gemini Pro pentru a ajuta cu raționament avansat, planificare, înțelegere și alte capacități. La începutul anului viitor, va lansa „Bard Advanced”, care va folosi Gemini Ultra, au spus directorii la o discuţie cu reporterii marți. Acesta reprezintă cea mai mare actualizare pentru Bard, chatbot-ul său asemănător ChatGPT.
Actualizarea vine la opt luni după ce gigantul de căutare a lansat pentru prima dată Bard și la un an după ce OpenAI a lansat ChatGPT pe GPT-3.5. În martie a acestui an, startup-ul condus de Sam Altman a lansat GPT-4. Directorii au spus marți că Gemini Pro a depășit performanța GPT-3.5, dar a evitat întrebările despre comparaţia cu GPT-4.
Când a fost întrebat dacă Google intenționează să taxeze pentru accesul la „Bard Advanced”, directorul general Google pentru Bard, Sissie Hsiao, a spus că se concentrează pe crearea unei experiențe bune și nu are încă detalii de monetizare.
Când a fost întrebat la un briefing de presă dacă Gemini are capacități noi în comparație cu LLM-urile din generația actuală, Eli Collins, vicepreședinte de produs la Google DeepMind, a răspuns: „Bănuiesc că are”, dar că încă funcționează pentru a înțelege capacitățile noi ale Gemini Ultra.
Se pare că Google a amânat lansarea Gemini pentru că nu era gata, aducând în minte amintiri despre lansarea de către companie a instrumentelor sale AI la începutul anului.
Mai mulți reporteri au întrebat despre întârziere, la care Collins a răspuns că testarea modelelor mai avansate durează mai mult. Collins a spus că Gemini este cel mai bine testat model AI construit de companie și că are „cele mai cuprinzătoare evaluări de siguranță” dintre orice model Google.
Tot miercuri, Google a prezentat unitatea sa de procesare a tensorilor de ultimă generație pentru antrenarea modelelor AI. Cipul TPU v5p, pe care Salesforce
și startup-ul Lightricks au început să îl folosească, oferă o performanță mai bună la preț decât TPU v4 anunțat în 2021, a spus Google. Dar compania nu a furnizat informații despre performanță în comparație cu liderul de piață Nvidia.
În timpul conferinței telefonice Google privind veniturile din al treilea trimestru din octombrie, investitorii au adresat directorilor mai multe întrebări despre cum va transforma AI în profit real.
În august, Google a lansat un „experiment timpuriu” numit Search Generative Experience, sau SGE, care le permite utilizatorilor să vadă cum ar arăta o experiență generativă AI atunci când folosesc motorul de căutare – căutarea este încă un centru de profit major pentru companie. Rezultatul este mai conversațional, reflectând vârsta chatbot-urilor. Cu toate acestea, este încă considerat un experiment și încă nu a fost lansat publicului larg.
Mai sus regasiți o reprezentare vizuală a conținutului articolului, o clasificare automată și un sumar al acestuia! Preluarea informațiilor urmăreste promovarea și facilitarea accesului la informație, cu respectarea drepturilor de proprietate intelectuală, conform cu termenii și condițiile sursei (financialintelligence.ro).