
„Google“ žengė svarbų žingsnį savo strategijoje, siekdama... atviras dirbtinis intelektas Pristačius „Gemma 4“, nauja modelių šeima siekia suderinti aukštą mąstymo lygį su daug mažesniais aparatinės įrangos reikalavimais. Bendrovė šią kartą pristato kaip rimtą alternatyvą tiems, kuriems reikia paleisti pažangų dirbtinį intelektą savo infrastruktūroje – nuo mobiliųjų įrenginių iki duomenų centrų.
Toli gražu ne vienas modelis, „Gemma 4“ – tai pilnas keturių atvirų variantų asortimentas.Šis pasiūlymas, skirtas kūrėjams, įmonėms ir viešosioms įstaigoms, norinčioms labiau kontroliuoti savo duomenis ir diegimą, ypač gerai atitinka reikalavimus. Skaitmeninis suverenitetas ir atitiktis reglamentams Europojekur vis svarbesnė tampa teisė nuspręsti, kur vykdyti ir kur saugoti duomenis.
Keturių modelių šeima, orientuota į „parametrais pagrįstą intelektą“
„Gemma 4“ buvo sukurtas remiantis tuo pačiu technologiniu pagrindu kaip ir Dvyniai 3Tačiau su aiškiu tikslu: maksimaliai padidinti „Google“ skambučių skaičių „parametrais pagrįstas intelektas“Užuot konkuravusi vien dydžiu, bendrovė giriasi pasiekusi našumo lygį, palyginus su daug didesnėmis sistemomis, tačiau palyginti kompaktiškuose modeliuose.
Šeimą sudaro keturi skirtingi dydžiai: Efektyvus 2B (E2B), efektyvus 4B (E4B), modelis 26B su mišrios ekspertų (MoE) architektūra ir tankus variantas 31B parametraiPastarasis jau yra įsikūręs 3 geriausi „Arena AI“ atvirųjų modelių reitinge, pranoksta alternatyvas, kurios parametrų skaičių padaugina iš dvidešimties, o tai ypač aktualu tiems, kurie nori sumažinti GPU sąnaudas neprarandant kokybės.
Modelis 26B Švietimo ministerija Jis optimizuotas taip, kad išvadose būtų aktyvuota tik dalis jo parametrų (apie 3,8 mlrd.), taip pagerinant žetonų generavimo greitį ir energijos vartojimo efektyvumą. Priešingai, versija 31B tankus Jis pozicionuojamas kaip pageidaujamas pasirinkimas sudėtingoms tiksliojo derinimo užduotims, sudėtingam orkestravimui ir intensyviam naudojimui verslo ar institucinėje aplinkoje.
„Google“ pabrėžia, kad viešųjų etalonų požiūriu šie variantai tiesiogiai konkuruoja su sunkesniais kitų tiekėjų modeliais, įskaitant Kinijos gamintojų, tokių kaip „DeepSeek“ ar „Qwen“, kurie pastaraisiais metais tapo stiprūs atvirojo kodo ekosistemoje. „Gemma 4“ 31B yra įtrauktas į trečią geriausių atvirų modelių sąrašą „Arena AI“ kategorijoje., o 26B Švietimo ministerija taip pat užima aukštą vietą.
Verslo požiūriu, tas santykis tarp dydžio ir našumo reiškia mažesnės aparatinės įrangos išlaidos, mažesnis delsos laikas ir galimybė paleisti ribinius modelius viename NVIDIA H100 80 GB vaizdo plokštėTai atveria duris vidutinio dydžio Europos įmonėms dirbti su pažangiu dirbtiniu intelektu neinvestuojant į neproporcingai didelę infrastruktūrą.
Kišeninio dydžio dirbtinis intelektas: mobilusis ryšys, daiktų internetas ir periferiniai skaičiavimai
Mažesni modeliai, E2B ir E4BJie yra specialiai sukurti veikti tinklo pakraštyje, t. y. mobilieji įrenginiai, daiktų internetas ir vietinė aparatinė įranga„Google“ pažymi, kad šie variantai yra optimizuoti veikti „Android“ išmanieji telefonai, Aviečių PiJetson Nano ir kitos mažai energijos naudojančios sistemos, pasižyminčios labai mažu delsos laiku ir net be interneto ryšio.
Šiame segmente prioritetas teikiamas ne tik energijai, bet ir gebėjimui pasiūlyti multimodalinės funkcijos ir greitas reagavimas ribotų išteklių aplinkoje. „Gemma 4“ krašto modeliai gali susidoroti su tekstas, vaizdai ir vaizdo įrašai, o E2B ir E4B atveju jie prideda vietinę paramą garsoTai leidžia naudoti tokius atvejus kaip vietiniai balso asistentai, vaizdų atpažinimas lauke arba vaizdo įrašų analizė realiuoju laiku, nereikalaujant siųsti duomenų į debesį.
Šių lengvų modelių kontekstinis langas pasiekia 128.000 žetonaiTo pakanka ilgiems dokumentams, išsamiems pokalbiams ar atitinkamiems kodo fragmentams apdoroti vienoje eilutėje. „Google“ teigimu, šis plataus konteksto ir vietinio vykdymo derinys padeda pašalinti trintį. privatumas, ryšys ir delsaTai labai aktualu pramonės, sveikatos priežiūros ar švietimo projektams Europoje, kur duomenų tvarkymo apribojimai tampa vis griežtesni.
Aparatinės įrangos gamintojų požiūriu, „Gemma 4“ atveria duris integracijai Pažangus dirbtinis intelektas tiesiai į vartojimo produktusNuo išmaniųjų telefonų ir planšetinių kompiuterių iki medicinos prietaisų ir pramoninių jutiklių – bendrovė pabrėžė, kad šie modeliai yra sukurti veikti su įprastų „Android“ ekosistemos tiekėjų, tokių kaip „Qualcomm“ ir „MediaTek“, lustais, taip palengvinant jų platų pritaikymą.
Be to, kraštinių modelių architektūra naudoja tokius metodus kaip Įterpimai sluoksniuose (PLE) siekiant maksimaliai padidinti parametrų naudojimo efektyvumą, leidžiant samprotauti ir suprasti kontekstą daug mažesnėmis skaičiavimo sąnaudomis nei įprasta bendrosios paskirties modeliuose.
Multimodalumas, agentai ir pažangi kūrėjų pagalba
Vienas iš „Gemma 4“ privalumų yra aiškus įsipareigojimas agentų darbo eigosModeliai neapsiriboja teksto generavimu: jie integruoti savaime funkcijų iškvietimas, struktūrizuota JSON išvestis ir sistemos instrukcijosTai leidžia kurti autonominius agentus, kurie koordinuoja įvairius veiksmus, iškviečia išorines API ir pateikia rezultatus formatais, lengvai integruojamais su įmonės programomis.
„Google“ tvirtina, kad visi „Gemma 4“ šeimos modeliai buvo sukurti taip, kad... aukšto lygio samprotautojaisu konfigūruojamais mąstymo režimais, kad būtų galima pritaikyti samprotavimo gylį pagal užduotį. Tai reiškia geresnius rezultatus daugiapakopis samprotavimas, neprisijungus kodo generavimas ir sudėtingų problemų sprendimas – pagrindiniai aspektai įmonių ir viešojo administravimo aplinkoje, kur reikalingas patikimumas.
Multimodalinėje plokštumoje keturi modeliai gali apdoroti Tekstas ir vaizdai su skirtinga skiriamąja geba ir kraštinių santykiu, o E2B ir E4B variantai išplečia šią talpą iki vaizdo ir garsoŠis derinys leidžia, pavyzdžiui, sukurti sistemas, kurios analizuoja dokumentus su grafika, pramoninio stebėjimo vaizdo įrašais arba turtingu edukaciniu turiniu ir realiuoju laiku generuoja kontekstinius atsakymus.
Kontekstinis langas pasiekia 256 000 žetonų didžiausiuose modeliuoseTai leidžia vartotojams įkelti ištisas kodo saugyklas, ilgas teisines sutartis ar didelius techninės dokumentacijos kiekius viena užklausa. Pagalbos, konsultavimo ar IT audito komandoms tai leidžia lengviau automatizuoti užduotis, kurioms anksčiau reikėdavo daug valandų rankinio peržiūros.
Kalbant apie kalbas, „Gemma 4“ palaiko daugiau nei 140 XNUMX kalbųEuropai, o ypač Ispanijai, tai reiškia, kad galima sukurti daugiakalbius sprendimus, apimančius viską – nuo pagrindinių ES kalbų iki rečiau vartojamų kalbų, – ir padėti pasiekti prieinamumo bei įtraukties tikslus viešosiose ir privačiose paslaugose.
Debesijos integracija, skaitmeninis suverenitetas ir diegimas Europoje
„Gemma 4“ diegimas neapsiriboja vietine įranga. „Google“ integravo šiuos modelius į savo debesijos pasiūlymą per Viršūnė AI y „Google Kubernetes Engine“ (GKE)leidžia organizacijoms konfigūruoti dedikuotus skaičiavimo išteklius ir pagal poreikį keisti išvadų apdorojimo darbo krūvius. Reguliuojamuose Europos sektoriuose tai derinama su galimybėmis Suverenus debesis ir nuotoliniu būdu arba vietoje diegiamus įrenginius, pritaikytus prie duomenų laikymo reikalavimų ir atitikties Bendrajam duomenų apsaugos reglamentui (BDAR).
Bendrovė pabrėžia, kad didesnių modelių tikslūs „bfloat16“ svareliai gali būti efektyviai naudojami a viena 80 GB NVIDIA H100 GPUsumažinant vidutinio dydžio įmonių ar viešųjų įstaigų, norinčių išlaikyti savo infrastruktūros kontrolę, patekimo į rinką barjerą. Kvantinėse versijose modeliai taip pat gali veikti vartotojų aparatinė įranga arba darbo stotys, išplėsdamas galimų diegimo galimybių spektrą.
Ispanijoje ir likusioje Europoje technologijų vadovams šis derinys atviras modelis, kontroliuojamas diegimas ir nepriklausomas debesijos palaikymas Tai leidžia kurti hibridines architektūras: dalis intelekto gali būti vietiniuose duomenų centruose, o kiti, mažiau jautrūs, darbo krūviai veikia viešajame debesyje, išlaikant bendrą technologinę bazę.
Be to, „Google“ siūlo Agento kūrimo rinkinys (ADK)Modulinė sistema, kuri supaprastina „Gemma 4“ pagrindu sukurtų agentų kūrimą, testavimą ir diegimą. Ji taip pat remiasi tokiomis paslaugomis kaip Debesijos palaikymas su NVIDIA RTX PRO 6000 GPU („Blackwell“) be serverio režimu, kuris leidžia pradėti didelio intensyvumo bandomuosius projektus nuo pat pirmos dienos nereikalaujant įsigyti savo aparatinės įrangos.
Europos kontekste, kur diskusijos apie dirbtinį intelektą paprastai sukasi apie kontrolę, skaidrumą ir audituojamumą, galimybė Diegkite atvirus modelius kontroliuojamose infrastruktūrose, naudodami „Apache 2.0“ Tai ypač patrauklu administracijoms, bankams, draudimo bendrovėms ar sveikatos sektoriaus įmonėms, kurioms reikia suderinti inovacijas su griežtomis reguliavimo sistemomis.
„Apache“ 2.0 licencija, atvira ekosistema ir bendruomenės trauka
Jei yra vienas aspektas, kuris sukėlė ypatingą bendruomenės susidomėjimą, tai sprendimas licencijuoti „Gemma 4“ pagal Apache 2.0Ankstesnėse „Gemma“ versijose buvo naudojamos specialios licencijos, kurios kėlė teisinių klausimų dėl komercinių produktų; dabar, naudojant standartinę atvirojo kodo licenciją, Kūrėjai ir įmonės gali modifikuoti, perskirstyti ir gauti pajamų iš modelių su daug mažesne trintimi.
Šis atidarymas vyksta tuo metu, kai „Google“ bando atgauti pozicijas atvirųjų modelių ekosistemojeTai įvyko po laikotarpio, kai alternatyvos, tokios kaip „Meta“ sukurta „Llama“ ar kinų modeliai („DeepSeek“, „Qwen“, GLM, „Minimax“), buvo plačiai naudojamos. Įtakingi sektoriaus atstovai, pavyzdžiui, „Hugging Face“ bendraįkūrėjas, šį žingsnį apibūdino kaip „didžiulį vietos dirbtinio intelekto etapą“, pabrėždami, kad teisininkų komandos dabar turi daug aiškesnę sistemą projektams, paremtiems „Gemma 4“, tvirtinti.
Gemos šeimą supanti ekosistema jau demonstravo stiprybę prieš šią versiją. „Google“ pažymi, kad ankstesnės kartos viršija... 400 mln. Parsisiuntimų ir kad bendruomenė sukūrė daugiau nei 100.000 variantai pritaikyta skirtingoms kalboms ir naudojimo atvejams. Tarp ryškiausių pavyzdžių yra modeliai, specializuoti Bulgarų arba vėžio tyrimų įrankiai, tokie kaip „Cell2Sentence“ skalė sukurtas Jeilio universitete.
Su „Gemma 4“ kompanija tikisi, kad „Gemmavisata“ dar labiau išsiplės, pakviesdama... Europos startuoliai, universitetai ir tyrimų centrai kurti savo išvestines priemones. Leidžiančiosios licencijos ir atvirų svorių derinys leidžia kurti versijas, skirtas konkretiems sektoriams, pavyzdžiui, sveikatos apsaugai, teisingumui, 4.0-ajai pramonės revoliucijai ar švietimui, kuriomis vėliau galima dalytis arba prekiauti be didelių apribojimų.
Ispanijos įmonėms ši situacija reiškia, kad „Gemma 4“ platformoje galima kurti patentuotus sprendimus, tokius kaip vidiniai asistentai, įmonių paieškos sistemos ar pažangios analizės sistemos, išlaikant kodo, duomenų ir infrastruktūros kontrolę, o tai puikiai dera su tendencija stiprinti... Europos technologinis suverenitetas.
Naudojimo atvejai: nuo startuolių iki didelių korporacijų
„Gemma 4“ buvo pristatytas su plačiu asortimentu galimos programosVerslo pasaulyje modeliai gali būti naudojami kuriant daugiakalbiai virtualūs asistentai gebantis apdoroti sudėtingas užklausas taikant pažangų samprotavimą arba automatizuoti kodo generavimą ir peržiūrą kūrimo komandose.
Didesni modeliai skirti tokioms užduotims kaip agentų koordinavimas, didelių dokumentų kiekių analizėTai apima techninių ataskaitų rengimą arba pagalbą teisiniams ir atitikties skyriams. Plataus konteksto langų ir daugiamodalinio palaikymo derinys leidžia vienam agentui lengvai dirbti su sutartimis, el. laiškais, diagramomis, stebėjimo sistemos vaizdais ir garso įrašais – visa tai toje pačioje darbo eigoje.
Švietimo ir viešajame sektoriuje galimybė apdoroti tekstą, vaizdus, o kai kuriais atvejais ir vaizdo bei garso įrašus leidžia kurti mokymosi paramos platformos kurios generuoja santraukas, nuoseklius paaiškinimus ar skirtingiems lygiams pritaikytą medžiagą. Vietinis įgyvendinimas taip pat padeda laikytis privatumo reikalavimų dirbant su jautriais nepilnamečių ar pažeidžiamų grupių duomenimis.
Startuolių srityje „Gemma 4“ gali būti pagrindas vertikalių gaminių Finansinių technologijų, skaitmeninės sveikatos, logistikos ar B2B SaaS srityse komandos gali dėl „Apache 2.0“ siūlomo lankstumo atlikti šiuos veiksmus: tikslus derinimas modelį savo duomenyse, diegti jį vietoje arba debesyje ir parduoti rezultatą neprisirišant prie griežtų nuosavybės licencijų.
Europai ypač įdomi yra plėtros galimybė vietiniai dirbtinio intelekto sprendimai kurios laikosi nacionalinių ir bendruomenės reglamentų, pavyzdžiui, saugodamos duomenis Europos teritorijoje esančiuose duomenų centruose ir tiesiogiai valdydamos modelius, o tai gali būti labai svarbu projektams, susijusiems su būsimu ES dirbtinio intelekto reglamentu.
Kur ir kaip pasiekti „Gemma 4“
„Google“ pateikė „Gemma 4“ svorius įvairiais kanalais, kad kūrėjai ir tyrėjai galėtų juos lengviau naudoti. Atvirus svorius galima atsisiųsti iš Apsikabinęs veidas y GitHub, o naudojimas per sąsają ir API yra galimas Google AI studijaTaip pat siūlomos integracijos su Ollama„Docker“, „Kaggle“ ir tokie įrankiai kaip „LM Studio“.
Pasak bendrovės, „Gemma 4“ galima paleisti lokaliai „milijardai „Android“ įrenginių» ir įvairioje aparatinėje įrangoje: nuo Nešiojamųjų kompiuterių GPU ir darbo stočių, iki pat specializuotų kūrėjų greitintuvų. Tai atitinka strategiją išplėsti pažangų dirbtinį intelektą ne tik dideliuose duomenų centruose, bet ir galutinių vartotojų įrenginiuose bei periferinių skaičiavimų aplinkoje.
Tiems, kurie nori pradėti nuo greitų testų, tiesiausias pasirinkimas yra naudoti Google AI studija 26B ir 31B modeliams arba „Google AI Edge“ galerija E2B ir E4B variantų atveju. Tuo pačiu metu tokių platformų kaip „Hugging Face“ kūrėjų bendruomenės jau skelbia adaptacijas ir paruoštas naudoti konfigūracijas skirtingoms aplinkoms.
Tikimasi, kad Ispanijoje ir kitose Europos šalyse vietos integratoriai ir valdomų paslaugų teikėjai pradės siūlyti „Gemma 4“ pagrindu sukurti sprendimai iki galo, derinant suverenius debesijos diegimus, pagalbą ispanų kalba ir prisitaikymą prie konkrečių sektorių reglamentų, pavyzdžiui, finansinių paslaugų ar sveikatos priežiūros.
Apskritai „Gemma 4“ paleidimas pozicionuoja „Google“ kaip vieną iš svarbiausių žaidėjų šioje srityje. atviri ir lokaliai vykdomi dirbtinio intelekto modeliaiTai vyksta tuo metu, kai Europos pramonė reikalauja įrankių, kurie apjungtų didelį našumą, duomenų kontrolę ir aiškias licencijavimo sistemas, kad būtų galima kurti ilgalaikius komercinius produktus.



