„DeepSeek“ naujos kartos modeliai tapo technologinių diskusijų objektu, pateikdami labai aiškų pasiūlymą: kontekstas, kuriame yra iki milijono žetonų, o architektūra – daugiau nei trilijonas parametrų Sukurta siekiant efektyvumo ir, svarbiausia, daug pigesnės nei uždaros kilpos alternatyvos Jungtinėse Valstijose, Kinijos bendrovė visiškai pasirinko V4 – šeimą, kurioje derinamas atviro svorio modelis, didžiulis kontekstinis langas ir agresyvi kainodaros strategija.
Šis žingsnis žengtas tuo metu, kai Europa ir Ispanija atidžiai svarsto dirbtinio intelekto kainą ir technologinį suverenitetą. „DeepSeek V4“ yra patrauklus pasirinkimas Europos startuoliams, MVĮ ir didelėms įmonėms. kuriems reikalingos pažangiausios galimybės, tačiau kurie negali – arba nenori – visiškai pasikliauti brangiomis patentuotomis API sąsajomis arba išskirtine aparatine įranga, pavyzdžiui, geidžiamiausiais NVIDIA GPU.
V4 šeima, kurios centre yra 1T parametrų ir 1M žetonų kontekstas

„DeepSeek“ paskelbė apie „DeepSeek-V4 Preview“ atsiradimą kaip atvirų modelių šeimą, kuri sukasi apie dvi idėjas: kontekstinis langas, kuriame yra iki 1 milijono žetonų ir milžiniškos architektūros, pagrįstos ekspertų mišiniu (MoE)Šioje šeimoje išsiskiria du pagrindiniai variantai: „DeepSeek-V4-Pro“ ir „DeepSeek-V4-Flash“, kurių abiejų skiriamasis bruožas yra tas 1M kontekstas.
Pačiu ambicingiausiu tikslu „V4-Pro“ veikia tokiais skaičiais kaip iki 1,6 trilijono parametrų (1,6 T), nors kiekviename išvados etape dėl „MoE“ schemos, kuri yra labai svarbi efektyvumui palaikyti, jis aktyvuoja tik nuo 32 iki 49 milijardų parametrų. Tuo pačiu metu bendrovė pristatė lengvesnius variantus, tokius kaip „V4-Flash“ ir „V4-Lite“, turinčius apie 284–285 milijardus parametrų ir apie 13 milijardų aktyvių parametrų, skirtus diegimams, kuriuose prioritetai yra greitis ir kaina.
Pagal bendrą parametrų skaičių V4 šeima pirmauja rinkoje, tačiau svarbi detalė yra ta, kad Tik nedidelė dalis šių ekspertų yra aktyvuoti žetonais.Tai leidžia jam elgtis kaip gigantiškam modeliui pajėgumų atžvilgiu, tačiau skaičiavimo energijos suvartojimas yra artimesnis daug mažesnių modelių. Toks požiūris atitinka „DeepSeek“ naratyvą: konkuruoti su dideliais, uždarojo kodo modeliais, nedidinant naudojimo kainos.
Bendrovė taip pat išleido preliminarius variantus, tokius kaip „V4-Lite“, kurie atlieka techninio patvirtinimo funkciją, ir koreguoja diegimo grafiką. Nors V4 vis dar yra riboto testavimo etape Kai kuriais atvejais „V4 Preview“ šeimą jau galima naudoti oficialiame pokalbių robote ir per atnaujintą įmonės API, o 1M kontekstas yra numatytoji reikšmė jos paslaugose.
Hibridinė architektūra ir ekspertų derinys, siekiant užtikrinti ilgalaikį kontekstą
„DeepSeek“ gebėjimo pasiūlyti milijono žetonų kontekstinį langą be staigiai išaugančių išvadų sąnaudų raktas slypi jos architektūroje. Gamintojas paaiškina, kad V4 pristato hibridinės priežiūros, ekspertų mišinio ir suspaudimo metodų derinys sukurtas darbui su labai ilgomis sekomis, sumažinant tiek FLOP skaičių vienam žetonui, tiek reikalingos atminties kiekį.
Tarp techninių komponentų, kuriuos mini bendrovė, išsiskiria šie: MLA (daugiagalvis latentinis dėmesys), DSA arba „DeepSeek“ retas dėmesys ir sąlyginės atminties mechanizmai, tokie kaip „Engram“Kartu šie komponentai siekia sumažinti dėmesio skaičiavimo naštą, ypač kai modelis turi apdoroti šimtus tūkstančių ar milijoną žetonų vienu metu.
Remiantis pačios bendrovės pateiktais duomenimis, 1 mln. žetonų atveju „DeepSeek-V4-Pro“ gali pareikalauti apie 27 % FLOP vienam žetonui ir tik 10 % KV talpyklos, palyginti su ankstesnėmis versijomis, tokiomis kaip „DeepSeek-V3.2“.Lengvesni variantai, tokie kaip „V4-Flash“, dar labiau sumažina šiuos skaičius ir yra grebios išvados sprendimai toms programoms, kuriose delsa yra labai svarbi.
Šio tipo patobulinimai nėra vien teoriniai: bendrovė teigia, kad MoE, išsklaidyto dėmesio ir konteksto supratimo derinys leidžia veikiant su itin ilgu kontekstu mažiau ekstremali techninė įranga jau dabar milijono žetonų kaina yra gerokai mažesnė nei daugelio uždarų modelių, kurių langai yra 128 tūkst. arba 200 tūkst. žetonų.
Samprotavimo, programavimo ir agentinių užduočių atlikimas
„DeepSeek“ nenori išsiskirti vien dėl savo dydžio ir konteksto. Savo vidiniuose palyginimuose bendrovė tvirtina, kad V4-Pro ir jo variantai buvo specialiai optimizuoti sudėtingam mąstymui, programavimui ir agentams.Šios trys sritys šiuo metu sudaro didelę verslo paklausos dalį. Tokie lyginamieji rodikliai kaip SWE-bench, skirti įmonių pajėgumams matuoti Kodo saugyklų supratimas ir modifikavimasKalbama apie skaičius, kurių tikslumas viršija 80 %, ir tai atitinka pirmaujančius uždarus modelius.
Bendresnio pobūdžio samprotavimuose, įskaitant matematiką, STEM disciplinas ir minties grandinės uždavinius, bendrovė V4-Pro skiria kaip vienas stipriausių atvirų modeliųir teigia, kad jis artėja prie uždarų sienų pasiūlymų lygio. Kalbant apie pasaulinį žinomumą, vidiniai duomenys jį iškelia į atviros ekosistemos priešakį ir nusileidžia tik keliems labai specifiniams patentuotiems modeliams, tokiems kaip tam tikri pažangūs Dvynių variantai.
Be skaičių, dėmesys skiriamas ir agentinės užduotys Tai rodo, kad naudojimas yra daug platesnis nei paprastas pokalbis. „DeepSeek“ teigia, kad V4 jau valdo savo kodo agentų ir sistemų infrastruktūrą, kuri sujungia kelis etapusJie naudojasi įrankiais ir dirba su didelėmis saugyklomis arba dokumentų duomenų bazėmis. Toks požiūris atitinka dabartinę pramonės tendenciją, kai daugelis įmonių nebėra ieško tik pokalbių robotų, bet ir asistentų, galinčių dirbti kaip „skaitmeniniai kolegos“ sudėtingose darbo eigose.
Į šiuos palyginimus reikėtų žiūrėti atsargiai: kaip ir beveik su visais naujausiais dirbtinio intelekto leidimais, Didžioji dalis duomenų gaunama iš pačios įmonės ir iš bandymų kontroliuojamoje aplinkoje.Nepaisant to, ilgo konteksto, efektyvios architektūros ir konkurencingo našumo derinys sulaukia Europos kūrėjų dėmesio, kurie lygina kainas ir galimybes su tokiais variantais kaip GPT, Claude, Llama ar Mistral.
Atviri modeliai, paskelbti svoriai ir suderinamumas su populiariomis API
Vienas iš pagrindinių veiksnių, pelniusių „DeepSeek“ žinomumą, yra įsipareigojimas atvirai ekosistemai. Su „V4“ bendrovė sustiprina šį požiūrį: paskelbė techninę ataskaitą ir išleido atvirus šeimos svorius tokiose platformose kaip „Hugging Face“.leisdama tyrėjams, įmonėms ir viešojo administravimo įstaigoms atsisiųsti modelius ir juos naudoti savo infrastruktūroje.
Šis atvirų svorių metodas, priešingai nei daugelio JAV laboratorijų siūlomi visiškai uždari modeliai, turi aiškių pasekmių Ispanijai ir Europos Sąjungai. Šių modelių diegimo galimybė duomenų centrų ES teritorijojepagal tokias sistemas kaip BDAR ir būsimas ES dirbtinio intelekto reglamentasTai suteikia galimybę geriau kontroliuoti duomenis neprarandant aukščiausio lygio galimybių.
Kalbant apie praktinę integraciją, „DeepSeek“ pasirinko sumažinti trintį: API palaiko tą patį „base_url“ ir yra suderinama su „OpenAI“ „ChatCompletions“ schemomis ir su Antropinės sąsajosDaugeliui kūrimo komandų tai reiškia, kad testų ar jų dalių srauto perkėlimas į V4 iš esmės apsiriboja modelio identifikatoriaus pakeitimu į „deepseek-v4-pro“ arba „deepseek-v4-flash“ ir kelių parametrų koregavimu.
Tuo pačiu metu bendrovė nustatė senesnių modelių, tokių kaip „deepseek-chat“ ir „deepseek-reasoner“, išleidimo į pensiją terminą. Jie bus nutraukti ir nukreipti į V4-Flash iki visiško jų pašalinimo, o tai verčia tuos, kurie jais naudojosi, pradėti ruoštis perkėlimui. Tai aiškus būdas sutelkti pasiūlymą į naująją kartą ir išvengti vartotojų bazės suskaidymo į per daug senesnių variantų.
Ribotos išvados ir dėmesys ekonominiam efektyvumui
„DeepSeek“ naratyvas nuo pat pradžių sukosi apie efektyvumą. Su V4 šią diskusiją sustiprina „MoE“ architektūros, paskirstyto dėmesio ir aparatinės įrangos optimizavimo derinys, kuriuo siekiama... sumažinti milijono žetonų kainą iki gerokai mažesnio lygio nei naudojant žinomiausias aukščiausios kokybės API sąsajasKai kuriose išorinėse analizėse minima apie 0,30 USD už milijoną įėjimo žetonų tam tikroms konfigūracijoms – tai tik dalis to, ką ima aukščiausios klasės uždari modeliai.
Europos kontekste, kur svarbios infrastruktūros ir energijos sąnaudos, šis dėmesys efektyvumui puikiai atitinka startuolių ir MVĮ poreikius. Didelių teisinių dokumentų, ilgų medicininių įrašų ar ištisų programinės įrangos saugyklų apdorojimas Tai nustoja būti prabanga, skirta beveik neribotus biudžetus turinčioms įmonėms, ir tampa prieinamų scenarijų, skirtų naujiems projektams, dalimi.
Kai kurie dirbtinio intelekto infrastruktūros teikėjai jau siūlo išankstinę prieigą prie „DeepSeek V4“ pagrindu sukurtų mazgų kaip savo katalogų dalį, todėl Europos įmonėms tai padaryti lengviau. jie gali įvertinti tikrąjį našumą ir sąnaudas nekurdami savo infrastruktūros nuo nulio.Daugeliui organizacijų šis testavimo etapas yra preliminarus žingsnis prieš nusprendžiant, ar tęsti išorinio modelio taikymą, ar diegimą vietoje.
Tuo tarpu bendrovės dalinis tylėjimas dėl tikslių mokymo išlaidų ir konkrečios naudojamos įrangos sukėlė abejonių kai kuriuose sektoriuose. Nuo 2025 m. sklando įtarimai dėl tikrojo išteklių kiekio, reikalingo jos modeliams apmokyti, įskaitant skaičiavimus, rodančius dešimtis tūkstančių aukščiausios klasės GPU. „DeepSeek“ tvirtina pasiekusi naują „pelningo ilgalaikio konteksto“ etapąTačiau ji dar iki galo neišsiaiškino nežinomybės apie savo veiklos materialinį mastą.
Poveikis startuoliams ir įmonėms Ispanijoje ir Europoje
Europos verslumo ekosistemai, o ypač Ispanijos technologijų startuoliams, tokių modelių kaip „DeepSeek V4“ atsiradimas atveria galimybes, kurias iki šiol buvo sunku apsvarstyti. Pasiekite modelį su daugiau nei trilijonu parametrų, naudodami 1 mln. žetonų ir atvirų svorių Tai leidžia jums tyrinėti pažangius produktus, nepasikliaujant vien Silicio slėnio tiekėjais.
Reguliuojamuose sektoriuose – finansų, sveikatos apsaugos, teisės, viešojo administravimo – galimybė paleisti modelį duomenų centruose ES arba net savo patalpose Tai ypač aktualu. Atitiktis BDAR ir nacionaliniams duomenų apsaugos reglamentams tampa lengviau įgyvendinama, kai informacijai nereikia palikti Europos jurisdikcijų, kad ją apdorotų dirbtinio intelekto modelis.
Ispanijos startuoliai, dirbantys su dideliais dokumentų kiekiais, pavyzdžiui, teisinių technologijų, sveikatos technologijų ar kūrėjų įrankių, gali pasinaudoti 1 mln. žetonų kontekstu, kad analizuojant pilnus failus, labai ilgas ligos istorijas arba monolitines kodų saugyklas nereikalaujant jų dalyti į kelias dalis ir kurti sudėtingas atkūrimo sistemas. Tai sumažina techninį sudėtingumą ir daugeliu atvejų vėlavimą.
Tuo pačiu metu svarbu nepamiršti rizikos: „DeepSeek“ supanti įrankių ekosistema yra naujesnė nei kitų atvirųjų modelių, tokių kaip „Llama“, ir Dokumentacija ir bendruomenės parama vis dar bręsta.Be to, tai, kad tai Kinijos įmonė, įneša geopolitinį komponentą, į kurį kai kurios Europos organizacijos žiūri atsargiai, ypač projektuose, susijusiuose su administracijomis ar ypatingos svarbos infrastruktūra.
Šis žingsnis daro spaudimą brangiems, uždariems modeliams
Be konkrečių specifikacijų, „DeepSeek V4“ sektoriuje interpretuojamas kaip dar vienas konkurencinio spaudimo žingsnis brangiausiems uždariems modeliams rinkojeNustatydama 1 mln. žetono kontekstą kaip standartą visose savo oficialiose paslaugose ir pridėdama atvirus svorius, Kinijos bendrovė siunčia aiškią žinią: itin ilgas kontekstas nebėra būtinas, kad būtų išskirtinė kelių brangių patentuotų modelių funkcija.
Didelėms Vakarų laboratorijoms tai kelia iššūkį. „OpenAI“, „Anthropic“ ir „Google“ istoriškai naudojo šių metodų derinį. aukštesnė kokybė, platesnis kontekstas ir patentuota ekosistema kaip vertės pasiūlymas. Atsiradus atvirai alternatyvai, kai kuriais atvejais turinčiai dar pranašesnį kontekstą ir labai mažas sąnaudas, verčiama permąstyti produktų ir kainodaros strategijas, ypač tuose segmentuose, kuriuose vartotojų įmonių pelno marža yra maža.
Ispaniškai kalbančiame pasaulyje, kur daugelis startuolių veikia su daug kuklesniais biudžetais nei jų kolegos Jungtinėse Valstijose, konkurencinis spaudimas veikia jų naudai. Kuo daugiau galingų ir atvirų modelių, tuo daugiau galimybių techninės komandos turės rinktis pagal kainą, atitiktį reglamentams ir naudojimo atvejį.ir ne tik iš prekės ženklo, sukūrusio API.
Tuo pačiu metu „DeepSeek“ žino, kad jos statymas nėra be iššūkių: dauguma lyginamųjų testų ir palyginimų yra gauti iš jų pačių dokumentacijos arba iš bandymų peržiūros etapuose, o rinka vis dar laukia, kaip V4 modeliai veiks, kai bus masiškai diegiami sudėtingose gamybos aplinkose, įskaitant Europos.
Apskritai „DeepSeek V4“ pasirodymas įtvirtina tendenciją, kuri vystėsi jau kurį laiką: Pažangiausi dirbtinio intelekto modeliai nebėra išskirtinė kelių įmonių, turinčių uždaras sistemas ir astronominius biudžetus, sritis.Derindama daugiau nei 1 trilijoną parametrų, 1 mln. žetonų kontekstą, atvirus svorius ir į efektyvumą orientuotą diskursą, Kinijos bendrovė pristato alternatyvą, kurios Ispanijos ir Europos bendrovės ir kūrėjai vargu ar galės ignoruoti savo būsimuose dirbtinio intelekto infrastruktūros diegimo ir atnaujinimo planuose.