„OpenAI“ išjungia „Sora“: kodėl AI vaizdo įrašų programėlė taip greitai dingsta

  • „OpenAI“ uždaro „Sora“, savo dirbtinio intelekto valdomą vaizdo įrašų generavimo programėlę ir API, praėjus vos keliems mėnesiams po jos paleidimo kaip socialinio tinklo.
  • Rengdamasi galimam IPO, bendrovė perskirsto išteklius verslo įrankiams, programavimui ir robotikai.
  • Kelių milijonų dolerių vertės susitarimas su „Disney“ ir personažų iš „Marvel“, „Pixar“ ar „Žvaigždžių karų“ naudojimas yra sustabdytas ir nebegalioja.
  • Didelės skaičiavimo išlaidos, reguliavimo spaudimas ir konkurencija iš „Anthropic“ bei „Google“ paspartino „OpenAI“ strateginį pokytį.

Vaizdo įrašų programa su dirbtiniu intelektu

„OpenAI“ nusprendė užbaigti „Sora“ – ambicingą generatyvinę vaizdo įrašų programėlę su dirbtiniu intelektuPraėjus vos keliems mėnesiams po masinio įrankio, kaip atskiros programėlės ir socialinio tinklo, pristatymo, sprendimas priimtas po vasaros, kai įrankis buvo labai žinomas, jį atsisiuntė milijonai kartų ir sudarė aukščiausio lygio sutartis su tokiais milžinais kaip „Disney“. Tačiau tai taip pat įvyko augant diskusijoms apie šio tipo technologijų kainą, riziką ir tikrąjį jų tinkamumą įmonės verslui.

Pranešimas, paviešintas per oficialią Soros X paskyrą (anksčiau „Twitter“), patvirtina, kad Bus uždaryta ir vartotojo programėlė, ir kūrėjo API.„OpenAI“ padėkojo bendruomenės dalyviams ir paskelbė, kad artimiausiomis dienomis pateiks instrukcijas, kaip išsaugoti sugeneruotus vaizdo įrašus, taip pat išsamų paslaugos išjungimo grafiką.

Kas buvo Sora ir kodėl ji tapo tokiu greitu reiškiniu?

Sora gimė kaip Pirmasis didelis „OpenAI“ statymas dėl atskiros programos, skirtos trumpiems vaizdo įrašamssu sąsaja, labai panašia į „TikTok“ ar „Instagram Reels“. Nuo viešo paleidimo rugsėjį vartotojai galėjo rašyti tekstines instrukcijas, įsiterpti į filmų scenas ar kasdienes situacijas ir dalytis rezultatu dirbtinio intelekto sugeneruotų vertikalių klipų socialiniame kanale.

Pirmosiomis dienomis, kai programėlė buvo prieinama plačiajai visuomenei, ji Per mažiau nei penkias dienas viršijo milijono atsisiuntimų skaičiųKai kuriais rodikliais jis netgi pranoko pradinį „ChatGPT“ paleidimą. Jis užėmė pirmąją vietą nuotraukų ir vaizdo įrašų topuose „iPhone App Store“ parduotuvėje ir tapo pagrindiniu „OpenAI“ bandymo visiškai patekti į trumpų vaizdo įrašų reklamos rinką, kurioje dominuoja „TikTok“, „YouTube Shorts“, „Instagram“ ir „Facebook“, elementu.

Didžioji dalis pradinio impulso buvo pagrįsta galimybe remiksuokite kitų vartotojų vaizdo įrašus ir tuo, kaip lengvai jis gali sukurti įspūdingas scenas: nuo neįsivaizduojamų peizažų iki popkultūros ikonų atkūrimo. „OpenAI“ generalinis direktorius Samas Altmanas netgi viešai ragino vartotojus žaisti su savo atvaizdu atpažįstamose filmų ir televizijos akimirkose.

Po tos akinančios pradžios paslauga buvo perpildyta paklausos ir „OpenAI“ turėjo greitai išplėsti infrastruktūrą, reikalingą reaguoti į vaizdo įrašų užklausasPraėjus pradiniam pikas ir naudojimui stabilizavusis, atsisiuntimų skaičius pradėjo mažėti, o „Sora“ prarado savo vietą reitinguose, o tai jau sukėlė vidinių abejonių dėl jos vidutinės trukmės trajektorijos.

„Sora“ technologija ir jos paslėptos išlaidos

Dirbtinio intelekto valdoma vaizdo įrašų generavimo technologija

Už socialinių tinklų fasado ribų „Sora“ buvo vienas techniškai sudėtingiausių „OpenAI“ projektųPlatforma sujungė difuzijos modelius – tuos pačius principus, kurie lėmė realistiškų vaizdų generavimą – su „Transformer“ tipo architektūromis, gebančiomis interpretuoti tekstą ir vaizdines sekas kaip vieną informacijos srautą.

Kūrymo procesas prasidėjo nuo Vaizdo įrašas buvo visiškai triukšmingas, panašus į televizoriaus be signalo keliamą triukšmą.Atlikdama nuoseklius matematinius iteracijas, vadovaujamas vartotojo instrukcijų, sistema palaipsniui pašalino triukšmą ir atskleidė darnią sceną tiek vizualiniu, tiek naratyviniu požiūriu.

Kitaip nei kiti modeliai, kurie vaizdo įrašą traktuoja kaip paprastą vaizdų seką, „Sora“ suskirstė turinį į maži trimačiai erdvėlaikio fragmentaiŠie pataisymai atsižvelgė ne tik į kiekvieno kadro plotį ir aukštį, bet ir į laiko tėkmę, o tai leido užtikrinti tęstinumą tarp kadrų, objektų nuoseklumą ir jų sąveikos logiką visoje sekoje.

Modelio mokymai rėmėsi milijonai vaizdo įrašų, su kuriais išmokau pagrindinius fizinio pasaulio įstatymusKaip elgiasi vanduo, kaip šešėliai projektuojami ant judančių paviršių arba kas nutinka, kai objektas yra įkandamas, ir tas veiksmas turėtų palikti pėdsaką vėlesniuose kadruose. Šis gebėjimas imituoti realaus pasaulio reiškinius buvo laikomas pagrindiniu privalumu ne tik pramogoms, bet ir ateities robotikai.

Tačiau visas tas techninis diegimas turėjo trūkumų: didžiulis skaičiavimo išteklių sunaudojimasKiekvienas sukurtas vaizdo įrašas pareikalavo didelių skaičiavimo galios sąnaudų, taigi ir infrastruktūros išlaidų, ypač dėl to, kad vaizdo plokštės funkcijaTuo metu, kai didžiosios technologijų įmonės lenktyniauja kurdamos vis galingesnius duomenų centrus, o dirbtinio intelekto lustų paklausa smarkiai išaugo, vaizdo įrašais intensyvaus socialinio tinklo palaikymas tapo sunkiai pateisinamas.

„OpenAI“ strateginis poslinkis: atsisveikinimas su vartotojų vaizdo įrašais, sveiki su įmonėmis ir robotika

„Sora“ uždarymas nėra suprantamas kaip pavienis atvejis, bet kaip platesnio masto „OpenAI“ perorientavimo dalisRemiantis žiniasklaidos priemonių, tokių kaip „The Wall Street Journal“ ir kitų verslo laikraščių, pranešimais, bendrovė paskelbė, kad išmontuos kelis produktus, pagrįstus jos vaizdo įrašų modeliais, įskaitant į „ChatGPT“ integruotas klipų generavimo funkcijas.

Šis žingsnis atitinka planą teikti pirmenybę produktyvumo įrankiams ir programinei įrangai įmonėms ir kūrėjams„OpenAI“ sujungė anksčiau skirtingus produktus, tokius kaip „ChatGPT“ darbalaukio programa, programavimo technologija ir naršyklė, į savotišką vieningą „superprogramėlę“, kuria ketina supaprastinti savo katalogą ir sutelkti komandas pagal aiškesnę produkto viziją.

Tuo pačiu metu bendrovė pabrėžė savo ketinimą Stiprinti realaus pasaulio modeliavimo ir robotikos tyrimusBendrovės atstovai paaiškino, kad komanda, dirbusi su „Sora“, ir toliau naudos vaizdo įrašų generavimą, tačiau viduje, kad apmokytų robotus, gebančius veikti fizinėje aplinkoje ir spręsti praktines užduotis.

Šis pokytis įvyksta kontekste, kuriame „OpenAI“ svarsto galimą IPO, kuris prasidės paskutinį metų ketvirtį.Tapimas viešai kotiruojama bendrove reiškia mažesnę priklausomybę nuo didelių privačių finansavimo etapų ir didesnę – nuo ​​pasikartojančių pajamų iš stabilių produktų, o tai skatina sutelkti dėmesį į aiškesnį pelningumą užtikrinančias įmones, pavyzdžiui, paslaugas įmonėms ar programavimo sprendimus.

Šiame scenarijuje didelio atgarsio projektų, turinčių mažesnį ekonominį poveikį, pavyzdžiui, generatyvaus vaizdo socialinio tinklo su didelėmis skaičiavimo sąnaudomis, išlaikymas yra suvokiamas kaip sunkiai išlaikoma prabanga. Todėl pačioje įmonėje „Sora“ uždarymas interpretuojamas kaip bandymas... „Atsikratykite balasto“ ir sumažinkite blaškymąsi sutelkti dėmesį į tai, kas gali užtikrinti ilgalaikį augimą.

„Disney“ sandoriai kabo ore ir tai trukdo svarbiam žiniasklaidos pristatymui

Vienas iš elementų, kuris labiausiai patraukė dėmesį kalbant apie Sorą, buvo jo aljansas su „Disney“ ir kitomis didelėmis intelektinės nuosavybės įmonėmisMetų pabaigoje pramogų bendrovė paskelbė apie susitarimą, pagal kurį vartotojai „OpenAI“ programėlėje galės kurti vaizdo įrašus su daugiau nei 200 personažų iš tokių franšizių kaip „Marvel“, „Pixar“ ar „Žvaigždžių karai“.

Tame susitarime buvo numatyta galimybė, kad Sora taptų oficialia „Disney“ katalogo įkvėpto turinio vitrinaTai ypač patrauklu, vykstant kovai dėl vartotojų dėmesio trumpų vaizdo įrašų platformose. Be to, įvairios žiniasklaidos priemonės pranešė apie pramogų milžinės kelių milijonų dolerių investiciją į „OpenAI“, iš dalies susijusią su šiuo bendradarbiavimu.

„OpenAI“ strateginis pokytis ir „Sora“ žlugimas privertė šį projektą būti sustabdytas. „Disney“ atstovai nurodė, kad sutartis nebebus vykdoma pagal iš pradžių numatytas sąlygas ir pareiškė, kad gerbia technologijų bendrovės sprendimą atsisakyti generatyvinio vaizdo įrašų verslo, skirto plačiajai visuomenei.

„Disney“ tvirtina, kad Jie ir toliau nagrinės bendradarbiavimo su dirbtinio intelekto platformomis galimybes....su sąlyga, kad jie leis jiems pasiekti gerbėjus, kartu gerbiant intelektinės nuosavybės ir kūrėjų teises. Taigi Soros byla primena, kaip greitai gali pasikeisti prioritetai tokiame nepastoviame sektoriuje kaip generatyvinis dirbtinis intelektas.

Uždarymas taip pat paveikia kitus, mažesnio masto sandorius, įskaitant sandorius su studijomis, turinio kūrėjais ir reklamos agentūromis, kurie buvo pradėję eksperimentuoti su platforma. Daugelis šių žaidėjų dabar supranta, kaip... Potencialiai galingas platinimo ir reklamos kanalas išnyksta kaip tik tada, kai jie pradėjo suprasti jo logiką ir auditoriją.

Ginčai: autorių teisės, giliosios klastotės ir „dirbtinio intelekto šiukšlės“

Be verslo aspektų, Sorą supo ginčai, susiję su intelektinės nuosavybės naudojimu ir giliųjų klastočių kūrimuNuo pat pirmųjų savaičių autorių teisių savininkai ir audiovizualinės pramonės asociacijos perspėjo, kad programėlė leidžia vartotojams kurti vaizdo įrašus su realių žmonių, saugomų personažų ir scenų atvaizdais, kuriuos lengva supainioti su profesionalia medžiaga.

Scenaristų organizacijos ir aktorių sąjungos, ypač stiprios Jungtinėse Valstijose, išreiškė susirūpinimą dėl šių įrankių poveikį kūrybiniam užimtumui ir savo įvaizdžio kontroleiTai, kaip lengvai vartotojas galėjo sukurti scenas, kuriose viešas asmuo atrodė darantis ar sakantis praktiškai bet ką, sukėlė karštas diskusijas apie šio tipo programos ribas.

Įvairių žiniasklaidos priemonių ir ekspertų analizėse Sora pradėta vadinti potencialus „DI šiukšlių“ generatoriusDideli kiekiai žemos kokybės, pasikartojančių ar akivaizdžiai klaidinančių vaizdo įrašų buvo sumaišyti su teisėtu kūrybiniu turiniu. Dėl šio vizualinio triukšmo buvo sunku atskirti autentišką turinį nuo sufabrikuotų ir kurstomų baimių dėl naujos dezinformacijos bangos, paremtos hiperrealistiniais klipais.

Susidūrusi su didėjančiu spaudimu, „OpenAI“ pristatė papildomos kontrolės priemonės, skirtos apriboti tam tikro turinio kūrimąPavyzdžiui, vaizdo įrašų, kuriuose vaizduojami tokie personažai kaip Michaelas Jacksonas, Martinas Lutheris Kingas jaunesnysis ar kitos populiariosios kultūros ikoniškos asmenybės, kūrimas be leidimo buvo apribotas po to, kai teisiniai atstovai ir įpėdiniai pateikė skundus.

Nepaisant to, diskusijos apie generatyvinio vaizdo netinkamą naudojimą ir platformų atsakomybę išliko gyvos. Kai kurių analitikų nuomone, Reguliavimo ir reputacijos klausimai taip pat turėjo įtakos pusiausvyrai. sprendžiant „Sora“ ateitį, ypač tokiose rinkose kaip Europa, kur valdžios institucijos jau kuria konkrečias generatyvinio dirbtinio intelekto ir su juo susijusios rizikos sistemas.

Arši konkurencija ir spaudimas rasti aiškią kryptį

Soros byla nagrinėjama konkurencinėje aplinkoje, kurioje „OpenAI“ nebežaidžia viena ar užima neįveikiamą pozicijąNors bendrovė diversifikavo savo pasiūlą vartotojų produktais, socialiniais tinklais, asistentais, kūrimo įrankiais ir eksperimentiniais projektais, konkurentai, tokie kaip „Anthropic“, daugiausia dėmesio skyrė ribotam skaičiui aiškių verslo sričių, daugiausia programavimo ir įmonių naudojimo modeliams.

Šis siauresnis dėmesys leido antropologinei įgauna populiarumą tarp kūrėjų ir verslo klientųiki tokio lygio, kad kai kuriuose su programavimu susijusiuose segmentuose pagal rinkos dalį pralenkė „OpenAI“. Tuo tarpu „Google“ plečia savo „Gemini“ modelius, pasinaudodama didžiule vartotojų baze, kuri jau kasdien naudojasi jos paieškos sistema ir paslaugomis.

Verslo sektoriuje konsultacinių firmų ir investicinių fondų duomenys rodo, kad „OpenAI“ prarado dalį savo pradinio pranašumoNors „ChatGPT“ dominuoja pagal individualių vartotojų užklausų skaičių, svarbiausias klausimas yra, kiek jų moka už paslaugą ir kiek pelninga išlaikyti tokį srautą konkurencijos akivaizdoje.

Tuo pačiu metu kapitalo rinkos keičia savo toną. Pagrindiniai dirbtinio intelekto įrangos gamintojai, tokie kaip NVIDIA, perspėjo, kad Mega finansavimo etapai be aiškių grąžos reikalavimų netruks amžinai.Šiame kontekste sektoriaus įmonės žino, kad netrukus joms teks pristatyti patikimus produktus su konkrečiais verslo modeliais, jei jos nori išlaikyti būsimų akcininkų pasitikėjimą.

Žvelgiant iš šios perspektyvos, Soros užsidarymas interpretuojamas kaip simptomas, kad „OpenAI“ stengiasi patobulinti savo pasiūlymą ir vengti pernelyg didelio išplitimo.Įmonė greitai iš neginčijamos pradininkės tapo konkurentais, turinčiais labiau orientuotus veiksmų planus. Šiuo atveju, norint atgauti aiškumą ir susitelkimą, reikia mažinti prašmatnių, bet antraeilių projektų skaičių.

Kas dabar nutiks vartotojams, kūrėjams ir ekosistemai?

Savo viešuose pranešimuose „OpenAI“ tvirtino, kad paskelbs išsamius vadovus, kad vartotojai galėtų eksportuoti ir išsaugoti savo vaizdo įrašus prieš visiškai uždarant platformą. Bendrovė teigia, kad ieško būdų, kaip palengvinti turinio perkėlimą į kitus formatus ar paslaugas, nors tikslios datos dar nenurodė.

Tiems, kurie naudojo „Sora“ API savo projektuose – nuo ​​trečiųjų šalių programų iki kūrybinių eksperimentų ar vidinių įrankių – ši naujiena reiškia greitai persvarstyti savo veiksmų planąKūrėjo sąsajos nutraukimas privers kūrėjus ieškoti alternatyvų kituose generatyvinių vaizdo įrašų teikėjuose arba apsieiti be šios funkcijos, jei neras tinkamo pakaitalo.

Europoje ir Ispanijoje tiesioginis poveikis absoliučia apimtimi gali būti mažesnis, nes „Sora“ skverbtis, palyginti su kitomis platformomis, dar buvo pradinėje stadijoje.Tačiau daugybė animacijos studijų, reklamos agentūrų ir skaitmeninių kūrėjų pradėjo eksperimentuoti su programėle kaip idėjų ir prototipų laboratorija, o dabar ši veikla bus nutraukta.

Kai kurie skaitmeninės teisės ekspertai teigia, kad Uždarymas įvyko kaip tik tuo metu, kai Senasis žemynas ruošėsi naujų dirbtinio intelekto taisyklių įsigaliojimui.Algoritminis skaidrumas ir sintetinis turinys. Mažesnis viešas generatyvinio vaizdo matomumas galėtų tam tikru mastu sumažinti reguliavimo institucijų atliekamą kontrolę, bent jau trumpuoju laikotarpiu.

Tuo tarpu „OpenAI“ komandos, dirbusios su „Sora“, bus integruotos į strategiškiausiomis laikomos darbo sritys, pavyzdžiui, „agentų“ sistemos, galinčios veikti vartotojo kompiuteryje ir automatizuoti užduotis, arba robotikos projektai, paremti pažangiomis simuliacijomis. „Sora“ sukauptos techninės žinios, ypač fizinio modeliavimo ir laiko koherencijos srityse, bus pakartotinai panaudotos šiose srityse.

„Sora“ uždarymas simbolizuoja naują „OpenAI“ etapą: Įmonė pereina nuo nuolatinių leidimų fazės ir tam tikro „eksperimentavimo visomis kryptimis“ į etapą, kai kiekviename sprendime svarbesnį vaidmenį atlieka dėmesys, pelningumas ir reguliavimo pagrįstumas. Ar šis koregavimas įvyks laiku, kad būtų galima atsitiesti prieš konkurentus, dar reikia pamatyti, tačiau viskas rodo, kad vartotojų valdomi vaizdo įrašai ateinančiais metais nebebus pagrindinis prekės ženklo akcentas.

Susijęs straipsnis:
Vaizdo plokštės funkcija kompiuteryje