Stocurile tehnologice s -au prăbușit. Companii uriașe precum Meta și Nvidia s -au confruntat cu un baraj de întrebări despre viitorul lor. Executivii tehnologici s -au dus pe rețelele de socializare pentru a -și proclama temerile.
Și totul a fost din cauza pornirii de inteligență artificială chineză puțin cunoscută, numită Deepseek.
Deepseek a provocat valuri în întreaga lume luni ca una dintre realizările sale – că a creat un model AI foarte puternic, cu mult mai puțini bani decât mulți experți AI au considerat posibilă – a ridicat o serie de întrebări, inclusiv dacă companiile americane au fost chiar competitive în AI mai.
Deepseek este „Momentul Sputnik al AI”, Marc Andreessen, un capitalist de risc tehnologic, a postat duminică pe rețelele de socializare.
Cum ar putea o companie despre care puțini oameni au auzit despre un astfel de efect?
Ce este Deepseek?
Deepseek este un start-up fondat și deținut de firma chineză de tranzacționare a acțiunilor High-Flyer. Scopul său este de a construi tehnologii AI de -a lungul liniilor Chatgpt Chatbot de la OpenAI sau Gemini Google. Până în 2021, Deepseek a achiziționat mii de cipuri de calculator de la Chipmaker Nvidia din SUA, care sunt o parte fundamentală a oricărui efort de a crea sisteme AI puternice.
În China, start-up-ul este cunoscut pentru apucarea cercetătorilor AI tineri și talentați de la universități de top, promițând salarii mari și o oportunitate de a lucra la proiecte de cercetare de ultimă oră. Atât fluturașul înalt, cât și Deepseek sunt conduse de Liang Wenfeng, un antreprenor chinez.
În ultimii ani, Deepseek a lansat mai multe modele de limbaj mare, care este genul de tehnologie care stă la baza chatbotilor precum Chatgpt și Gemini. Pe 10 ianuarie, a lansat prima sa aplicație Chatbot gratuită, care se bazează pe un nou model numit Deepseek-V3.
De ce a reacționat acum piața bursieră?
Când Deepseek și-a prezentat modelul Deepseek-V3 a doua zi după Crăciun, s-a potrivit cu abilitățile celor mai bune chatbots de la companii americane precum OpenAI și Google. Numai asta ar fi fost impresionant.
Dar echipa din spatele noului sistem a dezvăluit și un pas mai mare înainte. Într -o lucrare de cercetare care explică modul în care a construit tehnologia, Deepseek a spus că a folosit doar o fracțiune din jetoanele de calculator pe care companiile de lideri AI s -au bazat pentru a -și antrena sistemele.
Companiile de top din lume își antrenează de obicei chatbot -urile cu supercomputere care folosesc până la 16.000 de jetoane sau mai mult. Inginerii Deepseek au spus că au nevoie de doar aproximativ 2.000 de chipsuri Nvidia.
De ce este important?
De la sfârșitul anului 2022, când OpenAI a pornit boom -ul AI, noțiunea predominantă a fost că cele mai puternice sisteme AI nu ar putea fi construite fără a investi miliarde de dolari în cipuri AI specializate. Aceasta ar însemna că doar cele mai mari companii de tehnologie – cum ar fi Microsoft, Google și Meta, toate cu sediul în Statele Unite – și -ar putea permite să construiască tehnologii de frunte.
(The New York Times a dat în judecată OpenAI și partenerul său, Microsoft, susținând încălcarea drepturilor de autor a conținutului de știri legate de sistemele AI. Cele două companii de tehnologie au negat pretențiile procesului.)
Dar inginerii Deepseek au spus că au nevoie de doar aproximativ 6 milioane de dolari în putere de calcul brută pentru a -și antrena noul sistem. Aceasta a fost de aproximativ 10 ori mai mică decât ceea ce Meta a cheltuit construind cea mai recentă tehnologie AI.
Cum și -a făcut Deepseek tehnologia cu mai puține jetoane AI?
Inginerii AI de top din Statele Unite spun că hârtia de cercetare a Deepseek a prezentat modalități inteligente și impresionante de a construi tehnologie AI cu mai puține jetoane.
Pe scurt, inginerii startup -ului au demonstrat un mod mai eficient de a analiza datele folosind cipurile. Conducerea sistemelor AI își învață abilitățile, identificând tiparele în cantități uriașe de date, inclusiv text, imagini și sunete. Deepseek a descris o modalitate de a răspândi această analiză a datelor pe mai multe modele de AI specializate – ceea ce cercetătorii numesc o metodă „amestec de experți” – minimizând timpul pierdut prin mutarea datelor din loc în loc.
Alții au folosit metode similare înainte, dar mutarea informațiilor între modele au avut tendința de a reduce eficiența. Deepseek a făcut acest lucru într -un mod care i -a permis să folosească mai puțină putere de calcul.
„A devenit foarte clar că alte companii, nu doar cineva ca OpenAI, pot construi aceste tipuri de sisteme”, a spus Tim Dettmers, cercetător la Institutul Allen pentru Intelligence Artificială din Seattle și profesor de informatică la Carnegie Mellon University Who Who Who Who Who Who Who Who Who Who Co activor activ specializată în construirea de sisteme AI eficiente. „Deepseek a folosit metode pe care oricine le poate duplica.”
Lucrarea de cercetare a Deepseek a ridicat întrebări dacă companiile mari din SUA ar putea menține un avans semnificativ în AI Mulți experți consideră că tehnologia AI va deveni o marfă, multe companii vândând mult același produs.
Tehnologia Deepseek este la fel de bună ca sistemele de la OpenAI și Google?
Deepseek-V3 poate răspunde la întrebări, rezolva problemele logice și își poate scrie propriile programe de calculator la fel de eficient ca orice deja pe piață, conform testelor de referință standard.
Chiar înainte ca Deepseek să-și lanseze tehnologia, Openai a dezvăluit un nou sistem, numit Openai O3, care părea mai puternic decât Deepseek-V3. Dar Openai nu a lansat acest sistem către publicul mai larg.
Openai O3 a fost conceput pentru a „raționa” prin probleme care implică matematică, știință și programare computerizată. Mulți experți au subliniat că Deepseek nu a construit un model de raționament de -a lungul acestor linii, care este considerat ca viitorul AI
Apoi, pe 20 ianuarie, Deepseek și -a lansat propriul model de raționament numit Deepseek R1, și, de asemenea, i -a impresionat pe experți. În cele din urmă, acest lucru ne -a trimis investitori și alții într -o panică la sfârșitul săptămânii trecute și în weekend, în timp ce și -au dat seama de importanța noii tehnologii Deepseek.
Giganții tehnologici americani construiesc centre de date cu jetoane de AI specializate. Încă mai contează, având în vedere ce a făcut Deepseek?
Da, încă contează.
Un număr mare de cipuri AI poate ajuta în continuare companiile în multe feluri. Cu mai multe jetoane, pot rula mai multe experimente, deoarece explorează noi modalități de a construi AI cu alte cuvinte, mai multe cipuri pot oferi companiilor un avantaj tehnic și competitiv.
Experții au spus că mai multe cipuri vor fi necesare pentru a opera noua rasă de modele de „raționament”. Acestea necesită mai multă putere de calcul atunci când oamenii și întreprinderile le folosesc.
Statele Unite nu au limitat numărul de jetoane NVIDIA vândute în China?
Da. Pentru a menține conducerea SUA în cursa AI globală, administrația Biden a pus în aplicare reguli care limitează numărul de jetoane puternice care ar putea fi vândute Chinei și altor rivali.
Dar performanța impresionantă a modelului Deepseek a ridicat întrebări cu privire la consecințele nedorite ale restricțiilor comerciale ale guvernului american. Controalele au obligat cercetătorii din China să devină creativi cu o gamă largă de instrumente disponibile liber pe internet.
Unii experți continuă să se certe în favoarea restricțiilor comerciale din SUA, spunând că au fost puse în aplicare recent și că vor avea un efect mai mare asupra abilităților Chinei de a crea AI pe parcursul anilor.
Tehnologia Deepseek înseamnă că China este acum în fața Statelor Unite în AI?
Nu. Lumea nu a văzut încă modelul O3 al lui Openai, iar performanța sa la testele de referință standard au fost mai impresionante decât orice altceva de pe piață. Experții sunt însă îngrijorați de faptul că China sări înainte pe sistemele AI open-source.
Ce este exact AI-open-source?
La fel ca multe alte companii, Deepseek și -a „deschis” cel mai recent sistem AI, ceea ce înseamnă că a împărtășit codul computerizat care stă la baza altor întreprinderi și cercetători. Acest lucru permite celorlalți să -și construiască și să distribuie propriile produse folosind aceleași tehnologii.
Aceasta este o parte din motivul pentru care Deepseek, iar alții din China au reușit să construiască sisteme AI competitive atât de rapid și ieftin.
În lumea AI, open source a adunat pentru prima dată Steam în 2023, când Meta a împărtășit liber un sistem AI numit Llama. La vremea respectivă, mulți au presupus că ecosistemul open-source ar înflori doar dacă companii precum meta-firme uriașe cu centre de date uriașe umplute cu cipuri specializate-ar continua să-și deschidă tehnologiile.
Dar Deepseek și alții au arătat că acest ecosistem poate prospera în moduri care se extind dincolo de giganții tehnologici americani.
Ce este important în acest sens?
Mulți experți au susținut că marile companii americane nu ar trebui să -și deschidă tehnologiile, deoarece ar putea fi folosite pentru a răspândi dezinformarea sau pentru a provoca alte daune grave. Unii parlamentari americani au explorat posibilitatea prevenirii sau accelerării practicii.
Dar alți experți au susținut că, dacă autoritățile de reglementare înăbușesc progresul tehnologiei open-source în Statele Unite, China va câștiga un avantaj semnificativ. Dacă cele mai bune tehnologii open-source provin din China, susțin acești experți, cercetătorii și companiile americane își vor construi sistemele în vârful acestor tehnologii.
Pe termen lung, acest lucru ar putea pune China în centrul cercetării și dezvoltării AI, ceea ce ar putea accelera și mai mult efortul de a construi o gamă largă de tehnologii AI, inclusiv arme autonome și alte sisteme militare.