Szele Tamás: A DeepSeek-sejtés

2025. február 03. - Szele Tamás

A múlt héten megint a mesterséges intelligencia körül kezdett forogni a világ. Nem annyira, mint amikor nyilvánossá és ingyenessé vált a ChatGPT, de annál azért sokkal inkább, mint amikor Elon Musk bejelentette a saját, korlátok és szabályok nélküli, Grok nevű MI-jét – amely különben most is létezik, működik is, csak nem lett belőle világsztár.

(Képünk illusztráció)

Világsztár most a kínai fejlesztésű DeepSeek-ből lett, hogy megérdemelten vagy érdemtelenül, azt mindenki döntse el magának. Lássuk a Novaja Gazeta nyomán, mit lehet és érdemes tudni erről a mesterséges intelligenciáról.

Januárban új kedvenc jelent meg a chatbotok piacán – a kínai DeepSeek neurális hálózat. Mobilalkalmazása világszerte a legnépszerűbb lett az amerikai App Store-ban, megelőzve a ChatGPT-t. A DeepSeek fejlesztői azt állítják, hogy kevesebb mint hatmillió dollárt költöttek számítási teljesítményre és a modell betanítására (nagyságrendekkel kevesebbet, mint a versenytársaik), és a termék a teszteredmények szerint minden hasonló modellt felülmúl. Korábban úgy vélték, hogy a legjobb mesterséges intelligenciát használó eszközöket csak a vezető amerikai cégek hozhatják létre több milliárd dolláros befektetésekkel.

Január 27-én az amerikai tőzsde a kínai neurális hálózat megjelenésére a részvények értékének 3,1%-os esésével reagált. Az Nvidia papírjai pedig több mint 17 százalékkal zuhantak 593 milliárd dollárra – ez a Wall Street történetének legnagyobb visszaesése. A BBC műsorvezetője, Mark Cieslak szerint a DeepSeek megjelenése csak egy dolgot jelent: az Egyesült Államokat többé nem lehet a neurális hálózatok legnagyobb hatalmának nevezni.

Mi teszi figyelemre méltóvá a DeepSeek-et?

Egészen a közelmúltig ezt a neurális hálózatot csak szűk rajongói körökben ismerték. Az azonos nevű céget 2023-ban alapította a 40 éves kínai milliárdos, Liang Wenfeng, a High Flyer nevű nagy befektetési alap tulajdonosa. Wenfeng még 2021-ben javasolta üzleti partnereinek egy AI-startup ötletét, és több ezer Nvidia grafikus kártyát vásárolt fel, hogy saját neurális hálózatát betanítsa. De elutasították: sokan hittek az AI-boomban, de egy kis cég sikerében annál kevésbé. Úgy gondolták, hogy az áttörést jelentő neurális hálózatot először olyan kínai nagyvállalatok fogják létrehozni, mint a TikTokot birtokló ByteDance.

De 2022-ben az Egyesült Államok megtiltotta az Nvidia és az AMD tajvani vállalatoknak, hogy nagy teljesítményű grafikus kártyákat adjanak el Kínának. Az amerikai tisztviselők attól tartottak, hogy a Kínai Népköztársaság ezeket fejlett katonai technológiák létrehozására használhatja, többek között a mesterséges intelligencia területén. A szankciók miatt Kína nem kapott meg több százmillió dollár értékű fejlett videokártyát, és már a következő évben elkezdett lemaradni az USA mögött a neurális hálózatok versenyében.

Ilyen körülmények között Wenfeng startupja sokkal csábítóbbnak kezdett tűnni. A vállalkozónak sikerült több ezer Nvidia grafikus kártyát felvásárolnia, és 2023 májusában összeállított egy csapatot, amely elkezdett dolgozni a DeepSeek neurális hálózaton. A startupja nem jutott hozzá a legújabb technológiához, így viszonylag olcsó és elavult Nvidia H800-asokkal kellett beérnie, amelyek teljesítménye elmaradt a legújabb H100-asokétól.

A vállalat még az adott év novemberében kiadta a DeepSeek első verzióját, a második változat pedig 2024 májusában jelent meg. A cég azonban csak 2025 januárjában vált igazán híressé, amikor közzétette a nyilvánosság számára a DeepSeek R1 „gondolkodó” modellt, amely képes volt a következtetések kétszeres ellenőrzésére, mélyreható elemzések elvégzésére és logikai láncok létrehozására. A DeepSeek hangsúlyozta, hogy. az R1 betanítása mindössze két hónapba és 5,6 millió dollárba került, annak ellenére, hogy az amerikai vállalatok milliárdokat költenek chatbotjaikra. A modell hat tesztből háromban felülmúlta az élvonalbeli ChatGPT-o1-et komplex matematikai feladatok megoldásában.

A DeepSeek világszerte ingyenesen elérhető, beleértve Oroszországot is, VPN nélkül, böngészőkön, iOS-en és Androidon. A felhasználási limit az alap v3-as modell esetében napi 50 bejegyzés, az „érvelő” R1-es modell esetében pedig 10 bejegyzés. A neurális hálózat nyílt forráskódú: bármely személy vagy vállalat felhasználhatja a DeepSeek fejlesztéseit saját modelljének létrehozásához. Az API ára 95%-kal alacsonyabb, mint a ChatGPT-é.

A DeepSeek-nek megvannak a maga korlátai. A felhasználók áradata miatt a neurális hálózat jelentősen késleltetheti a válaszokat, és időnként az oldal leáll a terhelés miatt. A vállalat már korlátozta a kínai telefonszámmal rendelkező felhasználók regisztrációját, de Google vagy Apple fiókkal be lehet jelentkezni.

A chatbotot a kínai kormány cenzúrázza is. A DeepSeek például nem hajlandó válaszolni arra, hogy mi történt 1989. június 4-én a Tiananmen téren és 2019-ben Hongkongban. Hasonlóképpenmegtagadja a választ a Hszi Csin-ping kínai elnökkel kapcsolatos negatív konnotációjú kérdésekre, és általában nem engedélyezi a Kínai Kommunista Párt kritikáját.

A negatívumok ellenére a DeepSeek 2025 elején a legtöbbet vitatott neurális hálózattá vált. Emiatt Liang Wenfenget meghívták egy találkozóra Li Qianggal, a Kínai Népköztársaság Államtanácsának elnökével. Qiang a technikai innovációt a gazdasági növekedés motorjaként említette, és megvitatta a kínai kormány munkáját a DeepSeek vezetőjével.

Hogyan reagáltak a kínai neurális hálózatra az Egyesült Államokban és a világ többi részén?

A DeepSeek megjelenése sokakat teljesen meglepett. Egyes sajtótermékek még az R1 modell megjelenését is egy szovjet műhold 1957-es fellövéséhez hasonlították, ami után megkezdődött az űrverseny a Szovjetunió és az Egyesült Államok között. Ezúttal azonban az Egyesült Államoknak Kínával kell szembenéznie, amelynek sikerült kijátszania az exportkorlátozásokat.

A DeepSeek megjelenésére az elsők között reagált Donald Trump amerikai elnök. Mint mondta:

„A DeepSeek mesterséges intelligencia közzétételének a kínai vállalat részéről ébresztőként kell hatnia az amerikai iparra, annak tudatosításaként, hogy kötelességünk a versenyre összpontosítani. Úgy látom, hogy egy olcsó modell kiadása nagyon pozitív fejlemény a mesterséges intelligencia szempontjából általában, mert ahelyett, hogy dollármilliárdokat költenénk, kevesebbet is fordíthatunk rá, és remélhetőleg ugyanolyan eredményeket érhetünk el.”

Trump egyik legközelebbi munkatársa, Elon Musk, aki a Tesla, az X közösségi hálózat és a Grok neurális hálózat tulajdonosa, gyanakvóan tekint a DeepSeek-re. Úgy érezte, hogy a kínai cég megtévesztette a nyilvánosságot, és valójában akár 50 ezer grafikus kártyát és rengeteg pénzt is felhasznált a modelljének betanításához.

A milliárdos szkeptikus volt azokkal az állításokkal kapcsolatban is, amelyek szerint viszonylag kis költségvetéssel is létre lehet hozni a mesterséges intelligenciát.

Pavel Durov, a Telegram alapítója szerint a DeepSeek sikeréhez hozzájárult a magas szintű oktatás és a versenyhelyzet Kínában. Példaként említette a kínai diákokat, akik ismétlődően nemzetközi versenyeket nyernek matematikából és programozásból. Durov szerint Kína addig fogja uralni a technológiai ágazatot, amíg az USA nem hajt végre jelentős oktatási reformot.

Satya Nadella, a Microsoft vezérigazgatója „rendkívül lenyűgözőnek” nevezte a DeepSeek-et, és kijelentette, hogy nagyon komolyan veszi a kínai mesterséges intelligencia-ipar eredményeit. Az OpenAI vezetője, Sam Altman szintén elismerően beszélt a DeepSeekről, és lelkesedett az új versenytárs megjelenése miatt.

Január 29-én azonban az OpenAI hozzáállása a DeepSeekhez radikálisan romlott. Az amerikai vállalat azt állította, hogy bizonyítékai vannak arra, hogy a ChatGPT-t egy kínai neurális hálózat betanítására használták. Ezt bizonyítja az is, hogy a DeepSeek a felhasználókkal folytatott beszélgetésekben rendszeresen ChatGPT-ként hivatkozik magára. Trump AI-tanácsadója, David Sachs nyíltan azzal vádolta a DeepSeek-et, hogy ellopta az OpenAI technológiáját.

Nem kizárt, hogy a kínai neurális hálózat munkáját megpróbálják majd korlátozni az Egyesült Államokban. Így január 28-án az amerikai haditengerészet megtiltotta a DeepSeek használatát saját projektjeiben az ország biztonságát fenyegető potenciális kockázatok miatt. A Nemzetbiztonsági Tanács pedig már ellenőrzi a chatbot munkáját. Így kezdődött a TikTok működésének betiltására irányuló kezdeményezés is 2020-ban.

A DeepSeek népszerűsége nemcsak Washingtonban kelt aggodalmakat. Az olasz felügyeleti hatóság, a Garante is bejelentést tett a lehetséges kockázatokról, és a brit kormány is saját vizsgálatot folytat. Félelmeik nem voltak alaptalanok, ugyanis január 29-én a Wiz kutatócég felfedezte a DeepSeek adatbázisát a nyilvános (fekete)piacon. Ez tartalmazta a felhasználók személyes adatait, beleértve a kérések összes előzményeit.

Még korai lenne megmondani, hogy a nyilvánosságra került adatbázissal kapcsolatos botrány hogyan fog végződni a DeepSeek és a Kínán kívüli elérhetősége szempontjából. Mindenesetre a Kínai Népköztársaság számára a DeepSeek globális médiában és mobilplatformokon való dominanciája már most ideológiai győzelemnek tűnik.

Mi változott a mesterséges intelligencia piacán a DeepSeek megjelenésével?

A DeepSeek megjelenése előtt a chatbot-ipar kiszámítható utat követett. Többnyire amerikai vállalatok versengtek a felhasználók figyelméért, dollármilliárdokat költve modelljeik fejlesztésére. A helyzet azonban drámaian megváltozott. A Financial Times szerint a piacvezető AI-modellek már nem a legerősebbek lesznek, mint korábban, hanem a legolcsóbbak. Az ingyenes DeepSeek már most hasonló eredményeket ér el, mint fizetős riválisai. Ez további startupok százait inspirálhatja arra, hogy hatalmas befektetések nélkül próbálkozzanak hasonlóval.

Az iparági változást jelzi, hogy számos amerikai és európai vállalat készül átállni a DeepSeek nyílt forráskódját használó chatbotokra. A Toyota, a Cisco, a Yelp és a Workday is bejelentette, hogy a DeepSeek-et kívánja használni.

Az amerikai vállalatok természetesen nem szándékoznak meghátrálni. Az OpenAI teszteli a ChatGPT-o3 „gondolkodó” modelljét, amelynek felül kell múlnia a DeepSeek R1-et. Emellett a ChatGPT ingyenes változata is futni fog az o3-mini modellen. De hogy a modellek mikor lesznek mindenki számára elérhetőek, még nem tudni.

Elon Musk szintén a DeepSeek-re adott válaszával van elfoglalva. Készül a Grok 3 kiadására, amely egy ingyenes neurális hálózat lesz az X közösségi hálózathoz, mobilalkalmazással. Azt már tudni lehet, hogy a Grok 3 képes lesz akár komplex filozófiai témákról is beszélgetni. Azt azonban még nem lehet megmondani, hogy a modell összehasonlítható lesz-e a DeepSeek R1-gyel.

Lehet, hogy egy idő után a neurális hálózatok versenyében a DeepSeeknek új kihívója érkezik majd az elsőségért – Kínából. Az AliExpress piacteréről ismert Alibaba bemutatta Qwen 2.5 Max modelljét, amely máris felülmúlja a DeepSeek-et a kifinomult számítógépes teszteken. A chatbot világszerte elérhető, beleértve Oroszországot is VPN nélkül. Valószínűleg más kínai vállalatok is bemutatják majd a mesterséges intelligenciájukat – például a Tencent, amely a WeChat és a QZone közösségi hálózatok tulajdonosa. Ennek már van egy külön részlege, amely neurális hálózatokkal foglalkozik.

Emellett a különböző államoknak még el kell dönteniük, hogyan kezeljék a DeepSeek-et. Így január 30-án az olasz szabályozó hatóság megtiltotta a chatbot működését az országban, mivel nem nyújtott átlátható tájékoztatást az állampolgárok adatainak felhasználásáról. Az illetékes ír hatóság is kért már hasonló információkat a gyártó cégtől.

Összefoglalva: a kínai DeepSeek ugyan nem fogja uralni a piacot, de felforgatnia sikerült. Ritka dolog, hogy én bármiben is egyetértsek Elon Muskkal, de abban igazat adok neki, miszerint tökéletes képtelenség, hogy ezt a mesterséges intelligenciát annyiból hozták ki, főleg oktatással együtt, amennyit állítanak róla. Az oktatási folyamat különben is az MI egyik Achilles-sarka: a felhasznált tengernyi információ jelentős része jogdíj-köteles, amit még az OpenAI-sem volt hajlandó kifizetni, ráadásul nagyon hasonlítana a leleményes kínai gondolkodásra, ha David Sachsnak lenne igaza, és a DeepSeek kiképzőjének valami görbe úton a ChatGPT-t alkalmazták volna – holott már annak a kiképzéséért sem fizettek.

Egyszóval, sok a kérdőjel, műszaki szempontból épp annyira, mint jogi téren – és maga az ajándék is túl szép ahhoz, hogy önzetlenül adja Kína a Nyugatnak, főleg most. Valószínűbb, hogy a reagani „csillagháború-elv” újrahasznosítását látjuk. Annak idején, ugyebár, a Szovjetunió gazdasági bukását az okozta, hogy lépést akart tartani az Egyesült Államok állítólagos űrfegyverkezési programjával – amelyből azonban a fortélyos jenkik szinte semmi nem valósítottak meg, ugyanis nem háborúzni akartak, hanem anyagi csődbe juttatni Moszkvát.

Mi van akkor, ha most Peking teszi ugyanezt Washingtonnal? Mi van, ha Trump adminisztrációja vagyonokat fog beleölni egy olyan „olcsó” MI-technológia létrehozásába, amely voltaképpen nem is létezik, csupán ügyes csellel elhitették velünk azt, hogy ilyen is van?

Ezzel szemben mi van, ha tényleg létezik?

Szóval, inkább kérdések bukkannak fel egyelőre a DeepSeek-kel kapcsolatban, mint határozott válaszok.

A válaszokat pedig Peking úgysem fogja egyhamar megadni.

Szele Tamás