Det sägs att Deepseek har utvecklat sina senaste AI-modeller till en kostnad av 60 miljoner kronor och utan att använda Nvidias mest avancerade chip. Inget av detta stämmer.

Detta bör du veta om Deepseek

2 februari, 2025

Tidigare i veckan skrev jag en artikel om Deepseek för Affärsvärlden, som varit en av tidningens mest lästa de senaste dagarna.

Intresset för det kinesiska AI-företaget är fortsatt stort, samtidigt som det verkar råda en viss förvirring eller i alla fall oklarhet kring vad dess genombrott innebär. Därför sammanställer jag nedan några punkter att reflektera över vad gäller dess uppmärksammade AI-modeller.

* Deepseek använder sig av mer avancerade chip än företaget påstår. En av de mest uppmärksammade aspekterna av Deepseeks genombrott är uppgifterna om att dess AI-modeller har tränats med Nvidias chip H800 snarare än den marknadsledande modellen H100. Dessutom ska endast 2 048 sådana chips ha använts, jämfört med tiotusentals mer avancerade chip för ledande modeller från OpenAI och Google.

De flesta analytiker är dock överens om att Deepseek har använt chips av modell H100, trots att dessa sedan 2022 är belagda med exportförbud till Kina. Alexandr Wang, vd för Scale AI, bedömer att Deepseek icke desto mindre har tillgång till 50 000 sådana chip som kan ha hittat till Kinas genom smuggling eller försäljning via tredje land.

Vidare har uppgifter framkommit om att Deepseeks moderbolag köpte ett stort antal H100-chip just innan exportförbudet trädde i kraft och sedan byggde en superdator av dessa:

Oavsett superdatorer eller om antalet chip är 50 000 eller färre, så är det uppenbart varför Deepseek inte vill nämna att man använt chip av modell H100. Det skulle nämligen bjuda in till granskningar i syfte att hindra företaget att komma över ledande chips från USA i framtiden.

* Deepseeks AI-modeller var mycket dyrare att ta fram än det belopp som Deepseek uppger. Alla journalister eller analytiker som – utan att vidareutveckla – menar att Deepseek endast lagt 60 miljoner dollar på de program som slagit omvärlden med häpnad bör inte tas på allvar.

En anledning till att summan måste vara högre är att de oerhört dyra chippen av modell H100 som sagt inte kan redovisas öppet eftersom de är förbjudna.

En ännu tydligare anledning är att Deepseek själva uppger att summan 5,5 miljoner dollar – som nu ofta återges i medier – endast omfattar den slutgiltiga och lyckade testkörningen av företagets modell V3.

Summan omfattar inte misslyckade tester dessförinnan, inte den optimering av mindre avancerade chip som man tvingats göra på grund av sanktioner, eller ens lönerna för företagets ingenjörer.

De 5,5 miljoner som ofta återupprepas okritiskt innefattar inte heller kostnaderna för att utveckla AI-modellen V3 som lanserades i december, till R1 som rullades ut i januari och skapat rubriker världen över.

Det står förvisso utom tvivel att V3 och R1 har utvecklats till lägre kostnader än världens ledande AI-modeller. Men just som är fallet med företagets version gällande de chip man har använt, så är inte heller kostnadsbilden lika imponerande som rapporteras.

Detta särskilt då företaget grundades och ägs av hedgefonden High-Flyer som finansierat Deepseeks tekniska infrastruktur, samt att Deepseek av allt att döma har byggt sina modeller på redan existerande amerikanska konkurrenter.

* Deepseek V3 och R1 är framtaget med amerikansk teknologi och från amerikanska AI-modeller. Flera stora namn har beskrivit Deepseeks framgångar som ett ”Sputnik-moment”. Detta har på flera håll lett till slutsatser som att Kina nu har gått ikapp eller till och med passerat USA i utvecklingen av artificiell intelligens, eller rentav inom teknologisk utveckling som helhet.

Men som företaget själva uppger, så har man alltså använt sig av chip från Nvidia för att skapa sina modeller. Dessutom har man av allt att döma även kopierat konkurrenter som OpenAI och Google genom en process som kallas destillering.

Destillering innebär träning med av AI-modeller genom data från större och mer utvecklade motsvarigheter. Detta är visserligen en vanlig företeelse inom industrin, men samtidigt även ett brott mot OpenAIs användarvillkor om detta görs för att skapa en rivaliserande modell.

På många vis påminner beteendet i AI-modellerna från Deepseek om dito från OpenAI, och OpenAI uppger att man nu tittar närmare på uppgifter om otillåten plagiering.

Detta har fått många att – med rätt eller orätt – anklaga OpenAI för dubbelmoral, då företaget självt anklagats för att använda stora mängder information från X eller andra källor i träningen av sin modell ChatGPT. Men det är inte det som är poängen här.

Poängen är att det snarare än en kinesisk revolution handlar om en AI-modell som skapats med hjälp av såväl hårdvara som mjukvara från USA.

Det är förvisso uppenbart att de kinesiska ingenjörerna har lyckats ta fram en imponerande algoritm som kan kompensera för svårigheterna att komma över amerikanska hårdvara eller utländska konkurrenters försprång inom området.

Men snarare än en banbrytande revolution så handlar det alltså återigen om att aktörer från Kina har lyckats förfina någonting som redan existerar i väst.

* USA:s exportförbud av mikrochip för att motverka Kinas teknologiska framsteg fungerar visst. Den kanske allra mest felaktiga tesen som upprepats den senaste veckan är att Deepseeks framgångar bevisar hur USA:s sanktioner för att hålla tillbaka Kinas framgångar inom AI är verkningslösa.

Alla trovärdiga analytiker är ense om att detta är struntprat. Att Deepseek har lyckats utveckla en AI-modell med mindre resurser betyder inte att avancerad hårdvara är onödig.

Det innebär snarare att kinesiska ingenjörer tvingas arbeta hårdare för att – ursäkta svengelskan – krama vatten ur en sten. Restriktioner kring hårdvara må ha sporrat Kinas innovation kring mjukvara, men är i det långa loppet givetvis negativa för kinesiska aktörer.

Syftet med USA:s exportrestriktioner av avancerade mikrochip till Kina har aldrig varit att kasta landet tillbaka till stenåldern. Syftet är att behålla västs teknologiska övertag gentemot Kina inom en rad inklusive spetsteknologier, inklusive artificiell intelligens.

Att detta har lyckats märks av att Deepseek lanserar sin modell senare än amerikanska konkurrenter vars AI-modeller fortfarande är bättre. Det märks även av att Huaweis nya smartphone innehåller samma chip som den senaste modellen för två år sedan.

Ledande experters bedömningar gör gällande att Kinas chipindustri på grund av sanktioner nu ligger sex år på efterkälken och tillverkningen av halvledare 10-15 år efter.

Med obehindrad tillgång till Nvidias senaste chip kunde Kina ha utvecklat en liknande AI-modell tidigare. Deepseek algoritmer hade sannolikt också varit ännu mer kraftfulla med obehindrad tillgång till den allra senaste hårdvaran.

Vidare kommer USA:s sanktioner att få ännu större effekt i framtiden. En av de sista åtgärderna Joe Biden vidtog mot Kina som president var att avsevärt skärpa exportrestriktionerna gällande mikrochip.

Då Nvidia nu rullar ut sitt senaste chip Blackwell blir det ännu svårare för kinesiska aktörer att få tag på dessa än vad det var att få tag på H100, vilket kommer öka det teknologiska avståndet till de amerikanska konkurrenterna ytterligare.

Om inte allt detta vore övertygande nog, så beskrev Deepseeks grundare och vd Liang Wenfeng nyligen själv för premiärminister Li Qiang amerikanska exportsanktioner som en besvärlig flaskhals för kinesiska AI-företag som försöker hämta in sina västerländska konkurrenters försprång.

* Kinesisk propaganda kan spela stor roll för Deepseeks pålitlighet. En AI-modell blir sällan bättre än den information som den matas med. Precis som väntat så bygger delar av Deepseek på information som godkänts av den kinesiska staten.

Otaliga användare har postat uppgifter om hur Deepseek vägrar svara på frågor angående Xi Jinping, massakern vid Himmelska fridens torg eller Tibet:

Möjligtvis är det försvinnande andel av alla användare som nyttjar Deepseek för att ställa frågor om Kinas president eller Himmelska fridens torg. Men denna censur sprider sig bortom de mest uppenbara exemplen och kan i längden påverka förtroendet i alla frågor som har med politik, historia eller nyhetshändelser att göra.

Exempelvis noterar New York Times hur Deepseek på en fråga om Taiwans status återger en inkorrekt fulcitering av USA:s president Jimmy Carter som tidigare publicerats av statliga kinesiska medier. På en fråga om kriget i Ukraina så hävdar Deepseek att ukrainska aktörer iscensatte den fruktansvärda massakern i Bucha.

I ett större perspektiv så innebär detta att den som frågar Deepseek om aktuella nyhetshändelser riskerar få inkorrekta svar som är färgade av det kinesiska kommunistpartiets propaganda:

* Öppen källkod kan gynna Kina politiskt på flera vis. Deepseek har även dragit uppmärksamhet på grund av den öppna källkoden till företagets AI-modeller. Det innebär förenklat att användare kan se hur modellerna tagits fram och även bygga vidare på dem.

Detta kan verka urdumt från ett affärsmässigt perspektiv. Men tillsammans med den billiga avgiften för att använda Deepseek, medför detta flera potentiella fördelar för kinesiska myndigheter.

Till skillnad från ledande amerikanska konkurrenter så har Deepseek – som alltså ägs och finansieras av en kinesisk hedgefond – inga kommersiella krav på sig att gå med vinst. Det innebär i sin tur att användare som inte har råd med program som OpenAI eller länder som saknar resurser för att utveckla egna AI-modeller i många fall kommer vända sig till Deepseek.

Det är enkelt att tänka sig hur andra auktoritära länder som även de omfattas av amerikanska exportförbud kommer utveckla nationella AI-modeller med Deepseek som grund. Eller hur användare som inte behöver ChatGTPs mest avancerade funktioner vill undvika dess relativt dyra avgift och istället söker sig till Deepseek.

Resultatet blir inte bara en framgång för Kina gällande mjuk makt. Det medför även att den statliga kinesiska versionen inom politik, historia och nyheter sprids till omvärlden via Deepseek.

Detta är inte någon konspirationsteori som jag själv funderat ut. Ledande analytiker som Bill Bishop pratar om denna möjlighet som en självklarhet i det senaste avsnittet av Sinocism Podcast:

Sharp China: Happy Lunar New Year and A Few Thoughts on DeepSeek by Bill Bishop

Read on Substack

För att förenkla kan vi dra en jämförelse med elbilar. Tesla gör bättre fordon än BYD, vars bilar dock är bra nog för de flesta förare och framför allt prisvärda. Därför gick BYD nyligen om Tesla som världens största tillverkare av elbilar.

Olika sorts tester kan användas för att bedöma AI-modeller. Många av dem visar att ChatGPT presterar bättre i en bredare kontext och har ett större djup, medan Deepseek håller en liknande standard i en rad områden som de flesta användare efterfrågar.

Bland andra BBC noterar att Deepseek jämfört med ledande amerikanska konkurrenter ”inte är riktigt lika bra – men för de allra flesta så spelar detta inte någon roll”.

Vad som spelar större roll för fler användare är – just som med elbilar – priset, och Deepseek kostar bara en bråkdel att använda jämfört med samma konkurrenter.

Om vi hänger kvar vid jämförelsen med elbilar för en liten stund, så är ett annat orosmoment med Deepseek att dess AI-modeller samlar in stora mängder användardata som sedan lagras i Kina där polis och myndigheter enligt enkelt kan få tillgång till informationen:

Förvisso har vi genom bland annat Tiktok sett att många västerländska användare helt struntar i detta. Men det blir ändå ett problem då inte bara Taiwan utan även västerländska myndigheter som Italien och Australien redan förbjuder eller varnar för Deepseek.

Detta för tankarna från elbilar och sociala medier till telekom. Det kinesiska telekombolaget Huawei lyckades som bekant bygga vidare på utländsk teknologi för att ta fram utrustning som i många fall var mer prisvärd än västerländska konkurrenters.

Sedan förbjöds Huawei i stora delar av den demokratiska världen, men fortsatte ändå expandera i främst utvecklingsländer och auktoritära stater. Kommer vi nu få se en liknande uppdelning med AI-modeller?

Kinamedias nya artiklar direkt till din inkorg

Gör som 775 andra, prenumerera du med.

Lyssna på Kinamedia: Nya kalla kriget

App Icon Apple Podcasts

Translate article