Vad kostar företags-AI egentligen?
Kort svar: budgetera för systemet, inte API-anropet. Demon bevisar uppgiften en gång; utvärderingar, skyddsräcken, datapipelines och övervakning är de andra 90 procenten, och inferenskostnaden växer med användningen.
En demo bevisar uppgiften en gång. Praktiker räknar det som ungefär 10 procent av jobbet; säkerhet, data, utvärderingar och tillförlitlighet är de andra 90 (Thoughtworks, 2026).
Modellicensen är den billiga delen. Kostnaden är allt runt omkring, och den skalar inte linjärt.
// kostnadskurvan
relativ kostnad · illustrativ
- Demo + pilot
- Den billiga delen. En demo bevisar att modellen klarar uppgiften en gång. Det är den del alla visar dig.
- Produktion
- Där kostnaden exploderar. Utvärderingar, skyddsräcken, övervakning, datapipelines, säkerhet, mänsklig tillsyn. Delen ingen säljer.
- Skala
- Där det ackumuleras. Inferens är en löpande kostnad, och en agent som loopar eller anropar verktyg drar långt mer än en enda prompt.
›transkript
- What enterprise AI actually costs.
- The demo is about 10% of the work; safety, data and evals are the other 90 (Thoughtworks).
- The licence is cheap. The system is not.
- Run the free, interactive course at heimlandr.io/ai-reality-map.
// fördjupningen
En demo bevisar att modellen klarar uppgiften en gång. Produktion betyder utvärderingar, skyddsräcken, övervakning, datapipelines, säkerhet och mänsklig tillsyn, de oglamorösa 90 procenten. Sedan ackumuleras inferensen: en agent i flera steg skickar om hela sin kontext vid varje anrop, så en uppgift kan dra ungefär 10 till 100 gånger fler tokens än en enda chattomgång (Gartner säger 5 till 30 gånger per uppgift). Styckpriset faller, men Bain fann att när tokenpriset halverades växte användningen omkring 450 procent, så totalnotan stiger ändå. Budgetera för systemet, inte API-anropet. Gartner förutspådde 2024 att minst 30 procent av generativa AI-projekt skulle överges efter proof of concept vid slutet av 2025, och nämnde eskalerande kostnad som ett skäl.
// kapitlets frågor
Vad kostar ett skräddarsytt AI-system?
Det beror på arbetsflödet, men formen är konstant: modellicensen är en liten rad, och det mesta av budgeten går till integration, utvärderingar, datastädning och drift. Därför scopar vi till ett arbetsflöde först, och därför är varje offert utan de raderna ofullständig.
Varför stiger AI-kostnaden när tokenpriset faller?
För att användningen växer snabbare än priset faller. Bain fann att användningen växte omkring 450 procent när tokenpriset halverades, och agenter i flera steg skickar om hela sin kontext vid varje anrop, så en uppgift kan dra 10 till 100 gånger fler tokens än en enda chattfråga.
Vad är den största dolda kostnaden i AI-projekt?
Produktionsklippan: utvärderingar, skyddsräcken, övervakning, säkerhet och mänsklig tillsyn. Det är ungefär 90 procent av jobbet och finns nästan aldrig med i demon eller den första offerten.
Varje siffra i det här kapitlet har en källa. Hela källistan finns på huvudkartan. Öppna kartan
Det här är ett kapitel av tio. Hela kursen är gratis.
Hela kartan har de interaktiva verktygen, ljudutgåvan på åtta minuter, live-lagret och alla källor. Och vill du köra den mot din egen verklighet är det samtalet också gratis.