Logo
Ispiši ovu stranicu

Agentski AI drži ključ profitabilnosti velikih jezičnih modela Istaknuto

Agentski AI drži ključ profitabilnosti velikih jezičnih modela

Agentski AI, a ne potrošački chatbotovi, odredit će hoće li se ulaganja od bilijuna dolara u velike jezične modele (LLM-ove) ikada pretvoriti u održivu dobit.

Kako implementacije u poduzećima potiču porast poziva aplikacijskih programskih sučelja (API) i potrošnje tokena, energetska intenzivnost i ekonomika infrastrukture postaju ključne varijable, preoblikujući konkurentsku dinamiku i određujući koji će sudionici stvarati vrijednost u sljedećoj fazi ciklusa ulaganja u AI, navodi GlobalData, vodeća platforma za analitiku i produktivnost.

Vizija koja stoji iza velikih kapitalnih ulaganja jest da se svijet kreće prema stvarnosti izvorno usmjerenoj na AI, u kojoj su generativni AI, agentni AI i strojno učenje integrirani u buduće operacije i procese poduzeća.

GlobalData je izradio financijski model kako bi razumio ulogu koju usvajanje generativnog AI-ja od strane potrošača i poduzeća može imati u stvaranju dovoljnog prihoda i operativne marže za generiranje stvarne dobiti za vlasnike naprednih LLM-ova.

Najnovije izvješće strateške inteligencije GlobalData, “The AI Journey - From Generative to Agentic”, tvrdi da je agentski AI jedini način da industrija umjetne inteligencije postane profitabilna. Iako je potrošačko usvajanje važno jer će generirati prihode od pretplata, upravo naknade za korištenje, prodane poduzećima u obliku tokena, drže ključ profitabilnosti generativnog AI-ja.

Poduzeća će implementirati agentni AI softver koji će s vremenom sve više koristiti LLM-ove za zaključivanje kako bi izvršavao složene, inteligentne automatizirane radne procese. U sljedeće dvije do četiri godine poduzeća će svakodnevno obavljati desetke tisuća API poziva prema LLM-ovima, generirajući milijune, milijarde i na kraju bilijune tokena dnevno. Upravo je takva razina volumena potrebna da bi se ostvarila dobit na bilijunima dolara kapitalnih ulaganja u AI podatkovne centre.

William Rojas, direktor istraživanja tehnologije i strateške inteligencije u GlobalData, ističe: „U središtu analize ovog istraživanja je uloga potrošnje energije u poslovnom modelu generativnog AI-ja. Potrošnja energije mjerena u vatima po upitu izravno je povezana s brojem izračuna (npr. operacije s pomičnim zarezom u sekundi, odnosno FLOPs) koje zahtijevaju LLM-ovi te s brojem generiranih tokena.“

Na primjer, tipično su potrebne dvije FLOP operacije po parametru u LLM-u, a modeli poput ChatGPT-5 i DeepSeek V1 imaju između 1 i 2 bilijuna parametara. To znači da će, čak i uz napredne tehnike za smanjenje računalnog opterećenja, i dalje biti potrebno izračunati približno 100 do 200 milijardi parametara za svaki token.

Kako se industrija kreće prema modelima zaključivanja i kako se povećava kontekstni prozor, broj tokena po upitu povećat će se deset puta ili više. Nije pretjerano to nazvati eksplozijom tokena.

Rojas dodaje: „Kad je riječ o dobitnicima i gubitnicima, pružatelji hardvera i infrastrukture za izgradnju i upravljanje AI podatkovnim centrima dobro su pozicionirani da nastave ubirati financijske koristi od investicijskog buma. No vlasnici LLM modela ne sjede na stroju za stvaranje dobiti; trenutačno gube novac zbog rastućih troškova obrade tokena.“

Poslovni model generativnog AI-ja jedinstven je po tome što je potrošnja energije ključni faktor u određivanju neto marži, jer broj tokena obrađenih po upitu brzo raste i ne očekuje se da će se taj rast uskoro zaustaviti.

Rojas zaključuje: „Industrija poluvodiča radi prekovremeno kako bi poboljšala omjer cijene i performansi grafičkih procesorskih jedinica (GPU-ova), memorije velike propusnosti i mrežnog povezivanja poslužitelja u podatkovnim centrima, ali pomalo podsjeća na grčki mitološki lik Sisyphus, koji bi gurao stijenu do vrha brda samo da se ona ponovno otkotrlja dolje. Kako generativni AI nastavlja povećavati svoje sposobnosti i složenost, potraga za sve boljim omjerom cijene i performansi neće uskoro završiti.

Vezani članci

Zadnji sadržaj od IS

Copyright IT BIZ Crunch © - Powered by VIRO ITS Informacijske tehnologije i savjetovanje. All rights reserved.