През последните месеци в Силициевата долина се разпространява нова мания. Технологичните специалисти, които искат да покажат, че са в челните редици на използването на изкуствен интелект, започват да се съревновават кой ще изразходва повече „токени“ – така се наричат единиците текст, обработвани от AI моделите. Между януари и март броят на обработваните токени седмично през платформата OpenRouter е нараснал четирикратно, пише The Economist.
С нарастването на търсенето индустрията все по-трудно успява да му отговори. През март Anthropic – компания, чиито модели се използват широко от бизнеса – започва да ограничава достъпа до услугите си в пикови моменти и да променя абонаментните си планове, вероятно с цел да намали натоварването. През април услугите ѝ дори изпитват прекъсвания, средно по около 30 минути на ден. Подобни проблеми се наблюдават и при други компании. През март OpenAI временно спира инструмента си за генериране на видео Sora, за да насочи ограничените си ресурси към по-печеливши дейности. На 20 април GitHub, собственост на Microsoft, също спира да приема нови абонаменти за своя програмиращ асистент.
В отговор индустрията инвестира огромни средства в нова инфраструктура. На 20 април Anthropic обявява партньорство за 100 милиарда долара с Amazon, което ще осигури до 5 гигавата сървърен капацитет. Няколко дни по-късно става ясно, че Google също ще вложи 40 милиарда долара, за да подпомогне нуждите от изчислителна мощ. На 27 април OpenAI съобщава, че преразглежда партньорството си с Microsoft, за да може да предлага продуктите си чрез различни облачни доставчици и така по-лесно да осигурява необходимите ресурси.
Петте технологични гиганта – Alphabet, Amazon, Meta, Microsoft и Oracle – влагат стотици милиарди долари в центрове за данни. Само Alphabet, Amazon и Oracle са набрали над 100 милиарда долара дълг тази година. За да освободят средства, Meta обяви съкращения на около 10% от служителите си, а Microsoft предлага доброволно напускане на около 7% от персонала.
Въпреки това увеличаването на капацитета става все по-трудно. В САЩ и други държави расте политическата съпротива срещу изграждането на центрове за данни. Освен това производителите на хардуер – от чипове до охлаждащи системи – не инвестират достатъчно, за да отговорят на търсенето. Така недостигът на капацитет вероятно ще се задълбочи.
Политическият фактор също играе роля. В щата Мейн например законодатели подкрепиха проект за забрана на нови центрове за данни над определен капацитет до 2027 г. Макар мярката впоследствие да беше блокирана, подобни инициативи се обсъждат и в други щати. Само през миналата година проекти на стойност 156 милиарда долара са били забавени или спрени заради местна съпротива. Подобни реакции се наблюдават и в страни като Ирландия и Бразилия, най-вече заради опасения от нарастващи разходи за електроенергия.
Дори когато строителството е разрешено, компаниите срещат трудности да осигурят необходимия хардуер. Според анализатори няма достатъчно чипове, за да запълнят новите центрове за данни. Графичните процесори на Nvidia, които осигуряват над две трети от изчислителната мощ за AI, поскъпват значително. По-старият модел H100 е поскъпнал с около 30% заради недостига на по-нови версии.
Недостиг има и при паметите, особено високоскоростната памет (HBM), от която AI системите силно зависят. Основните производители – SK Hynix, Samsung и Micron – вече са разпродали голяма част от капацитета си за 2026 г. Очаква се търсенето да надвишава предлагането поне още три години.
Недостигът обхваща и процесорите (CPU), които са ключови за по-сложни AI системи. Това дори дава нов тласък на Intel, чиято пазарна стойност се е удвоила за шест месеца.
Основният проблем е, че компаниите по веригата на доставки изостават в инвестициите. Докато големите технологични корпорации увеличават разходите си почти тройно, доставчиците на хардуер ги повишават значително по-скромно.
Пример за това е TSMC – най-големият производител на чипове по поръчка. Най-модерните му фабрики вече работят на максимален капацитет, а изграждането на нови отнема години. Въпреки планираното увеличение на инвестициите, делът им спрямо приходите намалява.
Това разочарова клиентите. Ръководителят на OpenAI Сам Алтман призовава компанията да разшири капацитета си по-бързо. Илон Мъск пък обяви планове за гигантска фабрика за чипове, макар че реализацията ѝ ще отнеме години и ще се сблъска със същите ограничения.
Всичко това показва сериозен дисбаланс – развитието на софтуера напредва бързо, но разширяването на производствените и инфраструктурните възможности изисква значително повече време. Производителите се опасяват да не инвестират прекалено и да останат с неизползван капацитет. Затова и сегашната „мания по токените“ може да се окаже временна, ако ограниченията в инфраструктурата продължат да се задълбочават.