Kodėl DI kainos krito 97 % per dvejus metus?

Pagrindinė priežastis - atviras kodas. Meta Llama, DeepSeek ir Google Gemma 4 sugriovė oligopoliją, kurioje OpenAI, Google ir Anthropic kontroliavo prieigą prie geriausių modelių. Be to, Mixture of Experts (MoE) architektūra ir Google TurboQuant metodas leido pasiekti tą patį tikslumą su 6× mažesne atmintimi ir 8× didesniu greičiu. DeepSeek V3.2 šiandien kainuoja $0,28 už 1M tokenų vietoj $30, kuriuos prieš dvejus metus kainavo GPT-4 - ir toks lygis pasiekiamas su gerokai pigesne infrastruktūra.

Ar mano įmonei verta diegti DI savo serveriuose vietoje API?

Verta, jei tenkinama bent viena iš trijų sąlygų: (1) dirbate su jautriais duomenimis (teisės, medicinos, finansų), kurių siųsti į trečiųjų šalių serverius negalima; (2) jums reikia milisekundžių atsako greičio realaus laiko taikymams; (3) turite specializuotus duomenų rinkinius, su kuriais norite papildomai apmokyti modelį, kad jis aplenktų universalų komercinį sprendimą jūsų kontekste. Gemma 4 vidutinė versija šiandien veikia ant standartinio verslo nešiojamojo kompiuterio - infrastruktūros barjeras nukrito.

Koks DI modelis šiandien geriausias?

Vieno „geriausio" modelio nėra - yra tinkamas modelis tinkamam tikslui. Kodo rašyme pirmauja Claude Opus 4.6 (1549 Elo). Bendro intelekto testuose GPT-5.4 ir Gemini 3.1 Pro eina petys į petį. Vaizdo ir video analizėje Gemini 3.1 Pro neturi konkurentų. Masiniam, rutininiam darbui DeepSeek V3.2 ar Gemini 2.5 Flash duoda 8× geresnę kainos ir kokybės pusiausvyrą. Mišrus stack'as - pigus modelis rutinai, premium - precizijai - dažnai sumažina DI išlaidas 60-80 % be kokybės praradimo.

DI pinga sparčiau, nei tikitės

★ Svarbiausios įžvalgos

Per dvejus metus DI kainos krito ~97 % - GPT-4 lygio galia kainavo $30 už 1M tokenų, šiandien DeepSeek V3.2 kainuoja $0,28 už tą patį.
Atviras kodas (Llama, DeepSeek, Gemma 4) ir nauji metodai kaip MoE bei Google TurboQuant (atminties poreikis -6×, greitis +8×) griauna lustų monopolį - „Nvidia" akcijos vieną dieną krito 17 %.
Tikrasis lūžis - ne pigesnis API, o tai, kad modeliai veikia tiesiai ant verslo nešiojamųjų ir vidutinių serverių. Tai atrakina teisės, medicinos, finansų sektorius, kuriems debesijos siuntimas buvo neleistinas.
Geopolitiškai - DeepSeek apmoko V4 ant Huawei lustų, apeidamas JAV eksporto apribojimus. Konkurencinis pranašumas pereina nuo aparatūros prie protingesnio modelių projektavimo.
Praktinė rekomendacija - mišrus stack'as (pigus modelis rutinai, premium tikslumui) sumažina DI išlaidas 60-80 %; jei turite jautrių duomenų - lokalus, jūsų duomenimis apmokytas modelis tampa investicija, ne išlaida.

#DI kainos#Atviro kodo DI#DeepSeek#Gemma 4#Lokalus DI#DI strategija

Dažnai užduodami klausimai

Kodėl DI kainos krito 97 % per dvejus metus?: Pagrindinė priežastis - atviras kodas. Meta Llama, DeepSeek ir Google Gemma 4 sugriovė oligopoliją, kurioje OpenAI, Google ir Anthropic kontroliavo prieigą prie geriausių modelių. Be to, Mixture of Experts (MoE) architektūra ir Google TurboQuant metodas leido pasiekti tą patį tikslumą su 6× mažesne atmintimi ir 8× didesniu greičiu. DeepSeek V3.2 šiandien kainuoja $0,28 už 1M tokenų vietoj $30, kuriuos prieš dvejus metus kainavo GPT-4 - ir toks lygis pasiekiamas su gerokai pigesne infrastruktūra.
Ar mano įmonei verta diegti DI savo serveriuose vietoje API?: Verta, jei tenkinama bent viena iš trijų sąlygų: (1) dirbate su jautriais duomenimis (teisės, medicinos, finansų), kurių siųsti į trečiųjų šalių serverius negalima; (2) jums reikia milisekundžių atsako greičio realaus laiko taikymams; (3) turite specializuotus duomenų rinkinius, su kuriais norite papildomai apmokyti modelį, kad jis aplenktų universalų komercinį sprendimą jūsų kontekste. Gemma 4 vidutinė versija šiandien veikia ant standartinio verslo nešiojamojo kompiuterio - infrastruktūros barjeras nukrito.
Koks DI modelis šiandien geriausias?: Vieno „geriausio" modelio nėra - yra tinkamas modelis tinkamam tikslui. Kodo rašyme pirmauja Claude Opus 4.6 (1549 Elo). Bendro intelekto testuose GPT-5.4 ir Gemini 3.1 Pro eina petys į petį. Vaizdo ir video analizėje Gemini 3.1 Pro neturi konkurentų. Masiniam, rutininiam darbui DeepSeek V3.2 ar Gemini 2.5 Flash duoda 8× geresnę kainos ir kokybės pusiausvyrą. Mišrus stack'as - pigus modelis rutinai, premium - precizijai - dažnai sumažina DI išlaidas 60-80 % be kokybės praradimo.

DI pigs. Greičiau nei galvojate. Ir štai kodėl tai keičia viską

Dažnai užduodami klausimai

Daugiau iš tinklaraščio

Paveldėtas kodas ir DI. Gidas, kaip etapais susitvarkyti kodo bazę ir išrankioti kritines klaidas

Kaip valdome kompiuterius iš esmės pasikeis. Taip mano, kaip DI eksperto, spėjimas.

Sugalvojau IT sistemą, kuri Lietuvoje sunaikintų korupciją ir nepotizmą