Інфраструктура Digio

Мадэлі AI і GPU

Запусціце агентаў на кіраваных памежных мадэлях сёння або арандуйце ёмістасць графічнага працэсара, разгортвайце ўласныя вагі і накіроўвайце задачы Digio на прыватныя канечныя кропкі ў той жа працоўнай прасторы.

Клод, GPT, блізняты Выбар мадэлі для кожнага агента Арэнда GPU і BYOM
Кіраваныя мадэлі

Мадэлі, даступныя сёння ў Digio

Прызначыць мадэль па змаўчанні для кожнага агента або перавызначыць для кожнай задачы. Выкарыстанне вымяраецца ў Digio Tokens з балансу вашага плана — той жа кашалёк, незалежна ад таго, тэлефануе агент Sonnet, GPT-4o або Gemini Flash.

Антропны Клод

  • Claude Opus 4.7 Флагманскія развагі, доўгі кантэкст, архітэктура і стратэгія працы.
  • Claude Opus 4.6 Opus папярэдняга пакалення для стабільнага якаснага аналізу.
  • Claude Sonnet 4.6 Штодзённы драйвер — кадзіраванне, запіс і шматэтапныя цыклы агентаў.
  • Claude Sonnet 4.5 / 4 Хуткія ўзроўні Sonnet з аператыўным кэшаваннем пры падтрымоўваных нагрузках.
  • Claude Haiku 4.5 Чарнавікі з нізкай затрымкай, класіфікацыя і вялікі аб'ём падзадач.

Перакласці даслоўна: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Найноўшае сямейства GPT-5 для агульных і агентурных нагрузак.
  • GPT-4.1 & GPT-4o Надзейны мультымадальны чат і выкарыстанне інструментаў для вытворчых агентаў.
  • GPT-4o mini Эканамічная маршрутызацыя для зводак і лёгкіх крокаў.
  • o3 / o3-pro / o3-mini / o4-mini Мадэлі, арыентаваныя на развагі для матэматыкі, планавання і праверкі.
  • GPT-5.3 Codex & Codex mini Генерацыя кода, рэфактарынг і навыкі агента з інфармацыяй пра РЭПО.

Перакласці даслоўна: Google Gemini

  • Gemini 2.5 Pro Даследаванне доўгага кантэксту і структураванае выманне.
  • Gemini 2.5 Flash Высокапрадукцыйныя крокі агента з канкурэнтаздольнымі стаўкамі токенаў.
  • Gemini 2.0 Flash Звышхуткія праходы для аналізу, пазначэння і пакетных заданняў.

Адкрытыя і спецыяльныя API

  • DeepSeek Chat & Reasoner Вялікае значэнне для задач у стылі чат і ланцужок думак.
  • Mistral Large Еўрапейскі варыянт для шматмоўных каманд агентаў.
  • Llama 3.3 70B Мадэль адкрытага класа вагі праз API—добра спалучаецца з прыватным графічным працэсарам.
  • Grok 3 Арыентаваная на рэальны час мадэль для навін і агентаў сацыяльнага маніторынгу.
  • Sonar Pro Абгрунтаваныя пошукам адказы для даследчыкаў.
  • Command R+ Працоўныя працэсы карпаратыўнага чата і пошуку, зручныя для RAG.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Выкарыстанне

Як агенты выбіраюць мадэль

Каардынатар можа парэкамендаваць Sonnet супраць Opus супраць больш таннай флэш-мадэлі ў залежнасці ад тыпу задачы. Дасведчаныя карыстальнікі ўсталёўваюць значэнні па змаўчанні для кожнай ролі агента - даследаванне на Sonnet, канчатковы агляд на Opus, масавае пазначэнне на Haiku або Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

Арэнда GPU

Арандуйце GPU і запускайце ўласныя мадэлі

Патрэбна дакладная налада, кантрольна-прапускны пункт з паветраным зазорам або прадказальныя цэны? Дадайце выдзеленую ёмістасць графічнага працэсара ў вашу працоўную прастору Digio, усталюйце стэк абслугоўвання, які вам больш падабаецца, і накіруйце агентаў на вашу прыватную канечную кропку.

Выдзеленыя асобнікі

Пагадзінныя або штомесячныя вузлы GPU (клас A100, H100, L40S), далучаныя да вашага арандатара, ізаляваныя ад іншых кліентаў.

Вашы вагі

Загрузіце safetensors, GGUF або выцягніце з вашага рэестра; запусціце Llama, Mistral, Qwen і спецыяльныя налады.

Стандартная порцыя

vLLM, TGI, Ollama або выявы кантэйнераў, якія вы падтрымліваеце — агенты Digio выклікаюць сумяшчальны з OpenAI базавы URL.

Тая ж аркестроўка

Што трэба рабіць, камандны чат, навыкі і супрацоўніцтва нязменныя - толькі ваш бэкэнд вываду.

Гібрыдная маршрутызацыя

Адпраўляйце канфідэнцыйныя крокі ў прыватны графічны працэсар і выкарыстоўвайце Claude або GPT для агульнадаступных даследаванняў у адным працоўным працэсе.

Элементы кіравання прадпрыемствам

Пірынг VPC, статычны выхад, журналы аўдыту і белыя спісы мадэляў для рэгуляваных каманд.

Прынясіце сваю мадэль

Усталюйце і падключыце нестандартную мадэль

Звычайная ўстаноўка ад нуля да таго, як агенты выклікаюць вашу канечную кропку:

  1. Рэзерваваць GPU

    Выберыце відэапамяць, рэгіён і час бесперабойнай працы (серыйная або пастаянная). Сховішча для гіраў пастаўляецца разам з асобнікам або ўсталёўваецца на ваша вядро.

  2. Разгарніце стэк

    Запусціце вобраз абслугоўвання або SSH, усталюйце драйверы CUDA і загрузіце кантрольныя кропкі. Праверкі спраўнасці пацвярджаюць гатоўнасць мадэлі.

  3. Зарэгістраваць канечную кропку

    Дадайце базавы URL, ключ API і ідэнтыфікатар мадэлі ў наладах працоўнай вобласці. Digio правярае затрымку і фармат токена перад запускам.

  4. Прызначыць агентам

    Выберыце вашу прыватную мадэль у якасці стандартнай для выбраных агентаў; кіраваныя мадэлі Claude/GPT застаюцца даступнымі побач.

Арэнда GPU выстаўляецца асобна ад падпіскі на план Digio. Звяжыцеся з намі для планавання магутнасці, SLA і міграцыі з існуючага кластара вываду.

Этыкетка інтэрфейсу вэб-сайта B2B SaaS. Перавесці на натуральны be: FAQ

Мадэлі і GPU пытанні

Выбар кіраваных API супраць самастойнага размяшчэння высновы на Digio.

Я плачу двойчы — план плюс API?

Ваша падпіска на Digio распаўсюджваецца на інфраструктуру, агентаў і ўключаныя токены Digio. Выкарыстанне кіраванай мадэлі дэбетуе баланс маркераў па фактычных маркерах уводу/вываду. Арэнда GPU - гэта дадатак для машын, якімі вы кіруеце.

Ці могуць розныя агенты выкарыстоўваць розныя мадэлі?

Так, кожны агент можа мець сваё ўласнае па змаўчанні. Задачы і чаты можна перавызначыць для аднаго запуску без змены глабальных значэнняў па змаўчанні.

У чым розніца паміж санэтам і опусам?

Opus настроены на больш жорсткія развагі і больш доўгія паслядоўныя планы; Sonnet хутчэй і танней для паўсядзённых агентаў. Для аб'ёмных падзадач лепш за ўсё падыходзяць мадэлі Haiku і Flash-класа.

Ці магу я запускаць толькі сваю ўласную мадэль і блакіраваць воблачныя API?

Карпаратыўныя працоўныя прасторы могуць абмяжоўваць пастаўшчыкоў выходных мадэляў і накіроўваць увесь трафік агента да канчатковай кропкі GPU. Гібрыдны рэжым з'яўляецца стандартным для большасці каманд.

Якія памеры GPU даступныя?

Прапановы залежаць ад рэгіёна і попыту - звычайна ўзроўні 24-80 ГБ VRAM для мадэляў класа 7B-70B і вузлы з некалькімі графічнымі працэсарамі для вялікіх стэкаў. Мы дапамагаем вызначыць памер відэапамяці памяці на аснове колькасці вашых параметраў і квантавання.

Ці па-ранейшаму спажывае токены Digio прыватнае выкарыстанне GPU?

Аркестроўка (агенты, заданні, сховішча) застаецца ў вашым плане. Высновы аб вашым GPU выстаўляюцца як час GPU; пры жаданні вы можаце вымяраць выкарыстанне ў форме токена для ўнутранага вяртання плацяжоў.

Выберыце кіраваныя мадэлі або вазьміце з сабой графічны працэсар

Пачніце з Claude і GPT сёння, а затым дадайце спецыяльны графічны працэсар, калі будзеце гатовыя размясціць карыстальніцкія вагі - тыя ж агенты, тыя ж задачы, ваша меркаванне.