Presyo ng API
Preview
Mga Pagkumpleto ng Chat/v1/chat/completions
Paghahanap/v1/search
Bayad habang gumagamit
Mga Pagkumpleto ng Chat/v1/chat/completions
Paghahanap/v1/search
Pasadyang Plano
Kailangan ng pasadyang limitasyon ng rate o direktang suporta? Makipag-ugnayan sa koponan ng Magisterium AI para sa:
- Onboarding na sinusuportahan ng Magisterium AI
- Pasadyang limitasyon ng rate
- Pagsingil sa pamamagitan ng buwanang invoice
- Suporta sa pag-prompt
- Suporta sa deployment
Paano kinakalkula ang mga input, system, at output token?
May tatlong bahagi na bumubuo sa pagpepresyo:
- Tanong/prompt ng gumagamit: Ang paunang tanong na ipinadala sa pamamagitan ng API request. Ito ay ibinibilang sa iyong paggamit ng input token.
- Mga proseso ng sistema: Sa pagtanggap ng prompt, gumagamit ang Magisterium AI ng iba't ibang mekanismo upang matalinong mapangasiwaan ang query, kabilang ang klasipikasyon, pananaliksik sa database, at karagdagang mga kasangkapan upang matiyak ang tamang sagot. Ang mga operasyong ito ay gumagamit ng mga system token, at ang dami ng paggamit ay nag-iiba-iba batay sa kumplikasyon ng query at lalim ng kinakailangang sagot.
- Tugon na nilikha ng AI: Ang panghuling output na ibinibigay sa API response, na kinabibilangan ng sagot na nilikha ng AI, ay ibinibilang sa iyong mga output token.
Ang pahina ng paggamit sa API console ay nagbibigay-daan sa iyong subaybayan nang eksakto kung ilang input at output token ang ginagamit ng mga proseso ng sistema, bukod sa mas simpleng mga gastos sa input at output na kaugnay ng input ng gumagamit at pagbuo ng sagot. Ang presyo para sa mga input at output token na ginagamit ng mga proseso ng sistema ay katulad ng karaniwang presyo.
Bisitahin ang Playground upang mag-eksperimento sa paggamit ng mga token.