Passer au contenu principal
Cette page décrit la tarification, les limites d’utilisation et les restrictions de compte applicables à Serverless Inference. Utilisez ces informations pour planifier votre utilisation et éviter des frais imprévus ou des interruptions de service. Consultez-les avant d’envoyer du trafic de Production, en particulier si vous gérez la facturation ou utilisez des niveaux de concurrence élevés.
Si vous avez des questions sur la tarification, les limites ou votre compte auxquelles cette page ne répond pas, contactez l’assistance pour discuter de vos exigences.

Tarification

Pour des informations détaillées sur la tarification des modèles, consultez la tarification de Serverless Inference.

Acheter plus de crédits

Les crédits Serverless Inference sont inclus pendant une durée limitée avec les plans Free, Pro et Academic. La disponibilité de l’offre Enterprise peut varier. Lorsque les crédits sont épuisés :

Niveaux de compte et plafonds d’utilisation par défaut

Chaque niveau de compte comporte un plafond de dépenses par défaut pour vous aider à maîtriser les coûts et à éviter des frais imprévus. W&B exige un prépaiement pour l’accès payant à l’Inférence. Le tableau suivant indique le plafond par défaut pour chaque niveau et explique comment demander une modification. Si vous devez modifier votre plafond, contactez votre responsable de compte ou Support pour ajuster votre limite.
Niveau de comptePlafond par défautComment modifier la limite
Gratuit100 $/moisPassez à Pro ou Enterprise
Pro6 000 $/moisContactez votre responsable de compte ou l’assistance pour un examen manuel
Enterprise700 000 $/anContactez votre responsable de compte ou l’assistance pour un examen manuel

Limites de concurrence

Les limites de concurrence protègent la qualité du service en plafonnant le nombre de requêtes qu’un projet ou un utilisateur peut avoir en cours à un moment donné. Si vous dépassez la limite de concurrence, l’API renvoie une réponse 429 Concurrency limit reached for requests. Pour corriger cette erreur, réduisez le nombre de requêtes simultanées. W&B applique des limites de concurrence par projet W&B et par utilisateur. Par exemple, si vous avez 3 projets dans une équipe, chaque projet dispose de son propre quota de limite de concurrence. Si votre cas d’utilisation nécessite des limites plus élevées, contactez Support pour discuter de vos exigences.

Restrictions géographiques

Le service Inférence n’est disponible que dans les zones géographiques prises en charge. Pour plus d’informations, voir les Conditions d’utilisation.

Étapes suivantes

Maintenant que vous comprenez la tarification, les plafonds et les limites de concurrence, poursuivez la configuration de votre compte :