O que é um token?
Você pode pensar em tokens como partes de palavras usadas para processamento de linguagem natural. Para texto em inglês, 1 token tem aproximadamente 4 caracteres ou 0,75 palavras. Como ponto de referência, as obras coletadas de Shakespeare têm cerca de 900.000 palavras ou 1,2 milhão de fichas.
Qual modelo devo usar?
Enquanto Davinci (text-davinci-003) é geralmente o modelo mais capaz, os outros modelos podem executar certas tarefas extremamente bem e, em alguns casos, significativamente mais rápido. Eles também têm vantagens de custo. Por exemplo, Curie pode executar muitas das mesmas tarefas que Davinci, mas mais rápido e por 1/10 do custo. Incentivamos os desenvolvedores a experimentar para encontrar o modelo mais eficiente para seu aplicativo. Visite nossa documentação para uma comparação de modelo mais detalhada .
Como saberei quantos tokens usei a cada mês?
Faça login em sua conta para visualizar seu painel de controle de uso . Esta página mostrará quantos tokens você usou durante os ciclos de cobrança atuais e passados.
Como posso administrar meus gastos?
Você pode configurar um limite rígido de uso em suas configurações de cobrança, após o qual deixaremos de atender às suas solicitações. Você também pode configurar um limite flexível para receber um alerta por e-mail assim que ultrapassar um determinado limite de uso. Pode haver um atraso na aplicação do limite e você é responsável por qualquer excesso incorrido. Recomendamos verificar seu painel de controle de uso regularmente para monitorar seus gastos.
A API do ChatGPT está incluída na assinatura do ChatGPT Plus?
Não, a assinatura ChatGPT API e ChatGPT Plus são cobradas separadamente. A API tem seu próprio preço. A assinatura do ChatGPT Plus cobre o uso apenas no chat e custa US$ 20/mês.
O uso do Playground conta na minha cota?
Sim, tratamos o uso do Playground da mesma forma que o uso normal da API.
Como o preço é calculado para as conclusões?
As solicitações de conclusão são cobradas com base no número de tokens enviados em seu prompt mais o número de tokens na(s) conclusão(ões) retornada(s) pela API.
Os parâmetros best_of e n também podem afetar os custos. Como esses parâmetros geram várias conclusões por prompt, eles agem como multiplicadores no número de tokens retornados.
Sua solicitação pode usar até num_tokens(prompt) + max_tokens * max(n, best_of) tokens, que serão cobrados de acordo com as taxas por mecanismo descritas na parte superior desta página.
No caso mais simples, se seu prompt contiver 10 tokens e você solicitar um único preenchimento de 90 tokens do mecanismo davinci, sua solicitação usará 100 tokens e custará US$ 0,002.
Você pode limitar os custos reduzindo o comprimento do prompt ou o comprimento máximo da resposta, limitando o uso de best_of/n, adicionando sequências de parada apropriadas ou usando mecanismos com custos por token mais baixos.
Como o preço é calculado para o ajuste fino?
Existem dois componentes para ajustar os preços: treinamento e uso.
Ao treinar um modelo ajustado, o total de tokens usados será cobrado de acordo com nossas taxas de treinamento . Observe que o número de tokens de treinamento depende do número de tokens em seu conjunto de dados de treinamento e do número escolhido de épocas de treinamento . O número padrão de épocas é 4.
(Tokens em seu arquivo de treinamento * Número de épocas de treinamento) = Total de tokens de treinamento
Depois de ajustar um modelo, você será cobrado apenas pelos tokens que usar. As solicitações enviadas para modelos ajustados são cobradas de acordo com nossas taxas de uso.
Existe um SLA nos vários modelos?
Em breve publicaremos um SLA. Enquanto isso, você pode visitar nossa página de status para monitorar a disponibilidade do serviço e visualizar o histórico de tempo de atividade. Se sua empresa ou aplicação possui requisitos específicos, entre em contato com nossa equipe de vendas .
A API está disponível no Microsoft Azure?
Sim. Os clientes do Azure podem acessar a API OpenAI no Azure com conformidade, suporte regional e segurança de nível empresarial que o Azure oferece.