Glossário de erros do Cloud TPU

Neste documento, você encontra um glossário de erros comuns com soluções do serviço Cloud TPU.


Tipo de acelerador inválido

Mensagem de erro

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Solução

Um parâmetro inválido foi fornecido ao comando de criação. Disponibilidade de um acelerador em uma zona depende dos seguintes parâmetros: tipo, as sinalizações preemptible, spot e reserved. As solicitações preemptible, spot, e reserved podem ser alteradas ao incluí-las ou excluí-las no comando kubectl.

Uma TPU criada com a flag reserved vai usar de armazenamento. Incluir as sinalizações spot ou preemptible permitirá que a TPU seja interrompida por TPUs de alta prioridade. Se nenhuma dessas sinalizações for fornecida, a TPU será sob demanda. É não é uma configuração válida para ativar mais de uma dessas sinalizações. Consulte a documentação do comando "create" para mais informações.

Os tipos de aceleradores disponíveis em cada zona podem ser encontrados na documentação das regiões e zonas de TPU ou podem ser que foram consultados usando o comando Accelerator-types list. Altere o comando de criação para usar um deste tipo de acelerador e tente novamente ou entre em contato com o suporte se o problema persistir.

Rede não encontrada

Mensagem de erro

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Solução

A rede xxxx não foi encontrada. Verifique se a rede foi criada e configurados corretamente. Consulte Criar e gerenciar redes VPC para mais informações.

Permissão da conta de serviço negada

Mensagem de erro

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Solução

Esse erro ocorre quando um usuário tenta criar ou listar nós em um projeto sem autorização do IAM. Uma causa provável desse problema é que o serviço da API Cloud TPU não tem o papel necessário para o projeto. A documentação para gerenciar contas de acesso. fornece uma visão geral de como gerenciar o acesso. Siga as etapas em Conceder ou revogar um único papel e dê à conta "service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com" a função do "Agente de serviço da API Cloud TPU" (não se esqueça de substituir PROJECT_NUMBER pelo número do projeto, que pode ser encontrado nas configurações do projeto no console do Google Cloud). Para mais informações sobre agentes de serviço, consulte a documentação de agentes de serviço.

Cota excedida

Mensagem de erro

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Solução

Seu projeto atingiu o limite de cota. Para saber mais sobre como trabalhar com cotas, consulte a documentação de cotas do Cloud. Não confunda isso com a cota de TPU, que controla o uso de pods de TPU.

É possível solicitar um aumento do limite apropriado seguindo as etapas listadas em Solicitar uma cota maior. Na página de cotas, pesquise a cota especificada pelo valor "AAAA" nesta mensagem. Algumas cotas são divididas entre diferentes regiões ou serviços. A mensagem de erro vai indicar qual deles precisa ser aumentado.

O "XXXX" e "AAAA" da mensagem pode ser uma das seguintes:

  • HEALTH_CHECKS – 'Verificações de integridade' cota
  • FIREWALLS - "Regras de firewall" cota
  • NETWORK_ENDPOINT_GROUPS - "Grupos de endpoints de rede" cota para esta região
  • READ_REQUESTS – 'Solicitações de leitura por minuto' cota para o serviço da API Compute Engine
  • OPERATION_READ_REQUESTS - 'Solicitações de leitura de operação por minuto' cota

Geralmente, essa solicitação é processada em dois a três dias úteis. Se a solicitação for urgente, entre em contato com um engenheiro de clientes ou um gerente técnico de contas.