Glosario de errores de Cloud TPU
En este documento, se proporciona un glosario de errores comunes relacionados con soluciones del servicio de Cloud TPU.
El tipo de acelerador no es válido
Mensaje de error
generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and reserved (false) is not available in zone us-central1-a, please contact support.
Solución
Se proporcionó un parámetro no válido al comando create. La disponibilidad
de un acelerador en una zona depende de los siguientes parámetros: el tipo, el
las marcas preemptible
, spot
y reserved
. La preemptible
, spot
,
y reserved
se pueden cambiar si se incluyen o excluyen en el archivo
kubectl.
Una TPU creada con la marca reserved
usará las reservas
la capacidad de procesamiento. Incluir las marcas spot
o preemptible
permitirá que la TPU sea interrumpida por
a las TPU de mayor prioridad. Si no se proporciona ninguna de estas marcas, la TPU será a pedido. Sí
No es una configuración válida para habilitar más de una de estas marcas. Consulta la
documentación del comando create para obtener más información.
Los tipos de aceleradores disponibles en cada zona se pueden encontrar en la documentación sobre regiones y zonas de TPU o pueden se consultan con el comando acelerador-types list. Cambia el comando create para usar uno de estos tipos de aceleradores y vuelve a intentarlo, o comunícate con el equipo de asistencia si el problema persiste.
No se encontró la red
Mensaje de error
Cloud TPU received a bad request. The field "Network" cannot be "xxxx": requested resource not found
Solución
No se encontró la red xxxx. Asegúrate de que se haya creado la red y están configurados correctamente. Consulta Crea y administra redes de VPC para obtener más información.
Permiso de cuenta de servicio denegado
Mensaje de error
generic::permission_denied: Cloud TPU got permissions denied when trying to access the customer project. Make sure that the IAM account 'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts
Solución
Este error se produce cuando un usuario intenta crear o enumerar nodos en un proyecto.
sin la autorización de IAM. Una causa probable de este problema es que el servicio API de Cloud TPU
no tiene el rol necesario para el proyecto. La documentación para administrar cuentas de acceso
ofrece una descripción general de cómo administrar el acceso. Sigue los pasos para Otorgar o revocar un solo rol.
y asigna a la cuenta “service-PROJECT_NUMBER
@cloud-tpu.iam.gserviceaccount.com” el rol del “Agente de servicio de la API de Cloud TPU” (asegúrate de reemplazar PROJECT_NUMBER
)
con el número de tu proyecto, que puedes encontrar en la configuración del proyecto en la consola de Google Cloud). Para ver más
para obtener información sobre los agentes de servicio, consulta la documentación de agentes de servicio.
Se superó la cuota
Mensaje de error
You have reached XXXX limit. Please request an increase for the 'YYYY' quota for Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.
Solución
Tu proyecto alcanzó el límite de una cuota. Si quieres obtener más información para trabajar con cuotas, consulta la documentación de Cloud Quotas. Esto no debe confundirse con la cuota de TPU, que rige el uso de los pods de TPU.
Para solicitar un aumento del límite adecuado, sigue los pasos que se indican en Solicita una cuota mayor. En la página de cuotas, puedes buscar la cuota que se especifica mediante el “AAAA” parte de este mensaje. Algunas cuotas se dividen entre diferentes regiones o servicios. El mensaje de error indicará cuál se debe aumentar.
El modelo "XXXX" y "YYYY" del mensaje puede ser una de las siguientes:
- HEALTH_CHECKS - "Verificaciones de estado" cuota
- FIREWALLS - “Reglas de firewall” cuota
- NETWORK_ENDPOINT_GROUPS - "Grupos de extremos de red" cuota para esta región
- READ_REQUESTS: Solicitudes de lectura por minuto cuota para el servicio de la API de Compute Engine
- OPERATION_READ_REQUESTS: “Solicitudes de lectura de operaciones por minuto” cuota
Por lo general, esta solicitud se procesa en un plazo de 2 a 3 días hábiles. Si la solicitud es urgente, comunícate con un ingeniero de Atención al cliente o con un administrador técnico de cuentas.