Cloud TPU-Fehlerglossar

Dieses Dokument enthält ein Glossar für häufige Fehler mit Lösungen aus dem Cloud TPU-Dienst.


Ungültiger Beschleunigertyp

Fehlermeldung

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Lösung

Für den Befehl „create“ wurde ein ungültiger Parameter angegeben. Die Verfügbarkeit eines Beschleunigers in einer Zone hängt von folgenden Parametern ab: Typ, Die Flags preemptible, spot und reserved. preemptible, spot und reserved können geändert werden, indem sie in der Erstellung .

Eine TPU, die mit dem Flag reserved erstellt wurde, verwendet reservierte Kapazität. Wenn Sie das Flag spot oder preemptible einfügen, kann die TPU durch TPUs mit höherer Priorität. Wenn keines dieser Flags angegeben ist, ist die TPU On-Demand. Es ist Keine gültige Konfiguration zum Aktivieren mehrerer dieser Flags. Weitere Informationen finden Sie in der Weitere Informationen finden Sie in der Dokumentation zum Erstellen des Befehls.

Die in den einzelnen Zonen verfügbaren Beschleunigertypen finden Sie in der Dokumentation zu TPU-Regionen und -Zonen. Alternativ können sie Sie wird mit dem Befehl accelerator-types list abgefragt. Ändern Sie den Befehl „create“, um einen zu verwenden. Beschleunigertypen aus und versuchen Sie es noch einmal. Sollte das Problem weiterhin bestehen, wenden Sie sich bitte an den Support.

Netzwerk nicht gefunden

Fehlermeldung

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Lösung

Netzwerk xxxx wurde nicht gefunden. Prüfen, ob das Netzwerk erstellt wurde und ordnungsgemäß einrichten können. Weitere Informationen finden Sie unter VPC-Netzwerke erstellen und verwalten.

Dienstkontoberechtigung verweigert

Fehlermeldung

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Lösung

Dieser Fehler tritt auf, wenn ein Nutzer versucht, Knoten in einem Projekt zu erstellen oder aufzulisten. ohne IAM-Autorisierung. Eine wahrscheinliche Ursache für dieses Problem ist, dass der Cloud TPU API-Dienst Konto hat nicht die erforderliche Rolle für das Projekt. Die Dokumentation zum Verwalten von Zugriffskonten gibt einen Überblick über die Zugriffsverwaltung. Führen Sie die Schritte unter Einzelne Rolle zuweisen oder widerrufen aus. und geben Sie dem Konto "service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com" die Rolle „Cloud TPU API-Dienst-Agent“ (Ersetzen Sie PROJECT_NUMBER durch Ihre Projektnummer. Diese finden Sie in den Projekteinstellungen in der Google Cloud Console. Weitere Informationen Informationen zu Dienst-Agents finden Sie in der Dokumentation zu Dienst-Agents.

Kontingent überschritten

Fehlermeldung

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Lösung

Ihr Projekt hat ein Kontingentlimit erreicht. Weitere Informationen zur Verwendung von Kontingenten finden Sie in der Dokumentation zu Cloud-Kontingenten. Dies sollte nicht mit dem TPU-Kontingent verwechselt werden, das die Nutzung von TPU-Pods regelt.

Sie können eine Erhöhung des Limits beantragen. Folgen Sie dazu der Anleitung unter Höheres Kontingent anfordern. Auf der Seite „Kontingente“ können Sie nach dem Kontingent suchen, das durch das Präfix „JJJJ“ angegeben wird. Teil dieser Nachricht. Einige Kontingente sind auf verschiedene Regionen oder Dienste aufgeteilt. In der Fehlermeldung wird angegeben, welche davon erhöht werden muss.

Der XXXX und 'JJJJ' Teile der Nachricht können einer der folgenden sein:

  • HEALTH_CHECKS – Systemdiagnosen Kontingent
  • FIREWALLS – "Firewallregeln" Kontingent
  • NETWORK_ENDPOINT_GROUPS – "Netzwerk-Endpunktgruppen" Kontingent für diese Region
  • READ_REQUESTS – "Leseanfragen pro Minute" Kontingent für den Compute Engine API-Dienst
  • OPERATION_READ_REQUESTS – "Leseanfragen für Vorgänge pro Minute" Kontingent

Diese Anfrage wird in der Regel innerhalb von zwei bis drei Werktagen bearbeitet. Wenn die Anfrage dringend ist, wenden Sie sich an einen Customer Engineer oder Technical Account Manager.