Diagnosi degli errori di implementazione di Hugging Face Token Hugging Face non valido o scaduto Errori di connettività di rete Modello non trovato

Errori di implementazione del modello Hugging Face Hub

Panoramica: quando si distribuiscono modelli da Hugging Face Hub utilizzando huggingface il tipo di origine del modello, l'implementazione potrebbe non riuscire durante la fase di download del modello. Questa sezione descrive gli scenari di errore più comuni e come diagnosticarli utilizzando gli eventi e i log dei pod di Kubernetes.

Diagnosi degli errori di implementazione di Hugging Face

Passaggi per la risoluzione dei problemi

Controlla lo InferenceEndpointConfig stato e gli eventi per i dettagli dell'errore:
```
kubectl describe inferenceendpointconfig <name> -n <namespace>
```
Cerca gli eventi con motivo HuggingFaceDownloadFailed e DeploymentFailed condizione nello stato, che contengono messaggi di errore specifici.
Se il contenitore init non funziona (il pod mostra Init:CrashLoopBackOff oInit:Error), controlla i log del contenitore init:
```
kubectl logs <pod-name> -c hf-model-downloader -n <namespace>
```

Controlla lo stato del pod per i codici di uscita del contenitore init:


kubectl get pod <pod-name> -n <namespace> -o jsonpath='{.status.initContainerStatuses[0].state}'

Token Hugging Face non valido o scaduto

Sintomi: il contenitore Init si guasta con o errori. 401 Unauthorized Access denied Il pod entraCrashLoopBackOff.

Causa principale:

Il token dell'API Hugging Face in Kubernetes Secret non è valido, è scaduto o è stato revocato.
Il token non ha accesso al modello chiuso.

Risoluzione:

Genera un nuovo token su huggingface. co/settings/token.
Per i modelli recintati, assicurati di aver accettato il contratto di licenza del modello nella pagina dei modelli Hugging Face Hub.

Aggiorna Kubernetes Secret con il nuovo token:


kubectl delete secret <secret-name> -n <namespace>
kubectl create secret generic <secret-name> \
  --from-literal=token=hf_NEW_TOKEN_HERE \
  -n <namespace>

Elimina il pod non riuscito per attivare un nuovo tentativo di download:
```
kubectl delete pod -l app=<iec-name> -n <namespace>
```

Errori di connettività di rete

Sintomi: il contenitore Init si guasta a causa di errori di timeout della connessione o di risoluzione DNS. Il pod entra. CrashLoopBackOff

Causa principale: i nodi del cluster non dispongono di accesso Internet in uscita ai domini Hugging Face (and). *.huggingface.co *.hf.co Questo è comune nelle sottoreti private senza un gateway NAT.

Risoluzione:

Verifica che il tuo VPC abbia un gateway NAT configurato per le sottoreti private in cui vengono eseguiti i nodi del cluster.
Verifica che i gruppi di sicurezza consentano il traffico HTTPS in uscita (porta 443).
Verifica che gli ACL di rete consentano il traffico in uscita verso Internet.

Verifica la connettività dall'interno del cluster:


kubectl run test-connectivity --image=curlimages/curl --rm -it --restart=Never -- \
  curl -sI https://huggingface.co

Nota

Se l'accesso a Internet in uscita non è disponibile, prendi in considerazione l'utilizzo di Amazon S3 o Amazon FSx come origine del modello. Scarica prima il modello su Amazon S3, quindi distribuiscilo utilizzando il tipo di origine del s3 modello.

Modello non trovato

Sintomi: il contenitore Init si guasta con Repository Not Found o 404 errori.

Causa principale:

Non modelId è corretto o il modello non esiste su Hugging Face Hub.
Il modello è privato e il token non ha accesso.

Risoluzione:

Verifica l'esistenza dell'ID del modello accedendo https://huggingface.co/<org>/<model> al tuo browser.
Assicurati che il modelId tuo InferenceEndpointConfig sia nel org/model formato corretto (ad esempio,mistralai/Mistral-7B-Instruct-v0.3).

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

L'operatore di inferenza non si avvia

Problemi di implementazione di Disaggregated Prefill and Decode (DPD)