

# Usar o Ray Core e o Ray Data no AWS Glue para Ray
<a name="edit-script-ray-scripting"></a>

**Importante**  
O AWS Glue para Ray não estará mais disponível para novos clientes a partir de 30 de abril de 2026. Se quiser usar o AWS Glue para Ray, inscreva-se antes dessa data. Os clientes atuais podem continuar usando o serviço normalmente. Para recursos semelhantes aos do AWS Glue para Ray, explore o Amazon EKS. Para saber mais, consulte [Fim do suporte do AWS Glue para Ray](https://docs.aws.amazon.com/glue/latest/dg/awsglue-ray-jobs-availability-change.html).

O Ray é uma estrutura para aumentar verticalmente a escala de scripts do Python distribuindo o trabalho por um cluster. Você pode usar o Ray como uma solução para vários tipos de problemas, então o Ray fornece bibliotecas para otimizar determinadas tarefas. No AWS Glue, nos concentramos em usar o Ray para transformar grandes conjuntos de dados. O AWS Glue é compatível com o Ray Data e partes do Ray Core para facilitar essa tarefa. 

## O que é o Ray Core?
<a name="edit-script-ray-scripting-core-what"></a>

A primeira etapa da criação de uma aplicação distribuída é identificar e definir o trabalho que pode ser executado simultaneamente. O Ray Core contém as partes do Ray que você usa para definir tarefas que podem ser executadas simultaneamente. O Ray fornece informações de referência e de início rápido que você pode usar para aprender as ferramentas que eles fornecem. Para obter mais informações, consulte [What is Ray Core?](https://docs.ray.io/en/latest/ray-core/walkthrough.html) e [Ray Core Quick Start](https://docs.ray.io/en/latest/ray-overview/getting-started.html#ray-core-quick-start). Para obter mais informações sobre a definição eficaz de tarefas simultâneas no Ray, consulte [Tips for first-time users](https://docs.ray.io/en/latest/ray-core/tips-for-first-time.html). 

**Tarefas e atores do Ray**  
Na documentação do AWS Glue para Ray, podemos nos referir a *tarefas* e *atores*, que são conceitos fundamentais do Ray.  
O Ray usa funções e classes do Python como peças de montagem de um sistema de computação distribuído. Como acontece quando as funções e as variáveis do Python se tornam "métodos" e "atributos" quando usadas em uma classe, as funções se tornam "tarefas" e as classes se tornam "atores" quando são usadas no Ray para enviar código aos operadores. Você pode identificar as funções e as classes que podem ser usadas pelo Ray por meio da anotação `@ray.remote`.  
As tarefas e os atores são configuráveis, têm um ciclo de vida e consomem recursos computacionais durante toda a sua existência. Um código que gera erros pode ser rastreado de volta a uma tarefa ou ator quando você descobre a causa raiz dos problemas. Assim, esses termos podem surgir quando você está aprendendo a configurar, monitorar ou depurar trabalhos do AWS Glue para Ray.   
Para começar a aprender como usar tarefas e atores de modo eficaz para criar uma aplicação distribuída, consulte [Key Concepts](https://docs.ray.io/en/latest/ray-core/key-concepts.html) na documentação do Ray.

## Ray Core no AWS Glue para Ray
<a name="edit-script-ray-scripting-core-glue"></a>

Os ambientes do AWS Glue para Ray gerenciam a formação e a escalação de clusters, bem como a coleta e a visualização de logs. Como gerenciamos essas preocupações, consequentemente limitamos o acesso e a compatibilidade com as APIs no Ray Core que seriam usadas para resolver essas preocupações em um cluster de código aberto.

No ambiente de runtime do `Ray2.4`, não oferecemos compatibilidade com:
+ [CLI do Ray Core](https://docs.ray.io/en/releases-2.4.0/ray-core/api/cli.html)
+ [CLI do Ray State](https://docs.ray.io/en/releases-2.4.0/ray-observability/api/state/cli.html)
+ Métodos de utilitários métricos do Prometheus `ray.util.metrics`:
  + [Contador](https://docs.ray.io/en/releases-2.4.0/ray-core/api/doc/ray.util.metrics.Counter.html)
  + [Medidor](https://docs.ray.io/en/releases-2.4.0/ray-core/api/doc/ray.util.metrics.Gauge.html)
  + [Histograma](https://docs.ray.io/en/releases-2.4.0/ray-core/api/doc/ray.util.metrics.Histogram.html)
+ Outras ferramentas de depuração:
  + [ray.util.pdb.set\$1trace](https://docs.ray.io/en/releases-2.4.0/ray-core/api/doc/ray.util.pdb.set_trace.html)
  + [ray.util.inspect\$1serializability](https://docs.ray.io/en/releases-2.4.0/ray-core/api/doc/ray.util.inspect_serializability.html)
  + [ray.timeline](https://docs.ray.io/en/releases-2.4.0/ray-core/api/doc/ray.timeline.html)

## O que é o Ray Data?
<a name="edit-script-ray-scripting-data-what"></a>

Quando você está se conectando a fontes e destinos de dados, manipulando conjuntos de dados e iniciando transformações comuns, o Ray Data é uma metodologia simples de usar o Ray para resolver problemas de transformação de conjuntos de dados do Ray. Para obter mais informações sobre o uso do Ray Data, consulte [Ray Datasets: Distributed Data Preprocessing](https://docs.ray.io/en/releases-2.4.0/data/dataset.html). 

Você pode usar o Ray Data ou outras ferramentas para acessar dados. Para obter mais informações sobre como acessar dados no Ray, consulte [Conectar a dados em trabalhos do Ray](edit-script-ray-connections-formats.md).

## Ray Data no AWS Glue para Ray
<a name="edit-script-ray-scripting-data-glue"></a>

O Ray Data é compatível e fornecido por padrão no ambiente de runtime gerenciado do `Ray2.4`. Para obter mais informações sobre os módulos fornecidos, consulte [Módulos fornecidos com trabalhos do Ray](edit-script-ray-env-dependencies.md#edit-script-ray-modules-provided).