As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Consultar tabelas configuradas usando o editor de código SQL
Como membro que pode consultar, você pode criar uma consulta manualmente escrevendo código SQL no editor de código SQL. O editor de código SQL está localizado na seção Análise da guia Análise no AWS Clean Rooms console.
O editor de código SQL é exibido por padrão. Se quiser usar o criador de análises para criar consultas, consulte Consultar com o construtor de análises.
Importante
Se você começar a escrever uma consulta SQL no editor de código e depois ativar a Interface do usuário do construtor de análises, sua consulta não será salva.
AWS Clean Rooms suporta muitos comandos, funções e condições SQL. Para obter mais informações, consulte a Referência SQL do AWS Clean Rooms.
dica
Se uma manutenção programada ocorrer enquanto uma consulta estiver sendo executada, a consulta será encerrada e revertida e será necessário reiniciá-la. Você deve reiniciar a consulta.
Como consultar tabelas configuradas usando o editor de código SQL
-
Faça login no Console de gerenciamento da AWS e abra o AWS Clean Rooms console em https://console.aws.amazon.com/cleanrooms
. -
No painel de navegação à esquerda, escolha Colaborações.
-
Escolha a colaboração que tem o status Executar consultas em Suas habilidades de membro.
-
Na guia Análise, em Tabelas, visualize a lista de tabelas e o tipo de regra de análise associada (regra de análise de agregação, regra de análise de lista ou regra de análise personalizada).
nota
Se não estiver vendo as tabelas que espera na lista, isso pode ser pelos seguintes motivos:
-
As tabelas não foram associadas.
-
As tabelas não têm uma regra de análise configurada.
-
-
(Opcional) Para visualizar os controles do esquema e da regra de análise da tabela, expanda a tabela selecionando o ícone do sinal de adição (+).
-
Na seção Análise, para o modo Análise, selecione Gravar código SQL.
nota
A seção Análise só será exibida se o membro que pode receber os resultados e o membro responsável por pagar pelos custos de computação da consulta tiverem ingressado na colaboração como membro ativo.
-
Crie a consulta digitando a consulta no editor de código SQL.
Para obter mais informações sobre comandos e funções SQL compatíveis, consulte a Referência AWS Clean Rooms SQL.
Você também pode usar as opções a seguir para criar sua consulta.
-
Especifique o tipo de trabalhador suportado e o número de trabalhadores.
Você pode escolher o tipo de instância e o número de instâncias (trabalhadores) para executar suas consultas SQL.
Para CR.1X, você pode selecionar até 128 trabalhadores ou um mínimo de 4 trabalhadores.
Para CR.4X, você pode selecionar até 32 trabalhadores ou um mínimo de 4 trabalhadores.
Use a tabela a seguir para determinar o tipo e o número de trabalhadores necessários para seu caso de uso.
Tipo de operador vCPU Memória (GB) Armazenamento (GB) Número de operadores Total de unidades de processamento de salas limpas (CRPU) CR.1X (padrão) 4 30 100 4 8 128 256 CR.4X 16 120 400 4 32 32 256 nota
Diferentes tipos de trabalhadores e números de trabalhadores têm custos associados. Para saber mais sobre os preços, consulte AWS Clean Rooms preços
. -
Em Enviar resultados para, especifique quem pode receber os resultados.
nota
Para receber resultados, o membro da colaboração deve estar configurado como receptor de resultados e deve ser um participante ativo na colaboração (Status: Ativo)
-
(Membro que pode consultar somente) A caixa de seleção Usar suas configurações padrão de resultados está marcada por padrão. Mantenha essa opção selecionada se quiser manter suas configurações de resultado padrão.
Se você quiser especificar configurações de resultados diferentes para essa consulta, desmarque a caixa de seleção Usar suas configurações de resultado padrão e escolha o seguinte.
-
Formato do resultado (CSV ou PARQUET)
-
Arquivos de resultados (únicos ou múltiplos)
-
Destino dos resultados no Amazon S3
Cada membro que pode receber resultados pode especificar um formato de resultado, arquivos de resultados e destino de resultados diferentes no Amazon S3.
-
-
Para especificar as propriedades do Spark:
-
Expanda as propriedades do Spark.
-
Escolha Adicionar propriedades do Spark.
-
Na caixa de diálogo de propriedades do Spark, escolha um nome de propriedade na lista suspensa e insira um Valor.
As tabelas a seguir fornecem uma definição para cada propriedade.
Para obter mais informações sobre as propriedades do Spark, consulte Propriedades do Spark na documentação
do Apache Spark. nota
Você pode configurar no máximo 50 propriedades do Spark. O valor de cada propriedade pode ter até 500 caracteres.
Nome da propriedade Description Valor padrão Falhas do Spark.Task.max
Controla quantas vezes consecutivas uma tarefa pode falhar antes que o trabalho falhe. Requer um valor maior ou igual a 1. O número de novas tentativas permitidas é igual a esse valor menos 1. A contagem de falhas é reiniciada se alguma tentativa for bem-sucedida. Falhas em tarefas diferentes não se acumulam até esse limite.
4
spark.sql.files.max PartitionBytes
Define o número máximo de bytes a serem compactados em uma única partição ao ler fontes baseadas em arquivos, como Parquet, JSON e ORC.
128 MB
Spark.Hadoop.FS.S3.max Tentativas
Define o número máximo de tentativas para operações de arquivos do Amazon S3.
(none)
spark.network.timeout
Define o tempo limite padrão para todas as interações de rede. Substitui as seguintes configurações de tempo limite se elas não estiverem definidas:
-
spark.storage.block ManagerHeartbeatTimeoutMs
-
spark.shuffle.io.Tempo limite de conexão
-
spark.rpc.askTimeout
-
Spark.rpc.LookupTimeout
Década de 120
spark.rdd.com press
Especifica se as partições RDD serializadas devem ser compactadas usando spark.io.compression.codec. Aplica-se a StorageLevel.MEMORY _ONLY_SER em Java e Scala, ou StorageLevel.MEMORY _ONLY em Python. Reduz o espaço de armazenamento, mas requer tempo adicional de processamento da CPU.
false
spark.shuffle.spill.compress
Especifica se os dados de derramamento aleatório devem ser compactados usando spark.io.compression.codec.
true
spark.shuffle.com press
Especifica se os arquivos de saída do mapa devem ser compactados. A compactação usa spark.io.compression.codec.
true
spark.shuffle.service.index.cache.size
Define o limite de tamanho do cache, em bytes, a menos que especificado de outra forma.
100m
Spark.shuffle.io.max Tentativas
Define o número máximo de novas tentativas para buscas que falham devido a IO-related exceções.
3
spark.shuffle.io. Tente novamente Esperar
Define o tempo de espera entre novas tentativas de buscas. O atraso máximo causado pela nova tentativa é de 15 segundos por padrão, calculado como MaxRetries * RetryWait.
5s
spark.shuffle.io.Tempo limite de conexão
Define o tempo limite para que as conexões estabelecidas entre servidores e clientes aleatórios sejam marcadas como ociosas e fechadas se ainda houver solicitações de busca pendentes, mas nenhum tráfego no canal.
(valor de spark.network.timeout)
spark.driver.max ResultSize
Define o limite de tamanho total dos resultados serializados de todas as partições para cada ação do Spark, em bytes. Deve ser pelo menos 1M ou 0 para ilimitado.
1g
spark.memória.fracção
Define a fração de (espaço na pilha - 300 MB) usada para execução e armazenamento. Quanto menor esse valor, mais frequentemente ocorrem vazamentos e despejos de dados em cache. É recomendável deixar isso no valor padrão.
0.6
spark.scheduler.mode
Define o modo de agendamento entre os trabalhos enviados ao mesmo SparkContext. Pode ser definido como FAIR para usar o compartilhamento justo em vez de colocar trabalhos na fila um após o outro. Valores suportados: FAIR, FIFO.
FIFO
spark.sql.adaptive.advisor PartitionSizeInBytes
Define o tamanho de destino em bytes para partições aleatórias durante a otimização adaptativa quando spark.sql.adaptive.enabled é verdadeiro. Controla o tamanho da partição ao unir partições pequenas ou dividir partições inclinadas.
(valor de spark.sql.adaptive.shuffle.targetPostShuffleInputSize)
spark.sql.adaptive.auto BroadcastJoinThreshold
Define o tamanho máximo da tabela em bytes para transmissão aos nós de trabalho durante as junções. Aplica-se somente na estrutura adaptativa. Usa o mesmo valor padrão de BroadcastJoinThreshold spark.sql.auto. Defina como -1 para desativar a transmissão.
(none)
spark.sql.adaptive.coalesce Partitions.enabled
Especifica se as partições aleatórias contíguas devem ser unidas com base em spark.sql.adaptive.advisor para otimizar o tamanho da tarefa. PartitionSizeInBytes Requer que spark.sql.adaptive.enabled seja verdadeiro.
true
spark.sql.adaptive.coalesce Partitions.initialPartitionNum
Define o número inicial de partições aleatórias antes da fusão. Requer que spark.sql.adaptive.enabled e spark.sql.adaptive.coalesce sejam verdadeiros. Partitions.enabled O padrão é o valor de spark.sql.shuffle.partitions.
(none)
spark.sql.adaptive.coalesce Partitions.minPartitionSize
Define o tamanho mínimo para partições aleatórias agrupadas para evitar que as partições se tornem muito pequenas durante a otimização adaptativa.
1 MB
spark.sql.adaptive.coalesce Partitions.parallelismFirst
Especifica se os tamanhos das partições devem ser calculados com base no paralelismo do cluster em vez de PartitionSizeInBytes spark.sql.adaptive.advisor durante a coalescência de partições. Gera tamanhos de partição menores do que o tamanho de destino configurado para maximizar o paralelismo. Recomendamos definir isso como false em clusters ocupados para melhorar a utilização dos recursos, evitando pequenas tarefas excessivas.
true
spark.sql.adaptive.enabled
Especifica se a execução adaptativa de consultas deve ser habilitada para otimizar novamente os planos de consulta durante a execução da consulta, com base em estatísticas precisas de tempo de execução.
true
spark.sql.adaptive.force OptimizeSkewedJoin
Especifica se a ativação deve ser forçada, OptimizeSkewedJoin mesmo que isso introduza um embaralhamento extra.
false
spark.sql.adaptive.local ShuffleReader.enabled
Especifica se os leitores aleatórios locais devem ser usados quando o particionamento aleatório não é necessário, como após a conversão de junções de classificação e mesclagem em junções de hash de transmissão. Requer que spark.sql.adaptive.enabled seja verdadeiro.
true
spark.sql.adaptive.max ShuffledHashJoinLocalMapThreshold
Define o tamanho máximo da partição em bytes para criar mapas de hash locais. Prioriza as junções de hash embaralhadas sobre as junções de classificação e mesclagem quando:
-
Esse valor é igual ou excede spark.sql.adaptive.advisory PartitionSizeInBytes
-
Todos os tamanhos de partição estão dentro desse limite
Substitui a configuração SortMergeJoin spark.sql.join.prefer.
0 bytes
spark.sql.adaptive.optimize SkewsInRebalancePartitions.enabled
Especifica se as partições aleatórias distorcidas devem ser otimizadas dividindo-as em partições menores com base em spark.sql.adaptive.advisory. PartitionSizeInBytes Requer que spark.sql.adaptive.enabled seja verdadeiro.
true
spark.sql.adaptive.rebalance PartitionsSmallPartitionFactor
Define o fator limite de tamanho para mesclar partições durante a divisão. Partições menores que esse fator multiplicado por spark.sql.adaptive.advisor são PartitionSizeInBytes mescladas.
0.2
spark.sql.adaptive.skew Join.enabled
Especifica se deve lidar com a distorção de dados em junções embaralhadas dividindo e, opcionalmente, replicando partições distorcidas. Aplica-se às junções de hash embaralhadas e sorte-mescladas. Requer que spark.sql.adaptive.enabled seja verdadeiro.
true
spark.sql.adaptive.skew Join.skewedPartitionFactor
Determina o fator de tamanho que determina a inclinação da partição. Uma partição é distorcida quando seu tamanho excede ambos:
-
Esse fator multiplicado pelo tamanho médio da partição
-
O valor de spark.sql.adaptive.skew Join.skewedPartitionThresholdInBytes
5
spark.sql.adaptive.skew Join.skewedPartitionThresholdInBytes
Define o limite de tamanho em bytes para identificar partições distorcidas. Uma partição é distorcida quando seu tamanho excede ambos:
-
Esse limite
-
O tamanho médio da partição multiplicado por spark.sql.adaptive.skew Join.skewedPartitionFactor
Recomendamos definir esse valor maior que PartitionSizeInBytes spark.sql.adaptive.advisory.
256 MB
Spark.sql.Tempo limite de transmissão
Controla o período de tempo limite em segundos para as operações de transmissão durante as junções de transmissão.
300 segundos
spark.sql.cbo.enabled
Especifica se a otimização baseada em custos (CBO) deve ser ativada para a estimativa das estatísticas do plano.
false
spark.sql.cbo.join Reorder.dp.star.filter
Especifica se a heurística do filtro de junção em estrela deve ser aplicada durante a enumeração de junção com base no custo.
false
spark.sql.cbo.join Reorder.dp.threshold
Define o número máximo de nós unidos permitidos no algoritmo de programação dinâmica.
12
spark.sql.cbo.join Reorder.enabled
Especifica se a reordenação de junções deve ser ativada na otimização baseada em custos (CBO).
false
spark.sql.cbo.plan Stats.enabled
Especifica se as contagens de linhas e estatísticas de colunas do catálogo devem ser buscadas durante a geração do plano lógico.
false
spark.sql.cbo.star SchemaDetection
Especifica se a reordenação de junções deve ser ativada com base na detecção do esquema em estrela.
false
spark.sql.files.max PartitionNum
Define o número máximo de partições de arquivo divididas para fontes baseadas em arquivos (Parquet, JSON e ORC). Redimensiona as partições quando a contagem inicial excede esse valor. Esse é um alvo sugerido, não um limite garantido.
(none)
spark.sql.files.max RecordsPerFile
Define o número máximo de registros a serem gravados em um único arquivo. Nenhum limite se aplica quando definido como zero ou um valor negativo.
0
spark.sql.files.min PartitionNum
Define o número mínimo de partições de arquivo divididas para fontes baseadas em arquivos (Parquet, JSON e ORC). O padrão é spark.sql.leaf. NodeDefaultParallelism Esse é um alvo sugerido, não um limite garantido.
(none)
spark.sql.in MemoryColumnarStorage.batchSize
Controla o tamanho do lote para armazenamento em cache colunar. Aumentar o tamanho melhora a utilização e a compactação da memória, mas aumenta o risco de erros de falta de memória.
10000
spark.sql.in MemoryColumnarStorage.compressed
Especifica se os codecs de compressão devem ser selecionados automaticamente para colunas com base nas estatísticas de dados.
true
spark.sql.in MemoryColumnarStorage.enableVectorizedReader
Especifica se a leitura vetorizada deve ser ativada para o armazenamento em cache colunar.
true
spark.sql.legacy.allow HashOnMapType
Especifica se as operações de hash devem ser permitidas em estruturas de dados do tipo mapa. Essa configuração antiga mantém a compatibilidade com o tratamento de tipos de mapas das versões mais antigas do Spark.
(none)
spark.sql.legacy.allow NegativeScaleOfDecimal
Especifica se valores de escala negativos devem ser permitidos nas definições de tipo decimal. Essa configuração antiga mantém a compatibilidade com versões mais antigas do Spark que suportavam escalas decimais negativas.
(none)
spark.sql.legacy.cast ComplexTypesToString.enabled
Especifica se o comportamento legado deve ser ativado para converter tipos complexos em cadeias de caracteres. Mantém a compatibilidade com as regras de conversão de tipos das versões mais antigas do Spark.
(none)
spark.sql.legacy.char VarcharAsString
Especifica se os tipos CHAR e VARCHAR devem ser tratados como tipos STRING. Essa configuração antiga fornece compatibilidade com o tratamento de tipos de string das versões mais antigas do Spark.
(none)
spark.sql.legacy.create EmptyCollectionUsingStringType
Especifica se as coleções vazias devem ser criadas usando elementos do tipo string. Essa configuração antiga mantém a compatibilidade com o comportamento de inicialização da coleção das versões mais antigas do Spark.
(none)
spark.sql.legacy.exponent LiteralAsDecimal.enabled
Especifica se os literais exponenciais devem ser interpretados como tipos decimais. Essa configuração antiga mantém a compatibilidade com o tratamento literal numérico das versões mais antigas do Spark.
(none)
spark.sql.legacy.json.allow EmptyString.enabled
Especifica se as cadeias de caracteres vazias devem ser permitidas no processamento de JSON. Essa configuração antiga mantém a compatibilidade com o comportamento de análise JSON das versões mais antigas do Spark.
(none)
spark.sql.legacy.parquet.int96 RebaseModelRead
Especifica se o modo legado de rebase de carimbo de data/hora INT96 deve ser usado ao ler arquivos Parquet. Essa configuração antiga mantém a compatibilidade com o tratamento de timestamp das versões mais antigas do Spark.
(none)
spark.sql.legacy.time ParserPolicy
Controla o comportamento da análise de tempo para compatibilidade com versões anteriores. Essa configuração herdada determina como os carimbos de data/hora e as datas são analisados a partir de cadeias de caracteres.
(none)
spark.sql.legacy.type Coercion.datetimeToString.enabled
Especifica se o comportamento de coerção do tipo legado deve ser ativado ao converter valores de data e hora em cadeias de caracteres. Mantém a compatibilidade com as regras de conversão de data e hora das versões mais antigas do Spark.
(none)
spark.sql.max SinglePartitionBytes
Define o tamanho máximo da partição em bytes. O planejador introduz operações aleatórias para partições maiores para melhorar o paralelismo.
128m
spark.sql.MetadataCachettlSeconds
Controla a vida útil (TTL) dos caches de metadados. Aplica-se aos metadados do arquivo de partição e aos caches do catálogo de sessões. Requer:
-
Um valor positivo maior que zero
-
Spark.sql.CatalogImplementation configurada para hive
-
PartitionFileCacheSize spark.sql.hive.filesource maior que zero
-
FilesourcePartitions spark.sql.hive.manage definido como verdadeiro
-1000 ms
spark.sql.optimizer.collapse ProjectAlwaysInline
Especifica se as projeções e expressões embutidas adjacentes devem ser reduzidas, mesmo quando isso causa duplicação.
false
spark.sql.optimizer.dynamic PartitionPruning.enabled
Especifica se devem ser gerados predicados para colunas de partição usadas como chaves de junção.
true
spark.sql.optimizer.enable CsvExpressionOptimization
Especifica se as expressões CSV devem ser otimizadas no otimizador de SQL removendo colunas desnecessárias das operações from_csv.
true
spark.sql.optimizer.enable JsonExpressionOptimization
Especifica se as expressões JSON devem ser otimizadas no otimizador de SQL por meio de:
-
Removendo colunas desnecessárias das operações from_json
-
Simplificando as combinações from_json e to_json
-
Otimizando as operações named_struct
true
spark.sql.optimizer.Regras excluídas
Define as regras do otimizador a serem desativadas, identificadas por nomes de regras separados por vírgula. Algumas regras não podem ser desativadas, pois são necessárias para serem corretas. O otimizador registra quais regras foram desativadas com sucesso.
(none)
spark.sql.optimizer.runtime.bloom Filter.applicationSideScanSizeThreshold
Define o tamanho mínimo de escaneamento agregado em bytes necessário para injetar um filtro Bloom no lado do aplicativo.
10 GB
spark.sql.optimizer.runtime.bloom Filter.creationSideThreshold
Define o limite máximo de tamanho para injetar um filtro Bloom no lado da criação.
10 MB
spark.sql.optimizer.runtime.bloom Filter.enabled
Especifica se um filtro Bloom deve ser inserido para reduzir os dados aleatórios quando um lado de uma junção aleatória tem um predicado seletivo.
true
spark.sql.optimizer.runtime.bloom Filter.expectedNumItems
Define o número padrão de itens esperados no filtro Bloom em tempo de execução.
1000000
spark.sql.optimizer.runtime.bloom Filter.maxNumBits
Define o número máximo de bits permitidos no filtro Bloom em tempo de execução.
67108864
spark.sql.optimizer.runtime.bloom Filter.maxNumItems
Define o número máximo de itens esperados permitidos no filtro Bloom em tempo de execução.
4000000
spark.sql.optimizer.runtime.bloom Filter.numBits
Define o número padrão de bits usados no filtro Bloom em tempo de execução.
8388608
spark.sql.optimizer.runtime.rowlevel OperationGroupFilter.enabled
Especifica se a filtragem de grupos de tempo de execução deve ser ativada para operações em nível de linha. Permite que as fontes de dados:
-
Remova grupos inteiros de dados (como arquivos ou partições) usando filtros de fonte de dados
-
Execute consultas em tempo de execução para identificar registros correspondentes
-
Descarte grupos desnecessários para evitar regravações caras
Limitações:
-
Nem todas as expressões podem ser convertidas em filtros de fonte de dados
-
Algumas expressões exigem avaliação do Spark (como subconsultas)
true
spark.sql.optimizer.runtime Filter.number.threshold
Define o número total de filtros de tempo de execução injetados (não DPP). Isso evita que OOMs de motoristas tenham muitos filtros Bloom.
10
spark.sql.optimizer.runtime Filter.semiJoinReduction.enabled
Especifica se uma junção semi-aleatória deve ser inserida para reduzir os dados aleatórios quando um lado de uma junção aleatória tem um predicado seletivo.
false
spark.sql.parquet.aggregatePushdown
Especifica se os agregados devem ser enviados para o Parquet para otimização. Suporta:
-
MIN e MAX para tipos booleano, inteiro, flutuante e de data
-
CONTAGEM para todos os tipos de dados
Lança uma exceção se as estatísticas estiverem ausentes em qualquer rodapé do arquivo Parquet.
false
spark.sql.parquet.columnar ReaderBatchSize
Controla o número de linhas em cada lote de leitores vetorizados do Parquet. Escolha um valor que equilibre a sobrecarga de desempenho e o uso da memória para evitar erros de falta de memória.
4096
spark.sql.parquet.enable VectorizedReader
Especifica se a decodificação vetorizada do Parquet deve ser ativada.
true
spark.sql.shuffle.partições
Define o número padrão de partições para o embaralhamento de dados durante junções ou agregações. Não pode ser modificado entre reinicializações de consultas de streaming estruturadas no mesmo local do ponto de verificação.
200
spark.sql.embaralhado HashJoinFactor
Define o fator de multiplicação usado para determinar a elegibilidade da junção de hash aleatória. Uma junção de hash aleatória é selecionada quando o tamanho dos dados do lado pequeno multiplicado por esse fator é menor que o tamanho dos dados do lado grande.
3
spark.sql.sources.parallel PartitionDiscovery.threshold
Define o número máximo de caminhos para a listagem de arquivos do lado do driver com fontes baseadas em arquivos (Parquet, JSON e ORC). Quando excedidos durante a descoberta da partição, os arquivos são listados usando uma tarefa distribuída separada do Spark.
32
spark.sql.statistics.histogram.enabled
Especifica se devem ser gerados histogramas de altura equivalente durante o cálculo das estatísticas da coluna para melhorar a precisão da estimativa. Requer uma varredura de tabela adicional além da necessária para estatísticas básicas de colunas.
false
spark.dynamic Allocation.executorIdleTimeout
Define a duração em que um executor deve ficar ocioso antes de ser removido quando a alocação dinâmica está ativada.
60 segundos
spark.dynamic Allocation.schedulerBacklogTimeout
Define por quanto tempo as tarefas pendentes devem ser armazenadas antes que novos executores sejam solicitados quando a alocação dinâmica é ativada.
1s
spark.dynamic Allocation.sustainedSchedulerBacklogTimeout
O mesmo que spark.dynamicAllocation.schedulerBacklogTimeout, mas usado somente para solicitações subsequentes do executor.
(valor de spark.dynamicAllocation.schedulerBacklogTimeout)
spark.scheduler.min RegisteredResourcesRatio
Define a proporção mínima de recursos registrados (recursos registrados/total de recursos esperados) a serem aguardados antes do início do agendamento. Especificado como um duplo entre 0,0 e 1,0. Independentemente de a proporção mínima de recursos ter sido atingida, o tempo máximo de espera antes do início do agendamento é controlado por RegisteredResourcesWaitingTime spark.scheduler.max.
0.8
spark.scheduler.max RegisteredResourcesWaitingTime
Define o tempo máximo de espera até que os recursos sejam registrados antes do início do agendamento.
30s
spark.sql.hive.metastore PartitionPruningFallbackOnException
Especifica se você deve voltar a obter todas as partições do metastore Hive e realizar a remoção de partições no lado do cliente Spark ao encontrá-las na metastore. MetaException
false
Nome da propriedade Description Valor padrão spark.sql.auto BroadcastJoinThreshold
Define o tamanho máximo da tabela em bytes para transmissão aos nós de trabalho durante as junções. Defina como -1 para desativar a transmissão.
10 MB (-1 para CR.4X 32 trabalhadores)
spark.dynamic Allocation.enabled
Especifica se a alocação dinâmica de recursos deve ser usada, que aumenta ou diminui o número de executores registrados nesse aplicativo com base na carga de trabalho.
true
spark.io.compression.codec
Define o codec usado para compactar dados internos, como partições RDD, registro de eventos, variáveis de transmissão e saídas aleatórias. Valores suportados: lz4, snappy, zstd, gzip.
snappy
spark.sql.session.fuso horário
Define o fuso horário da sessão para lidar com carimbos de data/hora em literais de string e conversão de objetos Java. Aceita:
-
Region-based IDs em area/city formato (como America/Los _Angeles)
-
Deslocamentos de zona no HH:mm:ss formato (+/-) HH, (+/-) HH:mm ou (+/-) (como -08 ou + 01:00)
-
UTC ou Z como aliases para + 00:00
UTC
-
-
(Opcional) Em Pagador de computação, selecione o membro da colaboração que paga pelos custos de computação da consulta.
nota
Se houver apenas um pagador candidato para computação de consulta na colaboração, o padrão será esse pagador.
-
Escolha Executar.
nota
Você não poderá executar a consulta se o membro que pode receber os resultados não tiver definido as configurações dos resultados da consulta.
-
Visualize os Resultados.
Para obter mais informações, consulte Recebendo e usando os resultados da análise.
-
Continue ajustando os parâmetros e execute sua consulta novamente ou escolha o botão + para iniciar uma nova consulta em uma nova guia.
nota
AWS Clean Rooms visa fornecer mensagens de erro claras. Se uma mensagem de erro não tiver detalhes suficientes para ajudá-lo a solucionar o problema, entre em contato com a equipe da conta. Forneça a eles uma descrição de como o erro ocorreu e a mensagem de erro (incluindo quaisquer identificadores). Para obter mais informações, consulte Solução de problemas AWS Clean Rooms.