

# Extrair fragmentos de string usando uma expressão regular
<a name="transforms-regex-extractor"></a>

Essa transformação extrai fragmentos de string usando uma expressão regular e cria uma nova coluna a partir dela, ou várias colunas se estiver usando grupos regex.

**Para adicionar um nó de transformação Regex Extractor ao diagrama de trabalho**

1. Abra o painel Recurso e escolha **Regex Extractor** para adicionar uma nova transformação ao diagrama do trabalho. O nó selecionado no momento da adição do nó será o nó superior.

1. No painel propriedades do nó, insira um nome para o nó no diagrama de trabalho. Se ainda não houver um nó pai selecionado, escolha um na lista **Node parents** (Nós pais) para usar como fonte de entrada para a transformação.

1. Na guia **Transformar**, insira a expressão regular e a coluna na qual ela precisa ser aplicada. Em seguida, insira o nome da nova coluna na qual armazenar a string correspondente. A nova coluna será nula somente se a coluna de origem for nula; se a regex não corresponder, a coluna ficará vazia.

   Se a regex usar grupos, haverá um nome de coluna correspondente separado por vírgula, mas você pode pular grupos deixando o nome da coluna vazio.

   Por exemplo, se você tiver uma coluna “purchase\$1date” com uma string usando formatos de data ISO longo e curto, convém extrair o ano, mês, dia e hora, quando disponível. Observe que o grupo de horas é opcional, caso contrário, nas linhas em que não estiverem disponíveis, todos os grupos extraídos seriam strings vazias (porque o regex não correspondia). Nesse caso, não queremos que o grupo torne a hora opcional, mas a interna, então deixamos o nome vazio e ele não é extraído (esse grupo incluiria o caractere T).  
![\[A captura de tela mostra a configuração de uma expressão regular para o extrator Regex.\]](http://docs.aws.amazon.com/pt_br/glue/latest/dg/images/regex-extractor-1.png)

   Resultando na visualização prévia dos dados:  
![\[A captura de tela mostra a configuração de uma visualização prévia de dados para o extrator Regex.\]](http://docs.aws.amazon.com/pt_br/glue/latest/dg/images/regex-extractor-2.png)