python – Como exportar coluna do Pandas na forma de lista após usar expressões regulares?

Preciso exportar uma coluna do Pandas na forma de lista após fazer tratamentos com expressões regulares. Não estou conseguindo exportar na forma de lista, apenas de string, mesmo usando to_list().
Vou exemplificar com um dos dados. Os dados iniciais estão na forma de listas, sendo uma lista por linha. Assim:

(('então', 'ADV'), ('he', 'N'), ('he', 'N'), ('o', 'ART'), ('negócio', 'N'), ('não', 'ADV'), ('é', 'V'), ('não', 'ADV'), ('não', 'ADV'), ('é', 'V'), ('seguinte', 'N'), ('no', 'PREP'), ('norte', 'ADJ'))

Como expressões regulares demandam string, uso o “x” do lambda – via apply, para transformar em string:

df('utterances_POS') = df('utterances_POS').apply(lambda x: re.sub(r"(?<='na',s')w+|(?<='no',s')w+", 'PREP', str(x), flags = re.IGNORECASE)) df('utterances_POS') = df('utterances_POS').apply(lambda x: re.sub(r"(?<='da',s')w+|(?<='do',s')w+", 'PREP', str(x), flags = re.IGNORECASE))

Após fazer isso, no entanto, não consigo transformar em lista novamente! Tentei:

lista = df('utterances_POS').apply(lambda x: eval(str(x))).tolist()

Mas o programa diz “invalid syntax”.

Se eu tento exportar na forma de lista sem o eval, com apenas to_list() aplicado à coluna, consigo uma lista enorme contendo strings (uma string enorme por linha):

"(('então', 'ADV'), ('he', 'N'), ('he', 'N'), ('o', 'ART'), ('negócio', 'N'))"

Mas o que eu quero é uma lista por linha, com tuplas dentro, e a string dentro das tuplas:

(('então', 'ADV'), ('he', 'N'), ('he', 'N'), ('o', 'ART'), ('negócio', 'N'))

Alguém poderia me ajudar?

Operadores AND, XOR, OR em expressões regulares [fechada]

Estou querendo fazer um WebScrapping ou Crawler não sei o nome certo que se da, que vai até o site do planalto, pega o texto de uma lei e o separa artigo por artigo, inciso por inciso, alinea por alinea e assim vai.
Eu consegui montar o código que cópia o texto da lei usando Curl e já tenho o texto todo dentro da minha string.
O meu problema e que quero estruturar o texto, conforme os padrões que eu tenho(existe um padrão para artigo, um padrão de texto para inciso, um padrão de texto para as alienas e por assim vai).
Eu gostaria de saber se alguém consegue me dar uma ideia de como fazer isto.

Obs.: Todo o código está em PHP.

regex – Como filtrar uma tag html e seu conteúdo com expressões regulares na Shell Bash?

Tomando como base o texto abaixo, me explique nesta pergunta, como manter a saída de texto da primeira coluna da tag span, que condiz com o texto do segundo span.

<span class="CVA68e qXLe6d">Colcha Casal e ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Colcha Solteiro e ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Roupão de banho ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; banho</span>  </span>
<span class="CVA68e qXLe6d">Caminho de mesa ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; mesa</span>  </span>
<span class="CVA68e qXLe6d">Cortina para quarto ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Travesseiro de pena com ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Fronha de Solteiro em ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Lençol 70% algodão e ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Pano de prato pintado a ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; mesa</span>  </span>
<span class="CVA68e qXLe6d">Coberto dupla face colo... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; cama</span>  </span>
<span class="CVA68e qXLe6d">Toalha de rosto felpudo ... - TorraTudo</span>  <span class="qXLe6d dXDvrc">  <span class="fYyStc">www.torratudo.com &#8250; banho</span>  </span>

Lembrando que o texto acima possui vários parágrafos e, o que é determinante nessa questão é conseguir pegar os títulos do primeiro span através da filtragem pela #hashtag &#8250; cama/mesa/banho do terceiro/último span.

O que tentei .. o sed juntamente com o grep em sua forma simples de uso:

sed 's/"/n/g' /tmp/default.htm | grep "TorraTudo"

Significado da opção ” n:
" – Filtrar apóstrofos e..
n – Quebrar linha por linha a cada apóstrofo

  • Isto me dá uma lista, do qual eu posso continuar o manuseio a saída fica como:
>Colcha Casal e ... - TorraTudo</span>  <span class=
>Colcha Solteiro e ... - TorraTudo</span>  <span class=
>Roupão de banho ... - TorraTudo</span>  <span class=
>Caminho de mesa ... - TorraTudo</span>  <span class=
>Cortina para quarto ... - TorraTudo</span>  <span class=
>Os Simpsons em Português - YouTube</span>  <span class=
>Travesseiro de pena com ... - TorraTudo</span>  <span class=
>Fronha de Solteiro em ... - TorraTudo</span>  <span class=
>Lençol 70% algodão e ... - TorraTudo</span>  <span class=
>Pano de prato pintado a ... - TorraTudo</span>  <span class=
>Coberto dupla face colo... - TorraTudo</span>  <span class=
>Toalha de rosto felpudo ... - TorraTudo</span>  <span class=

Mas veja que não há distinção entre Cama/Mesa/Banho

E o que preciso e separar cada título a sua categoria.

Até tentei algo como: sed 's/"/n/g' /tmp/default.htm | grep "TorraTudo(^.*$) &#8250; watch"

Entre várias tentativas inúteis que fiz fora essas mostrada aqui, decidi pergunta pra quem tem mais experiência neste assunto (Expressão Regular).

base de datos – problema con expresiones regulares, validar rango en php

con una expresion regular que diseñe, la idea es que solo me deje pasar un rango numerico, como el siguiente:
introducir la descripción de la imagen aquí

el codigo que estoy usando es el siguiente

if( empty($datos(RANGO_CUPOS)) ){
        $errorMensaje($key+2)() = "El campo ".$arrayEncabezado(RANGO_CUPOS)." no puede estar vacío";
        $has_error = true;
    }elseif( !preg_match("/^(0-9){1,2}-((0-9){1,2})?+$/", trim($datos(RANGO_CUPOS))) ){
        $errorMensaje($key+2)() = "El campo ".$arrayEncabezado(RANGO_CUPOS)." debe tener la estructura numero - numero";
        $has_error = true;
    } 

mi problema es que me esta dejando pasar cosas como may-15, en la ultima parte no se como hacer la expresion regular de 26-. de antemano gracias por su ayuda.