Operadores AND, XOR, OR em expressões regulares [fechada]

Estou querendo fazer um WebScrapping ou Crawler não sei o nome certo que se da, que vai até o site do planalto, pega o texto de uma lei e o separa artigo por artigo, inciso por inciso, alinea por alinea e assim vai.
Eu consegui montar o código que cópia o texto da lei usando Curl e já tenho o texto todo dentro da minha string.
O meu problema e que quero estruturar o texto, conforme os padrões que eu tenho(existe um padrão para artigo, um padrão de texto para inciso, um padrão de texto para as alienas e por assim vai).
Eu gostaria de saber se alguém consegue me dar uma ideia de como fazer isto.

Obs.: Todo o código está em PHP.