# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility
import re
regex = r"<([^<\/>]*)([^<\/>]*)>([\s]*?|(?R))<\/\1>"
test_str = (" <table>\n"
" <tr>\n"
" <th>Nome da Opção</th>\n"
" <th class=\"boxToolTip\" title=\"O símbolo para PETRD197 Ex:19,7 é PETRD197\">Código da Opção</th>\n"
" <th class=\"boxToolTip\" title=\"PETRD197 Ex:19,7 está listado(a) no mercado Bovespa\">Bolsa de Valores</th>\n"
" <th class=\"boxToolTip\" title=\"\">Tipo de Ativo</th>\n"
" \n"
" <th class=\"boxToolTip\" title=\"O código ISIN para PETRD197 Ex:19,7\">Código ISIN do Ativo</th>\n"
" \n"
" \n"
" \n"
" <th class=\"ColumnLast\">Descrição da Opção</th>\n"
" \n"
" </tr>\n"
" <tr class=\"odd\">\n"
" <td align=\"center\"><b>PETRD197 Ex:19,7 20/04/2020</b></td>\n"
" <td align=\"center\"><b>PETRD197</b></td>\n"
" <td align=\"center\"><b><a href='/bolsa-de-valores/bovespa' title='Bovespa'>Bovespa</a></b></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece5\" class=\"\">Opção</span></td>\n"
" \n"
" <td align=\"center\"><span id=\"quoteElementPiece6\" class=\"\">BRPETR4D0UU5</span></td>\n"
" \n"
" \n"
" \n"
" <td align=\"center\">Opção de Compra Ex:19,7 Vencimento: Abril</td>\n"
" \n"
" </tr>\n"
" </table>\n"
"</div>\n\n"
" <div class=\"TableElement\">\n"
" <table>\n"
" <tr>\n"
" <th>Preço de Exercício (Strike)</th>\n"
" <th>Vencimento do Contrato</th>\n"
" <th>Dias até Vencimento</th>\n"
" <th>Tipo de Negócio</th>\n"
" <th>Estilo de Opção</th>\n"
" <th>Classif.</th>\n"
" <th>Valor Intrínsico da Opção</th>\n"
" <th class=\"ColumnLast\">Valor Extrínsico da Opção</th>\n"
" </tr>\n"
" <tr class=\"odd\">\n"
" <td align=\"center\">19,70</td>\n"
" <td align=\"center\">20/04/2020</td>\n"
" <td align=\"center\">3 dias</td>\n"
" <td align=\"center\">Call</td>\n"
" <td align=\"center\">Americano</td>\n"
" <td align=\"center\">OTM</td>\n"
" <td align=\"center\">-3,59</td>\n"
" <td align=\"center\">3,60</td>\n"
" </tr>\n"
" </table>\n"
" </div>\n\n\n"
"<div class=\"TableElement\">\n"
" <table>\n"
" <tr>\n"
" <th class=\"boxToolTip\" title=\"O preço para PETRD197 Ex:19,7 está em alta ou baixa?\"> </th>\n"
" <th class=\"boxToolTip\" title=\"Mudança no preço de PETRD197 Ex:19,7\">Variação do Dia (p)</th>\n"
" <th class=\"boxToolTip\" title=\"Variação no preço de PETRD197 Ex:19,7\">Variação do Dia %</th>\n"
" <th class=\"boxToolTip\" title=\"Preço atual de PETRD197 Ex:19,7\">Último Preço</th>\n"
" <th class=\"boxToolTip\" title=\"Menor preço para as ações de PETRD197 Ex:19,7 hoje\">Preço Mínimo</th>\n"
" <th class=\"boxToolTip\" title=\"Maior preço para as ações de PETRD197 Ex:19,7 hoje\">Preço Máximo</th>\n"
" <th class=\"boxToolTip\" title=\"Preço de abertura para PETRD197 Ex:19,7 hoje\">Preço de Abertura</th>\n"
" <th class=\"boxToolTip\" title=\"Preco de fechamento de PETRD197 Ex:19,7 ontem\">Preço de Fechamento</th>\n"
" <th class=\"boxToolTip\" class=\"ColumnLast\" title=\"Último negócio para PETRD197 Ex:19,7\">Hora <img title='' alt='' class='quotePageRTupgradeLink' href='#quotePageRTupgradeContainer' id='cautionImageEnt' src='/common/images/icons/caution_sign.gif'/></th>\n"
" </tr>\n"
" <tr class=\"odd\">\n"
" <td align=\"center\" class=\"change_arrow_fa\"><span id=\"quoteElementPiece7\" class=\"PriceTextUnchanged\"><span class=\"fa fa-circle PriceTextUnchanged fa-fw\"></span></span></td>\n"
" <td align=\"center\" class=\"change\"><span id=\"quoteElementPiece8\" class=\"PriceTextUnchanged\">0,00</span></td>\n"
" <td align=\"center\" class=\"chgpct\"><span id=\"quoteElementPiece9\" class=\"PriceTextUnchanged\">0,0%</span></td>\n"
" <td align=\"center\" class=\"current_price\"><span id=\"quoteElementPiece10\" class=\"PriceTextUnchanged\">0,01</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece11\" class=\"\">0,01</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece12\" class=\"\">0,01</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece13\" class=\"\">0,01</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece14\" class=\"\">0,01</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece15\" class=\"\">10:00:00</span></td>\n"
" </tr>\n"
" </table>\n"
"</div>\n\n\n\n\n\n"
" \n\n"
" \n"
" <div class=\"TableElement\">\n"
" <table>\n"
" <tr>\n"
" <th class=\"boxToolTip\" title=\"O número total de negócios que foram executados para PETRD197 durante o pregão mais recente.\">Número de Negócios</th>\n"
" <th class=\"boxToolTip\" title=\"Volume total negociado para PETRD197 Ex:19,7 hoje\">Volume de Ações Negociadas</th>\n"
" \n"
" <th class=\"boxToolTip\" title=\"\">Preço Médio</th>\n"
" <th class=\"boxToolTip\" title=\"O valor total financeiro para este ativo durante o pregão mais recente. Volume financeiro é um cálculo contínuo sobre todos os negócios do pregão. Para cada negócio no pregão você multiplica o preço pelo número de ativos negociados. Então some esse resultado para todos os negócios no pregão.\">Volume Financeiro</th>\n"
" \n"
" <th class=\"boxToolTip\" title=\"O volume médio diário durante os últimos 30 dias negociados.\">Volume médio</th>\n"
" \n"
" <th class=\"boxToolTip\" title=\"O valor mais baixo e mais alto que o ativo atingiu nas últimas 52 semanas\">Últimas 52 Semanas</th>\n"
" \n"
" </tr>\n"
" <tr class=\"odd\">\n"
" <td align=\"center\"><span id=\"quoteElementPiece16\" class=\"\">7</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece17\" class=\"\">22.000</span></td>\n"
" \n"
" <td align=\"center\"><span id=\"quoteElementPiece18\" class=\"PriceTextUnchanged\"> 0,01</span></td>\n"
" <td align=\"center\"></span><span id=\"quoteElementPiece19\" class=\"\"> 220</span></td>\n"
" \n"
" <td align=\"center\">-</td>\n"
" \n"
" <td align=\"center\">0,00 - 0,00</td>\n"
" \n\n"
" </tr>\n"
" </table>\n"
" </div>\n"
" \n\n"
" \n"
" <div class=\"TableElement\">\n"
" <table>\n"
" <tr>\n"
" <th class=\"boxToolTip\" title=\"O horário do último negócio realizado\">Último Negócio</th>\n"
" <th>Tipo de Negócio</th>\n"
" <th>Quantidade de Ações Negociadas</th>\n"
" <th class=\"boxToolTip\" title=\"O último preço negociado para PETRD197 Ex:19,7 (PETRD197).\">Preço Negociado</th>\n"
" <th class=\"ColumnLast\">Moeda</th>\n"
" </tr>\n"
" <tr class=\"odd\">\n"
" <td align=\"center\"><span id=\"quoteElementPiece20\" class=\"\">10:33:55</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece21\" class=\"\"></span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece22\" class=\"\">100</span></td>\n"
" <td align=\"center\" onclick=\"javascript:location.href='/bolsa-de-valores/bovespa/petrd197-ex-19-7-PETRD197/negocios'\" style=\"cursor:pointer;text-decoration:underline;color:black;\"><span id=\"quoteElementPiece23\" class=\"trdprice current_price PriceTextUnchanged\"> 0,01</span></td>\n"
" <td align=\"center\"><span id=\"quoteElementPiece24\" class=\"\">BRL</span></td>\n"
" </tr>\n\n"
" </table>\n"
" </div>\n"
" \n\n\n\n"
"<div class=\"TableElement\">\n"
" <table>\n"
" <tr>\n"
" <th>Setor da Empresa</th>\n"
" </tr>\n"
" <tr class=\"odd\">\n"
" <td align=\"center\">\n"
" <a href=\"/mundo/brasil/setores/mineracao-extracao-petroleo-gas/extracao-petroleo-gas\">Petróleo, Gás e Biocombustíveis / Petróleo, Gás e Biocombustíveis / Exploração e/ou Refino</a>\n"
" </td>\n"
" </tr>\n"
" </table>\n"
"</div>\n\n"
"<div class=\"TableElement\">\n"
" <table><tr><th>Anotações</th></tr><tr class='odd'><td><a href='#' role='login'>Clique aqui para escrever uma anotação sobre esse ativo.</a></td></tr></table>")
matches = re.finditer(regex, test_str, re.MULTILINE | re.IGNORECASE | re.DOTALL)
for matchNum, match in enumerate(matches, start=1):
print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))
for groupNum in range(0, len(match.groups())):
groupNum = groupNum + 1
print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))
# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.
Please keep in mind that these code samples are automatically generated and are not guaranteed to work. If you find any syntax errors, feel free to submit a bug report. For a full regex reference for Python, please visit: https://docs.python.org/3/library/re.html