import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Example {
public static void main(String[] args) {
final String regex = "<([^<\\/>]*)([^<\\/>]*)>([\\s]*?|(?R))<\\/\\1>";
final String string = " <table>\n"
+ " <tr>\n"
+ " <th>Nome da Opção</th>\n"
+ " <th class=\"boxToolTip\" title=\"O símbolo para PETRD197 Ex:19,7 é PETRD197\">Código da Opção</th>\n"
+ " <th class=\"boxToolTip\" title=\"PETRD197 Ex:19,7 está listado(a) no mercado Bovespa\">Bolsa de Valores</th>\n"
+ " <th class=\"boxToolTip\" title=\"\">Tipo de Ativo</th>\n"
+ " \n"
+ " <th class=\"boxToolTip\" title=\"O código ISIN para PETRD197 Ex:19,7\">Código ISIN do Ativo</th>\n"
+ " \n"
+ " \n"
+ " \n"
+ " <th class=\"ColumnLast\">Descrição da Opção</th>\n"
+ " \n"
+ " </tr>\n"
+ " <tr class=\"odd\">\n"
+ " <td align=\"center\"><b>PETRD197 Ex:19,7 20/04/2020</b></td>\n"
+ " <td align=\"center\"><b>PETRD197</b></td>\n"
+ " <td align=\"center\"><b><a href='/bolsa-de-valores/bovespa' title='Bovespa'>Bovespa</a></b></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece5\" class=\"\">Opção</span></td>\n"
+ " \n"
+ " <td align=\"center\"><span id=\"quoteElementPiece6\" class=\"\">BRPETR4D0UU5</span></td>\n"
+ " \n"
+ " \n"
+ " \n"
+ " <td align=\"center\">Opção de Compra Ex:19,7 Vencimento: Abril</td>\n"
+ " \n"
+ " </tr>\n"
+ " </table>\n"
+ "</div>\n\n"
+ " <div class=\"TableElement\">\n"
+ " <table>\n"
+ " <tr>\n"
+ " <th>Preço de Exercício (Strike)</th>\n"
+ " <th>Vencimento do Contrato</th>\n"
+ " <th>Dias até Vencimento</th>\n"
+ " <th>Tipo de Negócio</th>\n"
+ " <th>Estilo de Opção</th>\n"
+ " <th>Classif.</th>\n"
+ " <th>Valor Intrínsico da Opção</th>\n"
+ " <th class=\"ColumnLast\">Valor Extrínsico da Opção</th>\n"
+ " </tr>\n"
+ " <tr class=\"odd\">\n"
+ " <td align=\"center\">19,70</td>\n"
+ " <td align=\"center\">20/04/2020</td>\n"
+ " <td align=\"center\">3 dias</td>\n"
+ " <td align=\"center\">Call</td>\n"
+ " <td align=\"center\">Americano</td>\n"
+ " <td align=\"center\">OTM</td>\n"
+ " <td align=\"center\">-3,59</td>\n"
+ " <td align=\"center\">3,60</td>\n"
+ " </tr>\n"
+ " </table>\n"
+ " </div>\n\n\n"
+ "<div class=\"TableElement\">\n"
+ " <table>\n"
+ " <tr>\n"
+ " <th class=\"boxToolTip\" title=\"O preço para PETRD197 Ex:19,7 está em alta ou baixa?\"> </th>\n"
+ " <th class=\"boxToolTip\" title=\"Mudança no preço de PETRD197 Ex:19,7\">Variação do Dia (p)</th>\n"
+ " <th class=\"boxToolTip\" title=\"Variação no preço de PETRD197 Ex:19,7\">Variação do Dia %</th>\n"
+ " <th class=\"boxToolTip\" title=\"Preço atual de PETRD197 Ex:19,7\">Último Preço</th>\n"
+ " <th class=\"boxToolTip\" title=\"Menor preço para as ações de PETRD197 Ex:19,7 hoje\">Preço Mínimo</th>\n"
+ " <th class=\"boxToolTip\" title=\"Maior preço para as ações de PETRD197 Ex:19,7 hoje\">Preço Máximo</th>\n"
+ " <th class=\"boxToolTip\" title=\"Preço de abertura para PETRD197 Ex:19,7 hoje\">Preço de Abertura</th>\n"
+ " <th class=\"boxToolTip\" title=\"Preco de fechamento de PETRD197 Ex:19,7 ontem\">Preço de Fechamento</th>\n"
+ " <th class=\"boxToolTip\" class=\"ColumnLast\" title=\"Último negócio para PETRD197 Ex:19,7\">Hora <img title='' alt='' class='quotePageRTupgradeLink' href='#quotePageRTupgradeContainer' id='cautionImageEnt' src='/common/images/icons/caution_sign.gif'/></th>\n"
+ " </tr>\n"
+ " <tr class=\"odd\">\n"
+ " <td align=\"center\" class=\"change_arrow_fa\"><span id=\"quoteElementPiece7\" class=\"PriceTextUnchanged\"><span class=\"fa fa-circle PriceTextUnchanged fa-fw\"></span></span></td>\n"
+ " <td align=\"center\" class=\"change\"><span id=\"quoteElementPiece8\" class=\"PriceTextUnchanged\">0,00</span></td>\n"
+ " <td align=\"center\" class=\"chgpct\"><span id=\"quoteElementPiece9\" class=\"PriceTextUnchanged\">0,0%</span></td>\n"
+ " <td align=\"center\" class=\"current_price\"><span id=\"quoteElementPiece10\" class=\"PriceTextUnchanged\">0,01</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece11\" class=\"\">0,01</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece12\" class=\"\">0,01</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece13\" class=\"\">0,01</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece14\" class=\"\">0,01</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece15\" class=\"\">10:00:00</span></td>\n"
+ " </tr>\n"
+ " </table>\n"
+ "</div>\n\n\n\n\n\n"
+ " \n\n"
+ " \n"
+ " <div class=\"TableElement\">\n"
+ " <table>\n"
+ " <tr>\n"
+ " <th class=\"boxToolTip\" title=\"O número total de negócios que foram executados para PETRD197 durante o pregão mais recente.\">Número de Negócios</th>\n"
+ " <th class=\"boxToolTip\" title=\"Volume total negociado para PETRD197 Ex:19,7 hoje\">Volume de Ações Negociadas</th>\n"
+ " \n"
+ " <th class=\"boxToolTip\" title=\"\">Preço Médio</th>\n"
+ " <th class=\"boxToolTip\" title=\"O valor total financeiro para este ativo durante o pregão mais recente. Volume financeiro é um cálculo contínuo sobre todos os negócios do pregão. Para cada negócio no pregão você multiplica o preço pelo número de ativos negociados. Então some esse resultado para todos os negócios no pregão.\">Volume Financeiro</th>\n"
+ " \n"
+ " <th class=\"boxToolTip\" title=\"O volume médio diário durante os últimos 30 dias negociados.\">Volume médio</th>\n"
+ " \n"
+ " <th class=\"boxToolTip\" title=\"O valor mais baixo e mais alto que o ativo atingiu nas últimas 52 semanas\">Últimas 52 Semanas</th>\n"
+ " \n"
+ " </tr>\n"
+ " <tr class=\"odd\">\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece16\" class=\"\">7</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece17\" class=\"\">22.000</span></td>\n"
+ " \n"
+ " <td align=\"center\"><span id=\"quoteElementPiece18\" class=\"PriceTextUnchanged\"> 0,01</span></td>\n"
+ " <td align=\"center\"></span><span id=\"quoteElementPiece19\" class=\"\"> 220</span></td>\n"
+ " \n"
+ " <td align=\"center\">-</td>\n"
+ " \n"
+ " <td align=\"center\">0,00 - 0,00</td>\n"
+ " \n\n"
+ " </tr>\n"
+ " </table>\n"
+ " </div>\n"
+ " \n\n"
+ " \n"
+ " <div class=\"TableElement\">\n"
+ " <table>\n"
+ " <tr>\n"
+ " <th class=\"boxToolTip\" title=\"O horário do último negócio realizado\">Último Negócio</th>\n"
+ " <th>Tipo de Negócio</th>\n"
+ " <th>Quantidade de Ações Negociadas</th>\n"
+ " <th class=\"boxToolTip\" title=\"O último preço negociado para PETRD197 Ex:19,7 (PETRD197).\">Preço Negociado</th>\n"
+ " <th class=\"ColumnLast\">Moeda</th>\n"
+ " </tr>\n"
+ " <tr class=\"odd\">\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece20\" class=\"\">10:33:55</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece21\" class=\"\"></span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece22\" class=\"\">100</span></td>\n"
+ " <td align=\"center\" onclick=\"javascript:location.href='/bolsa-de-valores/bovespa/petrd197-ex-19-7-PETRD197/negocios'\" style=\"cursor:pointer;text-decoration:underline;color:black;\"><span id=\"quoteElementPiece23\" class=\"trdprice current_price PriceTextUnchanged\"> 0,01</span></td>\n"
+ " <td align=\"center\"><span id=\"quoteElementPiece24\" class=\"\">BRL</span></td>\n"
+ " </tr>\n\n"
+ " </table>\n"
+ " </div>\n"
+ " \n\n\n\n"
+ "<div class=\"TableElement\">\n"
+ " <table>\n"
+ " <tr>\n"
+ " <th>Setor da Empresa</th>\n"
+ " </tr>\n"
+ " <tr class=\"odd\">\n"
+ " <td align=\"center\">\n"
+ " <a href=\"/mundo/brasil/setores/mineracao-extracao-petroleo-gas/extracao-petroleo-gas\">Petróleo, Gás e Biocombustíveis / Petróleo, Gás e Biocombustíveis / Exploração e/ou Refino</a>\n"
+ " </td>\n"
+ " </tr>\n"
+ " </table>\n"
+ "</div>\n\n"
+ "<div class=\"TableElement\">\n"
+ " <table><tr><th>Anotações</th></tr><tr class='odd'><td><a href='#' role='login'>Clique aqui para escrever uma anotação sobre esse ativo.</a></td></tr></table>";
final Pattern pattern = Pattern.compile(regex, Pattern.MULTILINE | Pattern.CASE_INSENSITIVE | Pattern.DOTALL | Pattern.UNICODE_CHARACTER_CLASS);
final Matcher matcher = pattern.matcher(string);
while (matcher.find()) {
System.out.println("Full match: " + matcher.group(0));
for (int i = 1; i <= matcher.groupCount(); i++) {
System.out.println("Group " + i + ": " + matcher.group(i));
}
}
}
}
Please keep in mind that these code samples are automatically generated and are not guaranteed to work. If you find any syntax errors, feel free to submit a bug report. For a full regex reference for Java, please visit: https://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern.html