# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility
import re
regex = r"<hi>((.|\n)*?)</hi>"
test_str = ("<hi>\n"
"Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Aenean tincidunt diam sit amet semper vestibulum. Donec dictum dapibus magna vitae pharetra. Fusce condimentum velit at tempus aliquam. Maecenas maximus scelerisque nisi, et gravida felis molestie quis. Nunc nec mauris in ligula imperdiet rhoncus. Donec dignissim magna eu consectetur luctus. \n\n"
"Phasellus sed massa vitae nisl congue congue. Etiam nec luctus dolor, eget placerat ligula. Fusce mollis neque vitae fermentum gravida. Suspendisse maximus felis risus, vel fringilla mauris tristique quis. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Interdum et malesuada fames ac ante ipsum primis in faucibum\n"
"</hi>\n"
"Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Aenean tincidunt diam sit amet semper vestibulum. Donec dictum dapibus magna vitae pharetra. Fusce condimentum velit at tempus aliquam. Maecenas maximus scelerisque nisi, et gravida felis molestie quis. Nunc nec mauris in ligula imperdiet rhoncus. Donec dignissim magna eu consectetur luctus. Phasellus sed massa vitae nisl congue congue. Etiam nec luctus dolor, eget placerat ligula. Fusce mollis neque vitae fermentum gravida. Suspendisse maximus felis risus, vel fringilla mauris tristique quis. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Interdum et malesuada fames ac ante ipsum primis in faucibus.\n"
"<hi>\n"
"Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Aenean tincidunt diam sit amet semper vestibulum. Donec dictum dapibus magna vitae pharetra. Fusce condimentum velit at tempus aliquam. Maecenas maximus scelerisque nisi, et gravida felis molestie quis. Nunc nec mauris in ligula imperdiet rhoncus. Donec dignissim magna eu consectetur luctus. \n\n"
"Phasellus sed massa vitae nisl congue congue. Etiam nec luctus dolor, eget placerat ligula. Fusce mollis neque vitae fermentum gravida. Suspendisse maximus felis risus, vel fringilla mauris tristique quis. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Interdum et malesuada fames ac ante ipsum primis in faucibum\n"
"</hi>")
matches = re.finditer(regex, test_str, re.MULTILINE)
for matchNum, match in enumerate(matches, start=1):
print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))
for groupNum in range(0, len(match.groups())):
groupNum = groupNum + 1
print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))
# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.
Please keep in mind that these code samples are automatically generated and are not guaranteed to work. If you find any syntax errors, feel free to submit a bug report. For a full regex reference for Python, please visit: https://docs.python.org/3/library/re.html