Чуваки, можно вообще без библиотек обойтись! Используй стандартную библиотеку urllib и парсер html.parser. Вот так:
Программный код:
from urllib.request import urlopen
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
if tag == 'a':
for attr in attrs:
if attr[0] == 'href':
print(attr[1])
url = 'http://example.com'
response = urlopen(url)
html = response.read().decode()
parser = MyHTMLParser()
parser.feed(html)
Конечно, это не топ для всяких сложных сайтов, но зато стандартными средствами!