Scrape all href into list with BeautifulSoup

Question

I&#8217;d like to to grab links from this page and put them in a list. I have this code: It produces following output: I need to get following: [/en/catalog/view/514, &#8230; , &#8216;/en/catalog/view/565&#8217;] But then I go ahead and add following: href_value = links.get(&#8216;href&#8217;) I got an error.…

Accepted Answer

Try:soup = bs.BeautifulSoup(source,'lxml')links = [i.get("href") for i in soup.find_all('a', attrs={'class': 'view'})]print(links)Output:['/en/catalog/view/514', '/en/catalog/view/515', '/en/catalog/view/179080', '/en/catalog/view/45518', '/en/catalog/view/521', '/en/catalog/view/111429', '/en/catalog/view/522', '/en/catalog/view/182223', '/en/catalog/view/168153', '/en/catalog/view/523', '/en/catalog/view/524', '/en/catalog/view/60228', '/en/catalog/view/525', '/en/catalog/view/539', '/en/catalog/view/540', '/en/catalog/view/31642', '/en/catalog/view/553', '/en/catalog/view/558', '/en/catalog/view/559', '/en/catalog/view/77672', '/en/catalog/view/560', '/en/catalog/view/55377', '/en/catalog/view/55379', '/en/catalog/view/32001', '/en/catalog/view/561', '/en/catalog/view/562', '/en/catalog/view/72185', '/en/catalog/view/563', '/en/catalog/view/564', '/en/catalog/view/565']

Advertisement

Answer