python - Find multiple words with regex in Beautifulsoup4 -


मैं उन div को beautifulsoup4 से निकालने का प्रयास कर रहा हूं और find_all में regex अभिव्यक्ति () विधि

  & lt; div class = "prod rounded बॉक्स" & gt; & Lt; div वर्ग = "राउंडेड बॉक्स अंतिम" & gt;   

मैंने अलग-अलग संभावनाओं की कोशिश की है, लेकिन मुझे केवल प्रॉड राउंडबेक्स शब्दों का उपयोग करके टैग को निकालने के लिए एक काम नहीं मिल सकता है। मैं दोनों शब्दों का उपयोग करना चाहता हूं! अगर मैं उनमें से एक का उपयोग करता हूं तो मैं अन्य अवांछित टैग लेता हूं।

  recompile ("prod.roundedbox") recompile ("prod \ sroundedbox। *")  <  

कोई भी विचार!

आप बस अपने परिणामों को खोजने के लिए उपयोग कर सकते हैं।

  आयात bs4 html = '' '& lt; div class = "example" & gt; उदाहरण & lt; / div & gt; & Lt; div class = "prod rounded बॉक्स" & gt; foo & lt; / div & gt; & Lt; div वर्ग = "प्रोड राउंडबेक बॉक्स" & gt; बार & lt; / div & gt; '' 'सूप = बीएस 4। सुंदर सूप (html) सूप (एटर्स = {' क्लास ': [' ठेस ',' गोल बॉक्स ']})   

यदि आप नियमित अभिव्यक्ति का उपयोग करना चाहते हैं, यहाँ एक उदाहरण है:

  import import bs4 सूप = बीएस 4। सुंदर सूप (html) सूप (attrs = {'class': re.compile (r '^ prod'}})   

आउटपुट

  [& lt; div class = "prod rounded box" & gt; foo & lt; / div & gt ;, & lt; div class = "prod rounded बॉक्स अंतिम" & gt; बार & lt; / div & gt;]    

Comments

Popular posts from this blog

wpf - ControlTemplate with changes for every class -

sonata admin - how to add ManyToOne property field in configureListfield in sonataAdmin -

sql - Return Function using Cursor -