python - Find multiple words with regex in Beautifulsoup4 -


मैं उन div को beautifulsoup4 से निकालने का प्रयास कर रहा हूं और find_all में regex अभिव्यक्ति () विधि

  & lt; div class = "prod rounded बॉक्स" & gt; & Lt; div वर्ग = "राउंडेड बॉक्स अंतिम" & gt;   

मैंने अलग-अलग संभावनाओं की कोशिश की है, लेकिन मुझे केवल प्रॉड राउंडबेक्स शब्दों का उपयोग करके टैग को निकालने के लिए एक काम नहीं मिल सकता है। मैं दोनों शब्दों का उपयोग करना चाहता हूं! अगर मैं उनमें से एक का उपयोग करता हूं तो मैं अन्य अवांछित टैग लेता हूं।

  recompile ("prod.roundedbox") recompile ("prod \ sroundedbox। *")  <  

कोई भी विचार!

आप बस अपने परिणामों को खोजने के लिए उपयोग कर सकते हैं।

  आयात bs4 html = '' '& lt; div class = "example" & gt; उदाहरण & lt; / div & gt; & Lt; div class = "prod rounded बॉक्स" & gt; foo & lt; / div & gt; & Lt; div वर्ग = "प्रोड राउंडबेक बॉक्स" & gt; बार & lt; / div & gt; '' 'सूप = बीएस 4। सुंदर सूप (html) सूप (एटर्स = {' क्लास ': [' ठेस ',' गोल बॉक्स ']})   

यदि आप नियमित अभिव्यक्ति का उपयोग करना चाहते हैं, यहाँ एक उदाहरण है:

  import import bs4 सूप = बीएस 4। सुंदर सूप (html) सूप (attrs = {'class': re.compile (r '^ prod'}})   

आउटपुट

  [& lt; div class = "prod rounded box" & gt; foo & lt; / div & gt ;, & lt; div class = "prod rounded बॉक्स अंतिम" & gt; बार & lt; / div & gt;]    

Comments

Popular posts from this blog

c - Performance of System() -

python - how we can use ajax() in views.py in django? -

python - Sequence Pattern recognition with Pybrain -