python - Find multiple words with regex in Beautifulsoup4 -


मैं उन div को beautifulsoup4 से निकालने का प्रयास कर रहा हूं और find_all में regex अभिव्यक्ति () विधि

  & lt; div class = "prod rounded बॉक्स" & gt; & Lt; div वर्ग = "राउंडेड बॉक्स अंतिम" & gt;   

मैंने अलग-अलग संभावनाओं की कोशिश की है, लेकिन मुझे केवल प्रॉड राउंडबेक्स शब्दों का उपयोग करके टैग को निकालने के लिए एक काम नहीं मिल सकता है। मैं दोनों शब्दों का उपयोग करना चाहता हूं! अगर मैं उनमें से एक का उपयोग करता हूं तो मैं अन्य अवांछित टैग लेता हूं।

  recompile ("prod.roundedbox") recompile ("prod \ sroundedbox। *")  <  

कोई भी विचार!

आप बस अपने परिणामों को खोजने के लिए उपयोग कर सकते हैं।

  आयात bs4 html = '' '& lt; div class = "example" & gt; उदाहरण & lt; / div & gt; & Lt; div class = "prod rounded बॉक्स" & gt; foo & lt; / div & gt; & Lt; div वर्ग = "प्रोड राउंडबेक बॉक्स" & gt; बार & lt; / div & gt; '' 'सूप = बीएस 4। सुंदर सूप (html) सूप (एटर्स = {' क्लास ': [' ठेस ',' गोल बॉक्स ']})   

यदि आप नियमित अभिव्यक्ति का उपयोग करना चाहते हैं, यहाँ एक उदाहरण है:

  import import bs4 सूप = बीएस 4। सुंदर सूप (html) सूप (attrs = {'class': re.compile (r '^ prod'}})   

आउटपुट

  [& lt; div class = "prod rounded box" & gt; foo & lt; / div & gt ;, & lt; div class = "prod rounded बॉक्स अंतिम" & gt; बार & lt; / div & gt;]    

Comments

Popular posts from this blog

c - Mpirun hangs when mpi send and recieve is put in a loop -

python - Apply coupon to a customer's subscription based on non-stripe related actions on the site -

java - Unable to get JDBC connection in Spring application to MySQL -