python - Find multiple words with regex in Beautifulsoup4 -
मैं उन div को beautifulsoup4 से निकालने का प्रयास कर रहा हूं और
find_all में regex अभिव्यक्ति () विधि
& lt; div class = "prod rounded बॉक्स" & gt; & Lt; div वर्ग = "राउंडेड बॉक्स अंतिम" & gt; मैंने अलग-अलग संभावनाओं की कोशिश की है, लेकिन मुझे केवल प्रॉड राउंडबेक्स शब्दों का उपयोग करके टैग को निकालने के लिए एक काम नहीं मिल सकता है। मैं दोनों शब्दों का उपयोग करना चाहता हूं! अगर मैं उनमें से एक का उपयोग करता हूं तो मैं अन्य अवांछित टैग लेता हूं।
recompile ("prod.roundedbox") recompile ("prod \ sroundedbox। *") < कोई भी विचार!
आप बस अपने परिणामों को खोजने के लिए उपयोग कर सकते हैं।
आयात bs4 html = '' '& lt; div class = "example" & gt; उदाहरण & lt; / div & gt; & Lt; div class = "prod rounded बॉक्स" & gt; foo & lt; / div & gt; & Lt; div वर्ग = "प्रोड राउंडबेक बॉक्स" & gt; बार & lt; / div & gt; '' 'सूप = बीएस 4। सुंदर सूप (html) सूप (एटर्स = {' क्लास ': [' ठेस ',' गोल बॉक्स ']}) यदि आप नियमित अभिव्यक्ति का उपयोग करना चाहते हैं, यहाँ एक उदाहरण है:
import import bs4 सूप = बीएस 4। सुंदर सूप (html) सूप (attrs = {'class': re.compile (r '^ prod'}}) आउटपुट
[& lt; div class = "prod rounded box" & gt; foo & lt; / div & gt ;, & lt; div class = "prod rounded बॉक्स अंतिम" & gt; बार & lt; / div & gt;]
Comments
Post a Comment