python - Find multiple words with regex in Beautifulsoup4 -
मैं उन div को मैंने अलग-अलग संभावनाओं की कोशिश की है, लेकिन मुझे केवल प्रॉड राउंडबेक्स शब्दों का उपयोग करके टैग को निकालने के लिए एक काम नहीं मिल सकता है। मैं दोनों शब्दों का उपयोग करना चाहता हूं! अगर मैं उनमें से एक का उपयोग करता हूं तो मैं अन्य अवांछित टैग लेता हूं। कोई भी विचार! आप बस अपने परिणामों को खोजने के लिए उपयोग कर सकते हैं। यदि आप नियमित अभिव्यक्ति का उपयोग करना चाहते हैं, यहाँ एक उदाहरण है: आउटपुट beautifulsoup4 से निकालने का प्रयास कर रहा हूं और
find_all में regex अभिव्यक्ति () विधि
& lt; div class = "prod rounded बॉक्स" & gt; & Lt; div वर्ग = "राउंडेड बॉक्स अंतिम" & gt;
recompile ("prod.roundedbox") recompile ("prod \ sroundedbox। *") <
आयात bs4 html = '' '& lt; div class = "example" & gt; उदाहरण & lt; / div & gt; & Lt; div class = "prod rounded बॉक्स" & gt; foo & lt; / div & gt; & Lt; div वर्ग = "प्रोड राउंडबेक बॉक्स" & gt; बार & lt; / div & gt; '' 'सूप = बीएस 4। सुंदर सूप (html) सूप (एटर्स = {' क्लास ': [' ठेस ',' गोल बॉक्स ']})
import import bs4 सूप = बीएस 4। सुंदर सूप (html) सूप (attrs = {'class': re.compile (r '^ prod'}})
[& lt; div class = "prod rounded box" & gt; foo & lt; / div & gt ;, & lt; div class = "prod rounded बॉक्स अंतिम" & gt; बार & lt; / div & gt;]
Comments
Post a Comment