பைத்தானைப் பயன்படுத்தி ஒரு அஜாக்ஸ் வலைத்தளத்தை எவ்வாறு துடைப்பது என்பதை செமால்ட் நிபுணர் விளக்குகிறார்

வலை ஸ்கிராப்பிங் என்பது ஒரு வலைப்பக்கத்திலிருந்து தரவைப் பிரித்தெடுக்க மென்பொருளைப் பயன்படுத்துவதற்கான ஒரு முறையாகும். பைத்தானுடன் வலையைத் துடைக்கப் பயன்படுத்த ஏராளமான கருவிகள் உள்ளன, அவற்றில் சில உள்ளன; ஸ்கை, ஸ்க்ராபி, கோரிக்கைகள் மற்றும் அழகான சூப். இருப்பினும், இந்த கருவிகளில் பெரும்பாலானவை அவை சேவையகத்திலிருந்து வரும் நிலையான HTML ஐ மட்டுமே மீட்டெடுக்கின்றன, ஆனால் ஜாவாஸ்கிரிப்ட் வழங்கிய மாறும் பகுதி அல்ல.

இருப்பினும், இந்த சிக்கலை சமாளிக்க சில நுட்பங்கள் உள்ளன:

1. தானியங்கி உலாவிகள்

தலையில்லாமல் இயங்கும் முழு உலாவிகளான செலினியம் அல்லது ஸ்பிளாஸ் போன்ற தானியங்கி உலாவிகளை நீங்கள் பயன்படுத்தலாம். இருப்பினும், அவற்றை அமைப்பது மிகவும் சிக்கலானதாக இருக்கும், எனவே கீழேயுள்ள இரண்டாவது விருப்பத்தில் கவனம் செலுத்துவோம்.

2. அஜாக்ஸ் அழைப்புகளை இடைமறித்தல்

இது பக்கத்திலிருந்து அஜாக்ஸ் அழைப்புகளை இடைமறிக்க முயற்சிப்பது மற்றும் அவற்றை மீண்டும் இயக்க அல்லது இனப்பெருக்கம் செய்ய முயற்சிப்பது ஆகியவை அடங்கும்.

இந்த கட்டுரையில், கோரிக்கைகள் நூலகம் மற்றும் கூகிள் குரோம் உலாவியைப் பயன்படுத்துவதன் மூலம் அஜாக்ஸ் அழைப்புகளைப் பிடிப்பது மற்றும் அவற்றை மீண்டும் இயக்குவது குறித்து நாங்கள் கவனம் செலுத்துவோம். ஸ்கிராப்பி போன்ற கட்டமைப்புகள் ஸ்கிராப்பிங் செய்யும்போது உங்களுக்கு மிகவும் திறமையான தீர்வை வழங்கக்கூடும் என்றாலும், எல்லா நிகழ்வுகளுக்கும் இது தேவையில்லை. அஜாக்ஸ் அழைப்புகள் பெரும்பாலும் ஏபிஐக்கு எதிராக செய்யப்படுகின்றன, இது கோரிக்கைகள் நூலகத்தை எளிதாகக் கையாளக்கூடிய ஒரு JSON பொருளைத் தரும்.

நீங்கள் தெரிந்து கொள்ள வேண்டிய முதல் விஷயம் என்னவென்றால், அஜாக்ஸ் அழைப்பை மீண்டும் இயக்க முயற்சிப்பது ஆவணமற்ற API ஐப் பயன்படுத்துவதைப் போன்றது. எனவே, பக்கங்கள் செய்யும் அனைத்து அழைப்பையும் நீங்கள் பார்க்க வேண்டும். நீங்கள் தளத்திற்குச் சென்று, சிறிது நேரம் விளையாடி, சில தகவல்கள் எவ்வாறு வழங்கப்படுகின்றன என்பதைக் காணலாம். நீங்கள் விளையாடிய பிறகு, திரும்பி வந்து ஸ்கிராப்பிங் செய்யத் தொடங்குங்கள்.

விவரங்களுக்குள் செல்வதற்கு முன், பக்கம் எவ்வாறு செயல்படுகிறது என்பதை முதலில் புரிந்துகொள்வோம். நீங்கள் ஒரு ஸ்டோர்ஸ் பக்கத்தை மாநில வாரியாக பார்வையிட்டால், எந்த மாநிலத்தையும் தேர்ந்தெடுக்கவும், மேலும் பக்கம் கடையில் தகவல்களை வழங்கும். ஒவ்வொரு முறையும் நீங்கள் ஒரு மாநிலத்தைத் தேர்ந்தெடுக்கும்போது, பழையவற்றை மாற்ற வலைத்தளம் புதிய கடைகளை வழங்குகிறது. பயன்படுத்துவதன் மூலம் இது அடையப்படுகிறது, மேலும் தகவல்களைக் கேட்கும் சேவையகத்திற்கு அஜாக்ஸ் அழைப்பு. இப்போது எங்கள் நோக்கம் அந்த அழைப்பைப் பிடித்து அதை மீண்டும் இயக்க வேண்டும்.

அவ்வாறு செய்ய, நீங்கள் செய்ய வேண்டியது, குரோம் உலாவியை DevTools கன்சோல் செய்து திறந்து XHR துணைக்குச் செல்லுங்கள். XHR என்பது HTTP மற்றும் HTTPS கோரிக்கைகளைச் செய்யும் ஒரு இடைமுகமாகும். இவ்வாறு அஜாக்ஸ் கோரிக்கைகள் இங்கே காண்பிக்கப்படும். நீங்கள் அஜாக்ஸ் அழைப்பை இருமுறை கிளிக் செய்தால், கடைகளில் நிறைய தகவல்களைக் காண்பீர்கள். நீங்கள் கோரிக்கைகளையும் முன்னோட்டமிடலாம்.

சேவையகத்திற்கு நிறைய தரவு அனுப்பப்படுவதை நீங்கள் கவனிப்பீர்கள். இருப்பினும், கவலைப்பட வேண்டாம், ஏனெனில் இவை அனைத்தும் தேவையில்லை. உங்களுக்கு என்ன தரவு தேவை என்பதைப் பார்க்க, நீங்கள் ஒரு கன்சோலைத் திறந்து வலைத்தளத்திற்கு பல்வேறு இடுகைக் கோரிக்கைகளைச் செய்யலாம். பக்கம் எவ்வாறு இயங்குகிறது மற்றும் அஜாக்ஸ் அழைப்பைப் புரிந்துகொண்டது இப்போது உங்களுக்குத் தெரியும், உங்கள் ஸ்கிராப்பரை எழுதலாம்.

'தானியங்கி உலாவியை ஏன் பயன்படுத்தக்கூடாது?' தீர்வு எளிது; தானியங்கு உலாவி போன்ற மிகவும் கனமான மற்றும் சிக்கலான ஒன்றைத் தொடங்குவதற்கு முன்பு எப்போதும் அஜாக்ஸ் அழைப்புகளை மீண்டும் இயக்க முயற்சிக்கவும். இது எளிமையானது மற்றும் இலகுவானது.

png

mass gmail