யாண்டெக்ஸ் தேடுபொறி புதியது என்ன. Yandex - Yandex என்றால் என்ன, அது ஏன் Yandex என்று அழைக்கப்படுகிறது. தேடல் அமைப்பின் செயல்பாட்டின் கலவை மற்றும் கொள்கைகள்

அவை நீண்ட காலமாக ரஷ்ய இணையத்தின் ஒருங்கிணைந்த பகுதியாக மாறிவிட்டன. தேடுபொறிகள் இப்போது மிகப்பெரிய மற்றும் சிக்கலான வழிமுறைகளாக உள்ளன, அவை தகவல் தேடல் கருவியை மட்டுமல்ல, வணிகத்திற்கான கவர்ச்சியான பகுதிகளையும் குறிக்கின்றன.

பெரும்பாலான தேடுபொறி பயனர்கள் தேடுபொறிகளின் செயல்பாட்டுக் கொள்கை, பயனர் கோரிக்கைகளைச் செயலாக்குவதற்கான திட்டம், இந்த அமைப்புகள் எதைக் கொண்டிருக்கின்றன, அவை எவ்வாறு செயல்படுகின்றன என்பதைப் பற்றி ஒருபோதும் நினைத்ததில்லை (அல்லது அதைப் பற்றி யோசித்திருந்தாலும், ஆனால் பதில் கிடைக்கவில்லை).

தேடுபொறிகள் எவ்வாறு செயல்படுகின்றன என்ற கேள்விக்கு பதிலளிக்க இந்த முதன்மை வகுப்பு வடிவமைக்கப்பட்டுள்ளது. இருப்பினும், ஆவணங்களின் தரவரிசையை பாதிக்கும் காரணிகளை நீங்கள் இங்கு காண முடியாது. மேலும், Yandex அல்காரிதம் பற்றிய விரிவான விளக்கத்தை நீங்கள் நம்பக்கூடாது. அவர், யாண்டெக்ஸ் தேடுபொறியின் தொழில்நுட்பம் மற்றும் மேம்பாட்டு இயக்குநரான இலியா செகலோவிச்சின் கூற்றுப்படி, இலியா செகலோவிச்சால் மட்டுமே "சித்திரவதையின் கீழ்" அங்கீகரிக்கப்பட முடியும் ...

2. ஒரு தேடுபொறியின் கருத்து மற்றும் செயல்பாடுகள்

ஒரு தேடல் அமைப்பு என்பது ஒரு மென்பொருள் மற்றும் வன்பொருள் வளாகமாகும், இது இணையத்தில் தேட மற்றும் பயனர் கோரிக்கைக்கு பதிலளிக்க வடிவமைக்கப்பட்டுள்ளது, இது ஒரு உரை சொற்றொடர் (தேடல் வினவல்) வடிவத்தில் குறிப்பிடப்பட்டுள்ளது. கோரிக்கைக்கு இணங்க). மிகப்பெரிய சர்வதேச தேடுபொறிகள்: "கூகிள்", யாஹூ, எம்.எஸ்.என். ரஷ்ய இணையத்தில் இவை யாண்டெக்ஸ், ராம்ப்ளர், அபோர்ட்.

யாண்டெக்ஸ் தேடுபொறியை உதாரணமாகப் பயன்படுத்தி தேடல் வினவலின் கருத்தை உற்று நோக்கலாம். தேடல் வினவல் பயனரால் அவர் கண்டுபிடிக்க விரும்புவதைப் பொறுத்து, முடிந்தவரை சுருக்கமாகவும் எளிமையாகவும் உருவாக்கப்பட வேண்டும். ஒரு காரை எவ்வாறு தேர்வு செய்வது என்பது பற்றிய தகவலை Yandex இல் கண்டுபிடிக்க விரும்புகிறோம் என்று வைத்துக்கொள்வோம். இதைச் செய்ய, Yandex இன் பிரதான பக்கத்தைத் திறந்து, "ஒரு காரை எவ்வாறு தேர்வு செய்வது" என்ற தேடல் வினவலின் உரையை உள்ளிடவும். அடுத்து, இணையத்தில் உள்ள தகவல் ஆதாரங்களுக்கான எங்கள் கோரிக்கையின் பேரில் வழங்கப்பட்ட இணைப்புகளைத் திறப்பது எங்கள் பணியாகும். இருப்பினும், நமக்குத் தேவையான தகவலைக் கண்டுபிடிக்க முடியாது என்பது மிகவும் சாத்தியம். இது நடந்தால், உங்கள் கோரிக்கையை மீண்டும் எழுத வேண்டும், அல்லது தேடுபொறி தரவுத்தளத்தில் எங்கள் கோரிக்கையில் தொடர்புடைய எந்த தகவலும் இல்லை (எடுத்துக்காட்டாக, "எப்படி தேர்வு செய்வது" போன்ற "குறுகிய" வினவல்களைக் கேட்கும்போது இது நிகழலாம். ஆர்க்காங்கெல்ஸ்கில் ஒரு கார்")

எந்தவொரு தேடுபொறியின் முதன்மையான குறிக்கோள், அவர்கள் தேடும் தகவலைத் துல்லியமாக மக்களுக்கு வழங்குவதாகும். மேலும் கணினிக்கு "சரியான" கோரிக்கைகளைச் செய்ய பயனர்களுக்குக் கற்பிக்கவும், அதாவது. தேடுபொறிகளின் இயக்கக் கொள்கைகளுக்கு இணங்கக்கூடிய வினவல்கள் சாத்தியமற்றது. எனவே, டெவலப்பர்கள் தேடுபொறிகளுக்கான அல்காரிதம்கள் மற்றும் இயக்கக் கொள்கைகளை உருவாக்குகிறார்கள், இது பயனர்கள் அவர்கள் தேடும் தகவலைக் கண்டறிய அனுமதிக்கும்.

அதாவது, தகவலைத் தேடும் போது பயனர் நினைப்பதைப் போலவே தேடுபொறியும் "சிந்திக்க" வேண்டும். ஒரு தேடுபொறிக்கு ஒரு பயனர் கோரிக்கை வைக்கும்போது, ​​அவர் தனக்குத் தேவையானதை விரைவாகவும் எளிதாகவும் கண்டுபிடிக்க விரும்புகிறார். முடிவைப் பெற்று, பல அடிப்படை அளவுருக்களால் வழிநடத்தப்படும் அமைப்பின் செயல்திறனை அவர் மதிப்பீடு செய்கிறார். அவர் தேடியதை கண்டுபிடித்தாரா? அவர் அதைக் கண்டுபிடிக்கவில்லை என்றால், அவர் தேடுவதைக் கண்டுபிடிக்க எத்தனை முறை வினவலை மீண்டும் எழுத வேண்டும்? எவ்வளவு பொருத்தமான தகவல்களை அவரால் கண்டுபிடிக்க முடிந்தது? தேடுபொறி எவ்வளவு விரைவாக கோரிக்கையைச் செயல்படுத்தியது? தேடல் முடிவுகள் எவ்வளவு வசதியானவை? நீங்கள் தேடும் முடிவு முதலாவதா அல்லது நூறாவதுதா? பயனுள்ள தகவல்களுடன் எவ்வளவு தேவையற்ற குப்பைகள் கண்டுபிடிக்கப்பட்டன? தேடுபொறியை அணுகும்போது தேவையான தகவல்கள் ஒரு வாரத்தில் அல்லது ஒரு மாதத்தில் கிடைக்குமா?

இந்த எல்லா கேள்விகளுக்கும் பதில்களுடன் திருப்தி செய்வதற்காக, தேடுபொறி டெவலப்பர்கள் தொடர்ந்து தேடல் அல்காரிதம்கள் மற்றும் கொள்கைகளை மேம்படுத்தி, புதிய செயல்பாடுகள் மற்றும் திறன்களைச் சேர்த்து, கணினியின் செயல்பாட்டை விரைவுபடுத்த எல்லா வழிகளிலும் முயற்சி செய்கிறார்கள்.

3. தேடுபொறியின் முக்கிய பண்புகள்

தேடுபொறிகளின் முக்கிய பண்புகளை விவரிப்போம்:

  • முழுமை

    முழுமை என்பது ஒரு தேடல் அமைப்பின் முக்கிய பண்புகளில் ஒன்றாகும், இது கொடுக்கப்பட்ட கோரிக்கையை பூர்த்தி செய்யும் இணையத்தில் உள்ள மொத்த ஆவணங்களின் எண்ணிக்கையுடன் கோரிக்கையின் மூலம் கண்டறியப்பட்ட ஆவணங்களின் எண்ணிக்கையின் விகிதமாகும். எடுத்துக்காட்டாக, "ஒரு காரை எவ்வாறு தேர்வு செய்வது" என்ற சொற்றொடரைக் கொண்ட இணையத்தில் 100 பக்கங்கள் இருந்தால், அவற்றில் 60 மட்டுமே தொடர்புடைய வினவலுக்குக் காணப்பட்டால், தேடலின் முழுமை 0.6 ஆக இருக்கும். வெளிப்படையாக, தேடலை முழுமையாக்கினால், பயனர் தனக்குத் தேவையான ஆவணத்தைக் கண்டுபிடிக்க முடியாது, அது இணையத்தில் இருந்தால் போதும்.

  • துல்லியம்

    துல்லியம் என்பது தேடுபொறியின் மற்றொரு முக்கிய அம்சமாகும், இது கண்டுபிடிக்கப்பட்ட ஆவணங்கள் பயனரின் வினவலுடன் எந்த அளவிற்கு பொருந்துகிறது என்பதன் மூலம் தீர்மானிக்கப்படுகிறது. எடுத்துக்காட்டாக, “காரை எவ்வாறு தேர்வு செய்வது” என்ற வினவலில் 100 ஆவணங்கள் இருந்தால், அவற்றில் 50 ஆவணங்களில் “ஒரு காரை எவ்வாறு தேர்வு செய்வது” என்ற சொற்றொடரைக் கொண்டுள்ளது, மீதமுள்ளவை இந்த வார்த்தைகளைக் கொண்டிருக்கின்றன (“சரியான வானொலியைத் தேர்ந்தெடுத்து அதை எவ்வாறு நிறுவுவது ஒரு கார்”), பின்னர் தேடல் துல்லியம் 50/100 (=0.5) க்கு சமமாக கருதப்படுகிறது. மிகவும் துல்லியமான தேடல், பயனர் தனக்குத் தேவையான ஆவணங்களை விரைவாகக் கண்டுபிடிப்பார், அவற்றில் பல்வேறு வகையான “குப்பைகள்” குறைவாகவே காணப்படுகின்றன, குறைவாக அடிக்கடி காணப்படும் ஆவணங்கள் கோரிக்கைக்கு ஒத்திருக்காது.

  • சம்பந்தம்

    தொடர்புடையது என்பது தேடலின் சமமான முக்கியமான அங்கமாகும், இது இணையத்தில் ஆவணங்கள் வெளியிடப்பட்ட தருணத்திலிருந்து தேடுபொறி குறியீட்டு தரவுத்தளத்தில் உள்ளிடப்படும் வரை கடந்து செல்லும் நேரத்தால் வகைப்படுத்தப்படுகிறது. எடுத்துக்காட்டாக, சுவாரஸ்யமான செய்திகள் தோன்றிய மறுநாளே, ஏராளமான பயனர்கள் தொடர்புடைய வினவல்களுடன் தேடுபொறிகளுக்குத் திரும்பினர். புறநிலையாக, இந்த தலைப்பில் செய்தித் தகவல் வெளியிடப்பட்டதிலிருந்து ஒரு நாளுக்கும் குறைவான காலம் கடந்துவிட்டது, ஆனால் முக்கிய ஆவணங்கள் ஏற்கனவே குறியிடப்பட்டு தேடலுக்குக் கிடைக்கின்றன, பெரிய தேடுபொறிகளின் "வேகமான தரவுத்தளம்" என்று அழைக்கப்படுவதற்கு நன்றி. ஒரு நாளைக்கு பல முறை புதுப்பிக்கப்படுகிறது.

  • தேடல் வேகம்

    தேடல் வேகம் அதன் சுமை எதிர்ப்புடன் நெருக்கமாக தொடர்புடையது. எடுத்துக்காட்டாக, ராம்ப்ளர் இன்டர்நெட் ஹோல்டிங் எல்எல்சி படி, இன்று, வணிக நேரங்களில், ராம்ப்ளர் தேடுபொறி வினாடிக்கு சுமார் 60 கோரிக்கைகளைப் பெறுகிறது. இத்தகைய பணிச்சுமைக்கு தனிப்பட்ட கோரிக்கையின் செயலாக்க நேரத்தைக் குறைக்க வேண்டும். இங்கே பயனர் மற்றும் தேடுபொறியின் நலன்கள் ஒத்துப்போகின்றன: பார்வையாளர் முடிந்தவரை விரைவாக முடிவுகளைப் பெற விரும்புகிறார், மேலும் தேடுபொறி கோரிக்கையை விரைவாகச் செயல்படுத்த வேண்டும், இதனால் அடுத்தடுத்த வினவல்களின் கணக்கீட்டைக் குறைக்க வேண்டாம்.

  • தெரிவுநிலை

4. தேடுபொறிகளின் வளர்ச்சியின் சுருக்கமான வரலாறு

இணைய வளர்ச்சியின் ஆரம்ப காலகட்டத்தில், அதன் பயனர்களின் எண்ணிக்கை சிறியதாக இருந்தது, மேலும் கிடைக்கக்கூடிய தகவல்களின் அளவு ஒப்பீட்டளவில் சிறியதாக இருந்தது. பெரும்பாலும், ஆராய்ச்சி ஊழியர்களுக்கு மட்டுமே இணைய அணுகல் இருந்தது. இந்த நேரத்தில், இணையத்தில் தகவல்களைத் தேடும் பணி இப்போது இருப்பதைப் போல அவசரமாக இல்லை.

நெட்வொர்க் தகவல் ஆதாரங்களுக்கான அணுகலை ஒழுங்கமைப்பதற்கான முதல் வழிகளில் ஒன்று, தளங்களின் திறந்த கோப்பகங்களை உருவாக்குவது, தலைப்புக்கு ஏற்ப தொகுக்கப்பட்ட ஆதாரங்களுக்கான இணைப்புகள். 1994 ஆம் ஆண்டு வசந்த காலத்தில் திறக்கப்பட்ட Yahoo.com வலைத்தளம் அத்தகைய முதல் திட்டமாகும். பட்டியலில் உள்ள தளங்களின் எண்ணிக்கை கணிசமாக அதிகரித்த பிறகு, பட்டியலில் தேவையான தகவல்களைத் தேடும் திறன் சேர்க்கப்பட்டது. முழு அர்த்தத்தில், இது இன்னும் ஒரு தேடுபொறியாக இல்லை, ஏனெனில் தேடல் பகுதி பட்டியலில் உள்ள வளங்களுக்கு மட்டுமே வரையறுக்கப்பட்டுள்ளது, மேலும் அனைத்து இணைய ஆதாரங்களுக்கும் அல்ல.

இணைப்பு அடைவுகள் கடந்த காலத்தில் பரவலாகப் பயன்படுத்தப்பட்டன, ஆனால் தற்போது அவற்றின் பிரபலத்தை முற்றிலும் இழந்துவிட்டன. நவீன பட்டியல்கள் கூட, பெரிய அளவில், இணையத்தின் மிகக் குறைவான பகுதியைப் பற்றிய தகவல்களை மட்டுமே கொண்டிருக்கின்றன. DMOZ நெட்வொர்க்கின் மிகப்பெரிய அடைவு (திறந்த அடைவு திட்டம் என்றும் அழைக்கப்படுகிறது) 5 மில்லியன் ஆதாரங்களைப் பற்றிய தகவல்களைக் கொண்டுள்ளது, அதே நேரத்தில் Google தேடுபொறி தரவுத்தளமானது 8 பில்லியனுக்கும் அதிகமான ஆவணங்களைக் கொண்டுள்ளது.

1995 இல், லைகோஸ் மற்றும் அல்டாவிஸ்டா தேடுபொறிகள் தோன்றின. பிந்தையவர் பல ஆண்டுகளாக இணையத்தில் தகவல் தேடல் துறையில் முன்னணியில் உள்ளார்.

1997 ஆம் ஆண்டில், செர்ஜி பிரின் மற்றும் லாரி பேஜ் ஸ்டான்போர்ட் பல்கலைக்கழகத்தில் ஒரு ஆராய்ச்சி திட்டத்தின் ஒரு பகுதியாக Google தேடுபொறியை உருவாக்கினர். கூகுள் தற்போது உலகில் மிகவும் பிரபலமான தேடுபொறி!

செப்டம்பர் 1997 இல், ரஷ்ய மொழி இணையத்தில் மிகவும் பிரபலமான யாண்டெக்ஸ் தேடுபொறி அதிகாரப்பூர்வமாக அறிவிக்கப்பட்டது.

தற்போது, ​​மூன்று முக்கிய தேடுபொறிகள் (சர்வதேசம்) உள்ளன - கூகுள், யாகூ மற்றும் அவற்றின் சொந்த தரவுத்தளங்கள் மற்றும் தேடல் வழிமுறைகள் உள்ளன. பெரும்பாலான பிற தேடுபொறிகள் (அவற்றில் அதிக எண்ணிக்கையில் உள்ளன) பட்டியலிடப்பட்ட மூன்றின் முடிவுகளை ஒரு வடிவத்தில் அல்லது மற்றொரு வடிவத்தில் பயன்படுத்துகின்றன. எடுத்துக்காட்டாக, AOL தேடல் (search.aol.com) Google தரவுத்தளத்தைப் பயன்படுத்துகிறது, அதே நேரத்தில் AltaVista, Lycos மற்றும் AllTheWeb ஆகியவை Yahoo தரவுத்தளத்தைப் பயன்படுத்துகின்றன.

5. தேடல் அமைப்பின் செயல்பாட்டின் கலவை மற்றும் கொள்கைகள்

ரஷ்யாவில், முக்கிய தேடுபொறி யாண்டெக்ஸ் ஆகும், அதைத் தொடர்ந்து Rambler.ru, Google.ru, Aport.ru, Mail.ru. மேலும், இந்த நேரத்தில், Mail.ru யாண்டெக்ஸ் தேடுபொறி மற்றும் தரவுத்தளத்தைப் பயன்படுத்துகிறது.

ஏறக்குறைய அனைத்து முக்கிய தேடுபொறிகளும் அவற்றின் சொந்த அமைப்பைக் கொண்டுள்ளன, மற்றவற்றிலிருந்து வேறுபட்டவை. இருப்பினும், அனைத்து தேடுபொறிகளுக்கும் பொதுவான முக்கிய கூறுகளை அடையாளம் காண முடியும். கட்டமைப்பில் உள்ள வேறுபாடுகள் இந்த கூறுகளின் தொடர்பு வழிமுறைகளை செயல்படுத்தும் வடிவத்தில் மட்டுமே இருக்க முடியும்.

அட்டவணைப்படுத்தல் தொகுதி

அட்டவணைப்படுத்தல் தொகுதி மூன்று துணை நிரல்களைக் கொண்டுள்ளது (ரோபோக்கள்):

ஸ்பைடர் என்பது இணையப் பக்கங்களைப் பதிவிறக்க வடிவமைக்கப்பட்ட ஒரு நிரலாகும். சிலந்தி பக்கத்தைப் பதிவிறக்குகிறது மற்றும் அந்தப் பக்கத்திலிருந்து அனைத்து உள் இணைப்புகளையும் மீட்டெடுக்கிறது. ஒவ்வொரு பக்கத்தின் html குறியீடு பதிவிறக்கம் செய்யப்படுகிறது. பக்கங்களைப் பதிவிறக்குவதற்கு ரோபோக்கள் HTTP நெறிமுறைகளைப் பயன்படுத்துகின்றன. சிலந்தி பின்வருமாறு செயல்படுகிறது. ரோபோ "get/path/document" கோரிக்கையையும் வேறு சில HTTP கோரிக்கை கட்டளைகளையும் சேவையகத்திற்கு அனுப்புகிறது. பதிலுக்கு, ரோபோ சேவைத் தகவல் மற்றும் ஆவணம் அடங்கிய உரை ஸ்ட்ரீமைப் பெறுகிறது.

  • பக்க URL
  • பக்கம் பதிவிறக்கம் செய்யப்பட்ட தேதி
  • சர்வர் பதில் http தலைப்பு
  • பக்க உடல் (html குறியீடு)

கிராலர் ("பயணம்" சிலந்தி) என்பது பக்கத்தில் காணப்படும் அனைத்து இணைப்புகளையும் தானாகப் பின்தொடரும் ஒரு நிரலாகும். பக்கத்தில் இருக்கும் அனைத்து இணைப்புகளையும் தேர்ந்தெடுக்கிறது. இணைப்புகள் அல்லது முன்னரே தீர்மானிக்கப்பட்ட முகவரிகளின் பட்டியலின் அடிப்படையில் சிலந்தி அடுத்து எங்கு செல்ல வேண்டும் என்பதை தீர்மானிப்பதே இதன் வேலை. Crawler, கிடைத்த இணைப்புகளைப் பின்பற்றி, தேடுபொறிக்கு இன்னும் தெரியாத புதிய ஆவணங்களைத் தேடுகிறது.

இன்டெக்ஸர் (ரோபோ இன்டெக்ஸர்) என்பது சிலந்திகளால் பதிவிறக்கம் செய்யப்பட்ட வலைப்பக்கங்களை பகுப்பாய்வு செய்யும் ஒரு நிரலாகும். குறியீட்டாளர் பக்கத்தை அதன் கூறு பகுதிகளாக அலசுகிறது மற்றும் அதன் சொந்த சொற்களஞ்சியம் மற்றும் உருவவியல் வழிமுறைகளைப் பயன்படுத்தி அவற்றை பகுப்பாய்வு செய்கிறது. உரை, தலைப்புகள், இணைப்புகள், கட்டமைப்பு மற்றும் பாணி அம்சங்கள், சிறப்பு சேவை HTML குறிச்சொற்கள் போன்ற பல்வேறு பக்க கூறுகள் பகுப்பாய்வு செய்யப்படுகின்றன.

எனவே, அட்டவணைப்படுத்தல் தொகுதியானது, இணைப்புகளைப் பயன்படுத்தி கொடுக்கப்பட்ட ஆதாரங்களின் தொகுப்பை வலைவலம் செய்யவும், எதிர்ப்பட்ட பக்கங்களைப் பதிவிறக்கவும், பெறப்பட்ட ஆவணங்களிலிருந்து புதிய பக்கங்களுக்கான இணைப்புகளைப் பிரித்தெடுக்கவும் மற்றும் இந்த ஆவணங்களின் முழுமையான பகுப்பாய்வு செய்யவும் உங்களை அனுமதிக்கிறது.

தரவுத்தளம்

ஒரு தரவுத்தளம், அல்லது தேடுபொறி குறியீட்டு, ஒரு தரவு சேமிப்பு அமைப்பு, ஒரு தகவல் வரிசை, இதில் அட்டவணைப்படுத்தல் தொகுதி மூலம் பதிவிறக்கம் மற்றும் செயலாக்கப்பட்ட அனைத்து ஆவணங்களின் சிறப்பாக மாற்றப்பட்ட அளவுருக்கள் சேமிக்கப்படும்.

தேடல் சர்வர்

தேடல் சேவையகம் முழு அமைப்பின் மிக முக்கியமான உறுப்பு, ஏனெனில் தேடலின் தரம் மற்றும் வேகம் நேரடியாக அதன் செயல்பாட்டின் அடிப்படையிலான வழிமுறைகளைப் பொறுத்தது.

தேடல் சேவையகம் பின்வருமாறு செயல்படுகிறது:

  • பயனரிடமிருந்து பெறப்பட்ட கோரிக்கை உருவவியல் பகுப்பாய்வுக்கு உட்பட்டது. தரவுத்தளத்தில் உள்ள ஒவ்வொரு ஆவணத்தின் தகவல் சூழலும் உருவாக்கப்படுகிறது (அது பின்னர் படிவத்தில் காட்டப்படும், அதாவது, தேடல் முடிவுகள் பக்கத்தில் உள்ள கோரிக்கையுடன் தொடர்புடைய உரை தகவல்).
  • பெறப்பட்ட தரவு உள்ளீட்டு அளவுருக்களாக ஒரு சிறப்பு தரவரிசை தொகுதிக்கு அனுப்பப்படுகிறது. எல்லா ஆவணங்களுக்கும் தரவு செயலாக்கப்படுகிறது, இதன் விளைவாக ஒவ்வொரு ஆவணத்திற்கும் அதன் சொந்த மதிப்பீடு உள்ளது, இது பயனர் உள்ளிட்ட வினவலின் பொருத்தத்தையும் தேடுபொறி குறியீட்டில் சேமிக்கப்பட்ட இந்த ஆவணத்தின் பல்வேறு கூறுகளையும் வகைப்படுத்துகிறது.
  • பயனரின் விருப்பத்தைப் பொறுத்து, இந்த மதிப்பீட்டை கூடுதல் நிபந்தனைகளால் சரிசெய்யலாம் (உதாரணமாக, "மேம்பட்ட தேடல்" என்று அழைக்கப்படுபவை).
  • அடுத்து, ஒரு துணுக்கு உருவாக்கப்படுகிறது, அதாவது, கண்டுபிடிக்கப்பட்ட ஒவ்வொரு ஆவணத்திற்கும், தலைப்பு, வினவலுடன் பொருந்தக்கூடிய ஒரு சுருக்கமான சுருக்கம் மற்றும் ஆவணத்திற்கான இணைப்பு ஆகியவை ஆவண அட்டவணையில் இருந்து பிரித்தெடுக்கப்படுகின்றன, மேலும் கண்டுபிடிக்கப்பட்ட சொற்கள் முன்னிலைப்படுத்தப்படுகின்றன.
  • இதன் விளைவாக வரும் தேடல் முடிவுகள் பயனருக்கு SERP (தேடல் பொறி முடிவு பக்கம்) வடிவத்தில் அனுப்பப்படும் - ஒரு தேடல் முடிவுகள் பக்கம்.

நீங்கள் பார்க்க முடியும் என, இந்த கூறுகள் அனைத்தும் ஒன்றோடொன்று நெருக்கமாக தொடர்புடையவை மற்றும் தொடர்புகளில் செயல்படுகின்றன, தேடல் அமைப்பின் செயல்பாட்டிற்கான தெளிவான, மாறாக சிக்கலான பொறிமுறையை உருவாக்குகின்றன, இதற்கு அதிக அளவு வளங்கள் தேவைப்படுகின்றன.

6. முடிவு

இப்போது மேலே உள்ள அனைத்தையும் சுருக்கமாகக் கூறுவோம்.

  • எந்தவொரு தேடுபொறியின் முதன்மையான குறிக்கோள், அவர்கள் தேடும் தகவலைத் துல்லியமாக மக்களுக்கு வழங்குவதாகும்.
  • தேடுபொறிகளின் முக்கிய பண்புகள்:
    1. முழுமை
    2. துல்லியம்
    3. சம்பந்தம்
    4. தேடல் வேகம்
    5. தெரிவுநிலை
  • 1994 இல் வெளியிடப்பட்ட WebCrawler திட்டமானது முதல் முழு அளவிலான தேடுபொறியாகும்.
  • தேடல் அமைப்பு பின்வரும் கூறுகளை உள்ளடக்கியது:
    1. அட்டவணைப்படுத்தல் தொகுதி
    2. தரவுத்தளம்
    3. தேடல் சர்வர்

தேடுபொறியின் கருத்தை நீங்கள் நன்கு அறிந்திருக்கவும், தேடுபொறிகளின் முக்கிய செயல்பாடுகள், பண்புகள் மற்றும் இயக்கக் கொள்கைகளை நன்கு புரிந்துகொள்ளவும் எங்கள் முதன்மை வகுப்பு உங்களை அனுமதிக்கும் என்று நம்புகிறோம்.

வணக்கம் அன்பு நண்பர்களே! இந்த கட்டுரையில் நாங்கள் யாண்டெக்ஸ் தேடுபொறியைப் பார்ப்போம், நீங்கள் நினைவில் வைத்திருப்பது போல், முந்தைய கட்டுரைகளில் ரஷ்யாவிலும் அதற்கு அப்பாலும் உள்ள அதன் போட்டியாளர்களிடையே முதல் இடத்தைப் பிடித்த இந்த சிறந்த நிறுவனத்தின் வரலாற்றைப் பற்றி விவாதித்தோம்.

இவை அனைத்தும் நல்லது, ஆனால் ஆரம்ப மற்றும் அனுபவம் வாய்ந்த தள உருவாக்குநர்கள் மிக முக்கியமான கேள்வியில் ஆர்வமாக உள்ளனர், நிச்சயமாக, தங்கள் திட்டங்களை TOP தேடல் முடிவுகளில் முதல் இடங்களுக்கு எவ்வாறு கொண்டு வருவது என்பது தொடர்பானது.

எனவே, நீங்கள் என்ன தவறுகளை செய்ய முடியும், பொதுவாக ரஷ்ய தேடுபொறியிலிருந்து என்ன எதிர்பார்க்கலாம் என்பதைப் புரிந்துகொள்ள யாண்டெக்ஸ் தேடுபொறி எவ்வாறு செயல்படுகிறது என்பதைப் பார்ப்போம்.

கடந்த கட்டுரையில் நாம் விவாதித்தோம். தலைப்பு மிகவும் சுவாரஸ்யமானதாகவும் பயனுள்ளதாகவும் மாறியது. எனவே, அதை நிரப்பவும், ஆழப்படுத்தவும், பேசவும் முடிவு செய்தேன்.

எனவே, "ஏன் ஒரு தேடுபொறி குறியீட்டு ஆவணங்கள்" என்ற கேள்வியை நான் கொஞ்சம் கொஞ்சமாக எடுத்துக்கொண்டேன்? "எப்படி" என்ற கேள்வியைக் கண்டுபிடிப்பது மட்டுமே எஞ்சியுள்ளது.

இணையதள தரவரிசை அல்காரிதம்கள்

முதலில், எந்தவொரு தேடுபொறிக்கும் அடிப்படையான சில அல்காரிதங்களைப் பற்றி அறிந்து கொள்வோம்:

- நேரடி தேடல் அல்காரிதம்.

அது என்ன - ஒரு புத்தகத்தில் ஒரு அற்புதமான கதையைப் படித்தது உங்களுக்கு நினைவிருக்கிறது. நீங்கள் ஒவ்வொன்றாக பார்க்க ஆரம்பிக்கிறீர்கள். அவர்கள் ஒரு புத்தகத்தை எடுத்து, அதைப் பார்த்தார்கள், கண்டுபிடிக்கவில்லை, இன்னொன்றை எடுத்தார்கள்... கொள்கை தெளிவாக உள்ளது, ஆனால் இந்த முறை மிகவும் நீளமானது. இதுவும் புரியும்.

- தலைகீழ் தேடல் அல்காரிதம்.

இந்த அல்காரிதத்திற்காக, உங்கள் வலைப்பதிவின் ஒவ்வொரு பக்கத்திலிருந்தும் ஒரு உரைக் கோப்பு உருவாக்கப்படும். இந்த கோப்பு நீங்கள் பயன்படுத்திய அனைத்து வார்த்தைகளையும் அகரவரிசையில் பட்டியலிடுகிறது. உரையில் இந்த வார்த்தையின் நிலை கூட சுட்டிக்காட்டப்படுகிறது (உரையில் உள்ள ஒருங்கிணைப்புகள்).

இது மிகவும் வேகமான முறையாகும், ஆனால் தேடல் ஏற்கனவே சில பிழைகளுடன் நிகழ்கிறது.

இங்கே முக்கியமாகப் புரிந்து கொள்ள வேண்டியது என்னவென்றால், இந்த அல்காரிதம் இணையத்தில் தேடுவதில்லை, வலைப்பதிவில் தேடுவதன் மூலம் அல்ல. மற்றும் நீண்ட காலத்திற்கு முன்பு உருவாக்கப்பட்ட ஒரு தனி உரை கோப்பில். ரோபோ உங்களிடம் வந்ததும். இந்த கோப்புகள் (தலைகீழ் குறியீடுகள்) Yandex சேவையகங்களில் சேமிக்கப்படுகின்றன.

எனவே, இவை அடிப்படை தேடல் வழிமுறைகள். அந்த. தேவையான ஆவணங்களை யாண்டெக்ஸ் எவ்வாறு கண்டுபிடிப்பது. இதில் எந்த பிரச்சனையும் இருப்பதாக தெரியவில்லை.

ஆனால் யாண்டெக்ஸுக்கு ஒன்று அல்லது 100 ஆவணங்களுக்கு மேல் தெரியும், ஆனால் எனது ஆதாரங்களின் சமீபத்திய தரவுகளின்படி, யாண்டெக்ஸுக்கு சுமார் 11 பில்லியன் ஆவணங்கள் (10,727,736,489 பக்கங்கள்) தெரியும்.

இந்த அளவுகளில், கோரிக்கையுடன் பொருந்தக்கூடிய ஆவணங்களை நீங்கள் தேர்ந்தெடுக்க வேண்டும். மேலும் முக்கியமாக, நீங்கள் எப்படியாவது அவற்றை வரிசைப்படுத்த வேண்டும். அந்த. முக்கியத்துவத்தின் படி, அல்லது வாசகருக்குப் பயன்படும் அளவிற்கு ஏற்ப ஏற்பாடு செய்யுங்கள்.

கணித தேடல் மாதிரிகள்

இந்த சிக்கலை தீர்க்க, கணித மாதிரிகள் மீட்புக்கு வருகின்றன. இப்போது நாம் எளிமையான மாதிரிகள் பற்றி பேசுவோம்.

பூலியன் கணித மாதிரி- ஒரு ஆவணத்தில் ஒரு வார்த்தை தோன்றினால், ஆவணம் கண்டுபிடிக்கப்பட்டதாகக் கருதப்படுகிறது. ஒரு தற்செயல் மற்றும் சிக்கலான எதுவும் இல்லை.

ஆனால் இங்கே பிரச்சினைகள் உள்ளன. எடுத்துக்காட்டாக, நீங்கள் ஒரு பயனராக, சில பிரபலமான வார்த்தைகளை உள்ளிட்டால், அல்லது இன்னும் சிறப்பாக, ரஷ்ய மொழியில் மிகவும் பொதுவான வார்த்தையான "v" என்ற முன்னுரையை உள்ளிட்டால், ஒவ்வொரு ஆவணத்திலும் உங்களுக்கு பல முடிவுகள் வழங்கப்படும். அத்தகைய எண்ணை நீங்கள் உணரவில்லை, எத்தனை ஆவணங்களைக் கண்டுபிடித்தீர்கள்? எனவே, பின்வரும் பாய் மாதிரி தோன்றியது.

திசையன் கணித மாதிரி- இந்த மாதிரி ஆவணத்தின் "எடையை" தீர்மானிக்கிறது. தற்செயல் நிகழ்வது மட்டுமல்ல, வார்த்தை பல முறை வர வேண்டும். மேலும், ஒரு சொல் எவ்வளவு அதிகமாகத் தோன்றுகிறதோ, அந்த அளவுக்குப் பொருத்தம் (இணக்கம்) அதிகமாகும்.

இது அனைத்து தேடுபொறிகளும் பயன்படுத்தும் திசையன் மாதிரி.

நிகழ்தகவு மாதிரி- மிகவும் சிக்கலானது. கொள்கை இதுதான்: தேடுபொறி பக்க டெம்ப்ளேட்டைக் கண்டுபிடித்தது. எடுத்துக்காட்டாக, நீங்கள் Yandex இன் வரலாறு பற்றிய தகவல்களைத் தேடுகிறீர்கள். Yandex சில வகையான தரநிலைகளை சேமிக்கிறது, இது Yandex பற்றிய எனது முந்தைய கட்டுரையாக இருக்கும் என்று சொல்லலாம்.

மேலும் மற்ற எல்லா ஆவணங்களையும் இந்தக் கட்டுரையுடன் ஒப்பிட்டுப் பார்ப்பார். இங்கே உள்ள தர்க்கம் இதுதான்: உங்கள் வலைப்பதிவுப் பக்கம் எனது கட்டுரைக்கு எவ்வளவு ஒத்திருக்கிறது, உங்கள் வலைப்பதிவுப் பக்கமும் வாசகருக்கு பயனுள்ளதாக இருக்கும், மேலும் Yandex இன் வரலாற்றைப் பற்றியும் கூறுகிறது.

பயனருக்குக் காட்டப்பட வேண்டிய ஆவணங்களின் எண்ணிக்கையைக் குறைக்க, பொருத்தம் என்ற கருத்து அறிமுகப்படுத்தப்பட்டது, அதாவது. இணக்கம்.

உங்கள் வலைப்பதிவு பக்கம் தலைப்புக்கு எவ்வளவு பொருத்தமானது? தேடலின் தரத்தைப் பொறுத்தவரை இது ஒரு முக்கியமான தலைப்பு.

மதிப்பீட்டாளர்கள் - அவர்கள் யார், எதற்கு அவர்கள் பொறுப்பு?

அல்காரிதம்களின் தரத்தை மதிப்பிடுவதற்கும் இந்தப் பொருத்தம் தேவைப்படுகிறது.

இந்த நோக்கத்திற்காக ஒரு சிறப்புப் படைகளின் தலைமையகம் உள்ளது - அவர்கள் மதிப்பீட்டாளர்கள் என்று அழைக்கப்படுகிறார்கள். இவர்கள் தங்கள் கைகளால் தேடல் முடிவுகளைப் பார்க்கும் சிறப்பு நபர்கள்.

தளங்களை எவ்வாறு சரிபார்ப்பது, எவ்வாறு மதிப்பீடு செய்வது போன்றவற்றைப் பற்றிய வழிமுறைகள் அவர்களிடம் உள்ளன. உங்கள் பக்கங்கள் தேடல் வினவல்களுக்கு ஏற்றதா இல்லையா என்பதை அவர்கள் கைமுறையாக தீர்மானிக்கிறார்கள்.

மேலும் தேடல் அல்காரிதம்களின் தரம் மதிப்பீட்டாளர்களின் கருத்தைப் பொறுத்தது. தேடல் முடிவுகள் கோரிக்கைகளுடன் பொருந்தவில்லை என்று அனைத்து மதிப்பீட்டாளர்களும் கூறினால், தரவரிசை வழிமுறை தவறானது மற்றும் யாண்டெக்ஸ் மட்டுமே குற்றம் சாட்ட வேண்டும்.

ஒரே ஒரு தளம் கோரிக்கையை பூர்த்தி செய்யவில்லை என்று மதிப்பீட்டாளர்கள் கூறினால், அந்த தளம் எங்காவது தொலைவில் பறந்து தேடல் முடிவுகளில் குறைக்கப்பட்டுள்ளது என்று அர்த்தம். இன்னும் துல்லியமாக, முழு தளமும் அல்ல, ஆனால் ஒரே ஒரு கட்டுரை மட்டுமே, ஆனால் இது "புள்ளி அல்ல."

நிச்சயமாக, மதிப்பீட்டாளர்கள் தங்கள் கைகள் மற்றும் கண்களால் அனைத்து கட்டுரைகளையும் மதிப்பாய்வு செய்து மதிப்பீடு செய்ய முடியாது. இது புரிந்துகொள்ளத்தக்கது.

பக்கங்கள் தரவரிசைப்படுத்தப்பட்ட பிற அளவுருக்கள் மீட்புக்கு வருகின்றன.

அவற்றில் நிறைய உள்ளன, எடுத்துக்காட்டாக:

  • பக்க எடை (vIC, பேஜ் தரவரிசை, குழந்தை புடைப்புகள்மொத்தத்தில்);
  • டொமைன் அதிகாரம்;
  • கோரிக்கைக்கு உரையின் பொருத்தம்;
  • வினவலுக்கு வெளிப்புற இணைப்பு உரைகளின் பொருத்தம்;
  • அத்துடன் பல தரவரிசை காரணிகள்.

மதிப்பீட்டாளர்கள் கருத்துகளைத் தெரிவிக்கிறார்கள், மேலும் கணித தரவரிசை மாதிரியை அமைப்பதற்குப் பொறுப்பான நபர்கள் சூத்திரத்தைத் திருத்துகிறார்கள், இதன் விளைவாக தேடுபொறி மிகவும் திறமையாக செயல்படுகிறது.

சூத்திரத்தின் செயல்திறனை மதிப்பிடுவதற்கான முக்கிய அளவுகோல்கள்:

1. தேடுபொறி முடிவுகளின் துல்லியம்- கோரிக்கையுடன் பொருந்தக்கூடிய ஆவணங்களின் சதவீதம் (தொடர்புடையது). அந்த. கோரிக்கையுடன் பொருந்தாத குறைவான பக்கங்கள், சிறந்தது.

2. தேடுபொறி முடிவுகளின் முழுமை- இது சேகரிப்பில் உள்ள தொடர்புடைய ஆவணங்களின் மொத்த எண்ணிக்கையுடன் கொடுக்கப்பட்ட வினவலுக்கான தொடர்புடைய வலைப்பக்கங்களின் விகிதமாகும் (தேடுபொறியில் காணப்படும் பக்கங்களின் மொத்த எண்ணிக்கை).

எடுத்துக்காட்டாக, தேடல் முடிவுகளைக் காட்டிலும் முழுத் தொகுப்பிலும் தொடர்புடைய பக்கங்கள் இருந்தால், முடிவுகள் முழுமையடையவில்லை என்று அர்த்தம். தொடர்புடைய சில இணையப் பக்கங்கள் வடிகட்டப்பட்டதால் இது நடந்தது.

3. தேடுபொறி முடிவுகளின் பொருத்தம்- இது துணுக்கில் எழுதப்பட்டவற்றுடன் இணையப் பக்கத்தின் இணக்கம். எடுத்துக்காட்டாக, ஒரு ஆவணம் மிகவும் வித்தியாசமாக இருக்கலாம் அல்லது இல்லாமலும் இருக்கலாம், ஆனால் தேடல் முடிவுகளில் அது இருக்கும்.

தேடல் முடிவுகளின் பொருத்தம், தேடல் ரோபோ அதன் சேகரிப்பிலிருந்து ஆவணங்களை எவ்வளவு அடிக்கடி ஸ்கேன் செய்கிறது என்பதைப் பொறுத்தது.

சேகரிப்பு சேகரிப்பு (தள பக்கங்களின் அட்டவணைப்படுத்தல்) ஒரு சிறப்பு நிரலால் மேற்கொள்ளப்படுகிறது - ஒரு தேடல் ரோபோ.

தேடல் ரோபோ அட்டவணையிடுவதற்கான முகவரிகளின் பட்டியலைப் பெறுகிறது, அவற்றை நகலெடுக்கிறது, பின்னர் நகலெடுக்கப்பட்ட வலைப்பக்கங்களின் உள்ளடக்கங்களை செயலாக்கத்திற்கான ஒரு அல்காரிதத்திற்கு அனுப்புகிறது.

சரி, "சுருக்கமாக," பேசுவதற்கு, தேடுபொறியின் கொள்கைகளை நாங்கள் விவாதித்தோம்.

சுருக்கமாகக் கூறுவோம்:

  1. ஒரு தேடல் ரோபோ உங்கள் வலைப்பதிவிற்கு வருகிறது.
  2. தேடல் ரோபோ அடுத்தடுத்த தேடல்களுக்கு பக்கத்தின் தலைகீழ் குறியீட்டை சேமிக்கிறது.
  3. ஒரு கணித மாதிரியைப் பயன்படுத்தி, ஆவணம் செயலாக்கப்பட்டு, சூத்திரங்களைப் பயன்படுத்தி தேடல் முடிவுகளில் காட்டப்படும் மற்றும் மதிப்பீட்டாளரின் கருத்தை கணக்கில் எடுத்துக்கொள்கிறது.

இது மிக மிக எளிமைப்படுத்தப்பட்டுள்ளது. யாண்டெக்ஸ் தேடுபொறி எவ்வாறு செயல்படுகிறது என்பதைப் பற்றிய அடிப்படை புரிதலைப் பெறுவதற்கு.

நான் இப்போது நிறைய உரை எழுதியுள்ளேன், ஒருவேளை இவ்வளவு தெளிவாக இல்லை. எனவே, சிறிது நேரம் கழித்து இந்த கட்டுரைக்குத் திரும்பி இந்த வீடியோவைப் பார்க்க பரிந்துரைக்கிறேன்.

இது ஒரு சிறந்த வழிகாட்டி, நானும் ஒரு காலத்தில் கற்றுக்கொண்டேன்.

உங்கள் தளங்களில் ஒன்று ஏன் தேடல்களில் பொருத்தமான நிலைகளை ஆக்கிரமித்துள்ளது என்பதை நன்கு புரிந்துகொள்ளவும், அவற்றை மேம்படுத்த எல்லாவற்றையும் செய்யவும் இந்தத் தகவல் உங்களுக்கு உதவும் என்று நம்புகிறேன்.

இத்துடன் நான் உங்களிடம் விடைபெறுகிறேன், உங்களிடம் ஏதேனும் கேள்விகள் இருந்தால், கருத்துகளில் அவர்களுக்கு பதிலளிப்பதில் நான் எப்போதும் மகிழ்ச்சியடைகிறேன். அல்லது கட்டுரையில் சேர்க்க வேண்டுமா?

எப்படியிருந்தாலும், உங்கள் கருத்தை வெளிப்படுத்துங்கள். !

நாங்கள் நினைப்பது போல் நாங்கள் தனித்துவம் வாய்ந்தவர்கள் அல்ல: எங்களுக்கு முன் மில்லியன் கணக்கான மக்கள் குழப்பமடைந்தனர், எங்களுக்குப் பின் மில்லியன் கணக்கானவர்கள் தேடுபொறியை கிட்டத்தட்ட ஒரே மாதிரியான கேள்விகளுடன் குழப்புவார்கள். மறுபுறம், நாங்கள் மிகவும் கணிக்க முடியாதவர்கள்: எங்கள் கோரிக்கையின் உருவாக்கம் எங்களுக்குத் தெரியாத பல காரணிகளால் பாதிக்கப்படுகிறது. குறைந்தபட்சம் இந்த காரணத்திற்காக, நம் ஒவ்வொருவரின் கோரிக்கையும், அது எவ்வளவு சாதாரணமானதாக இருந்தாலும், ஒரு தனிப்பட்ட அணுகுமுறை தேவைப்படுகிறது.

உண்மையில், யாண்டெக்ஸ் தேடுபொறியின் முழு வேலையும் இரண்டு எளிய விஷயங்களுக்கு வருகிறது: ஒரு நபர் உண்மையில் என்ன தெரிந்து கொள்ள விரும்புகிறார் என்பதைப் புரிந்துகொள்வதற்கும், சில நொடிகளில் இணையத்தில் பில்லியன் கணக்கான ஆவணங்களில் பொருத்தமானவற்றைக் கண்டுபிடிப்பதற்கும்.

கைரேகைகளை எடுக்கவும்

தேடுபொறியின் இயக்க முறைமை மேட்ரிக்ஸைப் போலவே உள்ளது, மேலும் தேடல் ரோபோ (அது உருவாக்கிய சிக்கலான, சுயாதீனமாக முடிவெடுக்கும் திட்டம்) ஏஜென்ட் ஸ்மித் போன்றது.

ஒவ்வொரு முறையும் யாராவது எதையாவது தெரிந்து கொள்ள வேண்டியிருக்கும் போது முழு இணையத்தையும் தேடக்கூடாது என்பதற்காக, தேடுபொறியானது வேலையின் ஒரு பகுதியை முன்கூட்டியே செய்கிறது - ஆயிரக்கணக்கான தேடல் ரோபோக்களைப் பயன்படுத்தி, இணையத்தில் என்ன இருக்கிறது, அது எங்குள்ளது என்பதைச் சரிபார்க்கிறது. அவை இரண்டு வகைகளில் வருகின்றன: அடிப்படை மற்றும் வேகமாக. முக்கியமானது இணையத்தை முழுவதுமாக வலம் வந்து செயலாக்குகிறது, மேலும் வேகமானது - ஒரு நிமிடம் அல்லது சில வினாடிகளுக்கு முன்பு தோன்றிய ஆவணங்கள். ரோபோ நிரல்களின் பணி பயனர்களுக்கு பொருத்தமான மற்றும் பயனுள்ள தகவல்களைத் தேர்ந்தெடுத்து, அதைச் செயலாக்குவது, காலாவதியான மற்றும் தேவையற்ற அனைத்தையும் களையெடுப்பதாகும். சில வழிகளில், இது குப்பைகளை வரிசைப்படுத்துவதை நினைவூட்டுகிறது: ஒரு கொள்கலனில் காகிதம், மற்றொன்றில் கண்ணாடி, மூன்றில் பிளாஸ்டிக், நான்காவது இடத்தில் உணவு கழிவுகள்...

ரோபோக்களால் சேகரிக்கப்பட்ட தகவல்கள் இணைய நடிகர்கள் என்று அழைக்கப்படுகின்றன. இது ஆயிரக்கணக்கான யாண்டெக்ஸ் சேவையகங்களில் சேமிக்கப்பட்டு தொடர்ந்து புதுப்பிக்கப்படுகிறது. ஒரு நகட் என்பது ஒரு பட்டியலைப் போன்றது, அது எந்த தகவலை எங்கே கண்டுபிடிப்பது என்று உங்களுக்குச் சொல்லும். இந்த பட்டியலில், ஒவ்வொரு முக்கிய வார்த்தையும் ஒன்று இல்லை, ஆனால் மில்லியன் கணக்கான "பக்கங்கள்". அனைத்து நகட் புதுப்பிப்புகளும் பயனர்களுக்கு கிடைக்கின்றன என்பதை உறுதிப்படுத்த, அவை களஞ்சியத்திலிருந்து "அடிப்படை தேடலுக்கு" நகர்த்தப்படும். முக்கிய ரோபோவிலிருந்து தரவு ஒவ்வொரு சில நாட்களுக்கும், வேகமான ரோபோவிலிருந்து - உண்மையான நேரத்தில் மாற்றப்படும்.

சுத்தமான தண்ணீருக்கு கொண்டு வாருங்கள்



விளக்கம்: எவ்ஜெனி டோங்கனாஜி

தயாரிக்கப்பட்ட தரவுத்தளத்தில் கொடுக்கப்பட்ட கேள்விக்கான பதிலைத் தேடும் போது, ​​இயந்திரம் இரண்டு முக்கிய சிரமங்களை எதிர்கொள்கிறது. முதல் சிரமம் மொழி. ஒரு கேள்விக்கான பதிலைத் தேடுவதற்கு முன், இயந்திரம் எந்த மொழியில் அவ்வாறு செய்ய வேண்டும் என்பதைப் புரிந்துகொள்வது முக்கியம். எடுத்துக்காட்டாக, ரஷ்ய மொழி பேசும் நபருக்கு, “இளவரசர் இகோரின் அணி” என்ற தேடலில் இராணுவத்தைப் பற்றிய தகவல்களுடன் ஆவணங்கள் கிடைக்கும், மேலும் உக்ரேனியருக்கு, “இளவரசர் இகோரின் அணி” அவரது மனைவி இளவரசி ஓல்காவைக் குறிப்பிடும் ஆவணங்களையும் வழங்கும். உக்ரேனிய மொழியில் "மனைவி" என்பது "அணி". பணக்கார ரஷ்ய மொழியில், ஒரே சொல் அல்லது அதன் வழித்தோன்றல்கள் வெவ்வேறு விஷயங்களைக் குறிக்கும். எடுத்துக்காட்டாக, "எஃகு" என்ற சொல் "எஃகு" என்ற பெயர்ச்சொல் மற்றும் "ஆக" என்ற வினைச்சொல்லின் வடிவங்களில் ஒன்றாகும். இரண்டாவது சிரமம் மனித உளவியல். ஒரு கோரிக்கையை உள்ளிடும்போது, ​​​​கோரிக்கையின் வார்த்தைகள் இயந்திரத்தின் மூளை செயல்படும் கணிதப் பகுப்பாய்வின் கொள்கைகளுடன் ஒத்துப்போகிறதா என்பதைப் பற்றி இயற்கையாகவே கவலைப்படாமல், விரைவான மற்றும் துல்லியமான பதிலை எதிர்பார்க்கிறோம். உதாரணமாக, தேடல் பட்டியில் "நெப்போலியன்" என்ற வார்த்தையை உள்ளிடுவதன் மூலம், ஒரு நபர் எதைப் பெற விரும்புகிறார்: ஒரு கேக் செய்முறை அல்லது பிரெஞ்சு பேரரசரின் சுயசரிதை, காக்னாக் வாங்கவா அல்லது மனநல மருத்துவமனையின் முகவரியைக் கண்டுபிடிக்கவா?


இத்தகைய சூழ்நிலைகளில், பல தொழில்நுட்பங்கள் செயல்படுகின்றன. உங்கள் கோரிக்கையைக் குறிப்பிடும் தேடல் பட்டியின் கீழ் நீங்கள் பல குறிப்புகளை வழங்கலாம். உங்களுக்குத் தேவையானதைத் தேர்வுசெய்யவும்: நெப்போலியன் சமையல் அல்லது நெப்போலியன் - போனபார்டே. பயனர் இயந்திரத்தின் கோரிக்கைக்கு பதிலளிக்கவில்லை மற்றும் "நெப்போலியன்" இல் வார்த்தைகளைச் சேர்க்கவில்லை என்றால், "ஸ்பெக்ட்ரம்" தொழில்நுட்பம் இந்த விஷயத்திற்கு உதவுகிறது: உதவியை எதிர்பார்க்காமல், இயந்திரம் உடனடியாக பல வகைகளில் தகவல்களைத் தேடுகிறது (கேக் பற்றி, மற்றும் பேரரசரைப் பற்றியும், குதிரையைப் பற்றியும்) ..). கூடுதலாக, தனிப்பயனாக்குதல் வழிமுறைகள் பயனரைப் புரிந்துகொள்ள உதவுகின்றன - ஒரு நாள், இரண்டு, மூன்று அல்லது மாதங்களுக்கு முன்பு இந்த பயனர் தனது கணினியில் எதைத் தேடுகிறார் என்பதைப் பற்றிய இயந்திரத்தின் அறிவு: நீங்கள் அடிக்கடி சமைப்பதைப் பற்றி Yandex கேள்விகளைக் கேட்டால், இயந்திரம் முதலில் காண்பிக்கும். நெப்போலியன் ஒரு கேக் என்று சொல்கிறீர்கள்.

சேர்க்கைகள்: வட்டி கிளப்புகள்

தேடல் வினவலில் இருந்து சொற்கள் மற்றும் சொற்றொடர்களைக் கொண்ட ஆவணங்களைத் தேர்ந்தெடுப்பது தேடுபொறியின் பணி அல்ல. எங்களின் முரண்பட்ட தேவைகளை எந்த ஆவணங்கள் பூர்த்தி செய்கின்றன என்பதையும் அவை ஏன் அவற்றைப் பூர்த்தி செய்கின்றன என்பதையும் இயந்திரம் புரிந்து கொள்ள வேண்டும். நெப்போலியன் கேக்கைப் பற்றிய தகவல்களைப் பெற விரும்புகிறீர்களா, அல்லது சில ஆண்டுகளாக பாசாங்குத்தனமான பெயருடன் ஒரு ஃபிட்னஸ் கிளப்பைப் பார்வையிட்டோம், அல்லது குறுகிய நபர்களின் வளாகங்களைப் பற்றி முழுமையாகக் கவலைப்படுகிறோம். எந்தவொரு சந்தர்ப்பத்திலும், சிக்கலைத் தீர்ப்பதற்கு அற்பமான அணுகுமுறை தேவைப்படுகிறது.


Yandex தேடல் நிரலை உருவாக்கியவர்கள் இந்த அணுகுமுறையை இயந்திரத்திற்கு தேர்வு செய்யும் உரிமையை வழங்குவதன் மூலம் கண்டறிந்தனர். ஒருபுறம், ஆன்மா இல்லாத, ஆனால் மிக வேகமான மற்றும் புத்திசாலி இயந்திரம் தனிநபர்களாக நம்மைப் பற்றி எதுவும் தெரியாது மற்றும் தெரிந்து கொள்ள விரும்பவில்லை, மறுபுறம், அது அனைவரையும் பற்றி முடிந்தவரை கண்டுபிடிக்க முயற்சிக்கிறது.

பயனரின் புவியியல் இருப்பிடம் மற்றும் அவரது வினவல்களின் மொழியியல் பகுப்பாய்விற்கு கூடுதலாக, தேடுபொறி மனிதர்களுக்கு வெளிப்படையாக இல்லாத பல ஆயிரம் அளவுகோல்களைப் பயன்படுத்துகிறது.

தந்திரம் என்னவென்றால், இயந்திரம் இந்த அளவுகோல்களை சுயாதீனமாக உருவாக்கி புதுப்பிக்கிறது.

இது மில்லியன் கணக்கான மக்களின் விருப்பத்தேர்வுகள் மற்றும் பயனர் நடத்தை பற்றிய தரவைப் பயன்படுத்துகிறது மற்றும் இந்த "எண்கணித சராசரியை" எங்கள் வினவல்களின் வரலாற்றுடன் தொடர்புபடுத்துகிறது. மேட்ரிக்ஸை தனக்குள்ளேயே வழிநடத்தும் கொள்கைகள், அது உருவாக்கிய ஆயிரக்கணக்கான பயனர் நலன்களை ஒப்பிட்டு, கொள்கையளவில் "ஆர்வங்கள்" என்னவாக இருக்கும் என்பது பற்றிய பாரம்பரிய மனிதக் கருத்துக்களுடன் பெரும்பாலும் பொருந்தாது. பல்லாயிரக்கணக்கானோர் உள்ளனர். அவர்கள் ஒருவருக்கொருவர் வெவ்வேறு, சில நேரங்களில் வேடிக்கையான, சேர்க்கைகளை உருவாக்குகிறார்கள். எடுத்துக்காட்டாக, இந்த சேர்க்கைகளில் ஒன்று, தேடல் முடிவுகள் புதியவைகளை வளர்க்கும் நபரின் நலன்களுடன் பொருந்துவதாக இருக்கலாம். அதே நேரத்தில், ஒரு நபர் நியூட்ஸில் மட்டும் ஆர்வம் காட்டவில்லை, ஆனால் ஏற்கனவே அவற்றை இனப்பெருக்கம் செய்கிறார், ஆனால் முதல் வருடம் மட்டுமே.

மதிப்பீடுகள். உதவும் கரங்கள்


மேட்ரிக்ஸ், நிச்சயமாக, பல்லாயிரக்கணக்கான அளவுகோல்களின் அடிப்படையில் பயனர்களுக்கு என்ன, எந்த வரிசையில் காட்டப்பட வேண்டும் என்பதை (உயர் கணிதத்தின் உதவியுடன்) தீர்மானிக்கிறது. ஆனால் மேட்ரிக்ஸ் உயிருள்ள மக்களையும் பயன்படுத்துகிறது - 1000 யாண்டெக்ஸ் ஊழியர்கள், மதிப்பீட்டாளர்கள் என்று அழைக்கப்படுபவர்கள், ஒரு குறிப்பிட்ட கோரிக்கைக்கான தேடல் முடிவுகளை மதிப்பீடு செய்கிறார்கள் (நிச்சயமாக, ஒவ்வொரு கோரிக்கையும் மதிப்பீடு செய்யப்படுவதில்லை, மேலும் இது உண்மையான நேரத்தில் செய்யப்படுவதில்லை) ஒரு சாதாரண பயனரின் எதிர்பார்ப்புகள்: ஒரு இயந்திரத்தைப் போல பகுத்தறிவு இல்லை, துல்லியமான உருவாக்கம் இல்லை, முரண்பாடானது மற்றும் உணர்ச்சிவசமானது.

நல்ல மதியம், என் எஸ்சிஓ வலைப்பதிவின் அன்பான வாசகர்கள். . என்பது பற்றியது இந்தக் கட்டுரை யாண்டெக்ஸ் தேடுபொறி எவ்வாறு செயல்படுகிறது தளங்களை தரவரிசைப்படுத்த அது என்ன தொழில்நுட்பங்கள் மற்றும் வழிமுறைகளைப் பயன்படுத்துகிறது மற்றும் பயனர்களுக்கு பதிலைத் தயாரிக்க என்ன செய்கிறது. ரஷ்ய தேடலின் இந்த முதன்மையானது Runet இல் தொனியை அமைக்கிறது, யூரேசியாவில் மிகப்பெரிய தரவுத்தளத்தை வைத்திருக்கிறது, ஒரு பில்லியனுக்கும் அதிகமான பக்கங்களின் உள்ளடக்கத்தை கையாளுகிறது மற்றும் எந்தவொரு கேள்விக்கும் பதில் தெரியும் என்பது பலருக்குத் தெரியும். ஆகஸ்ட் 2012 க்கான Liveinternet தரவுகளின்படி, ரஷ்யாவில் Yandex இன் பங்கு 60.5% ஆகும். போர்ட்டலின் மாதாந்திர பார்வையாளர்கள் 48.9 மில்லியன் மக்கள். ஆனால் வலைப்பதிவாளர்களாகிய எங்களுக்கு மிக முக்கியமான விஷயம் என்னவென்றால், தேடுபொறி நமது கோரிக்கைகளை எவ்வாறு பெறுகிறது, அதை எவ்வாறு செயலாக்குகிறது மற்றும் அதன் விளைவாக என்ன ஆகும். ஒருபுறம், இந்தத் தகவலை அறிந்துகொள்வதும் புரிந்துகொள்வதும் எல்லா Yandex ஆதாரங்களையும் பயன்படுத்துவதை எளிதாக்குகிறது; மறுபுறம், எங்கள் வலைப்பதிவுகளை விளம்பரப்படுத்துவது எளிது. எனவே, சிறந்த Runet தேடுபொறியின் மிக முக்கியமான தொழில்நுட்பங்களை என்னுடன் பார்க்க நான் முன்மொழிகிறேன்.

இணையப் பயனர் முதலில் தேடுபொறிக்குத் திரும்ப விரும்பினால், அவருக்கு ஒரு கேள்வி இருக்கலாம்: “தேடல் எவ்வாறு செயல்படுகிறது?” ஆனால் அவர் அதைப் பெறும்போது, ​​இந்தக் கேள்வி அடிக்கடி இன்னொருவருக்கு மாறுகிறது: "ஏன் இவ்வளவு வேகமாக?" உண்மையில், கணினியில் கோப்பைத் தேடுவதற்கு ஏன் 20 வினாடிகள் ஆகும், மேலும் உலகெங்கிலும் உள்ள கணினிகளின் முழு நெட்வொர்க்கிலிருந்தும் கோரிக்கையின் முடிவு ஒரு நொடியில் தோன்றும்? மிகவும் சுவாரஸ்யமான விஷயம் என்னவென்றால், முதல் இரண்டு கேள்விகளுக்கு (தேடல் எவ்வாறு நிகழ்கிறது மற்றும் ஏன் 1 வினாடி) ஒரு பதிலில் பதிலளிக்க முடியும் - தேடுபொறி பயனரின் கோரிக்கைக்கு முன்கூட்டியே தயார் செய்துள்ளது.

Yandex இன் செயல்பாட்டுக் கொள்கையைப் புரிந்து கொள்ள, மற்ற தேடுபொறிகளைப் போலவே, தொலைபேசி கோப்பகத்துடன் ஒரு ஒப்புமையை வரைவோம். எந்த ஃபோன் எண்ணையும் கண்டுபிடிக்க, நீங்கள் சந்தாதாரரின் கடைசி பெயரை அறிந்து கொள்ள வேண்டும், மேலும் இந்த வழக்கில் எந்த தேடலும் அதிகபட்சமாக ஒரு நிமிடம் எடுக்கும், ஏனெனில் கோப்பகத்தின் அனைத்து பக்கங்களும் தொடர்ச்சியான அகரவரிசை அட்டவணையாகும். ஆனால் வேறு விருப்பத்தைப் பயன்படுத்தி தேடல் மேற்கொள்ளப்பட்டதா என்று கற்பனை செய்து பாருங்கள், அங்கு தொலைபேசி எண்கள் எண்களால் ஆர்டர் செய்யப்பட்டன. இத்தகைய தேடல்களுக்குப் பிறகு, நீண்ட நேரம் இழுத்துச் செல்லும், எண்கள் தேடுபவரின் கண்களுக்கு மிக நீண்ட காலத்திற்கு இருக்கும். 🙂

அதேபோல், தேடுபொறியானது இணையத்தில் உள்ள அனைத்து தகவல்களையும் தனக்கு வசதியான வடிவத்தில் காண்பிக்கும். மிக முக்கியமாக, பார்வையாளர் தனது கோரிக்கைகளுடன் வருவதற்கு முன்பு, இந்தத் தரவு அனைத்தும் முன்கூட்டியே அவளுடைய கோப்பகத்தில் வைக்கப்படும். அதாவது, நாம் யாண்டெக்ஸிடம் ஒரு கேள்வியைக் கேட்டால், அதற்கு நம் பதில் ஏற்கனவே தெரியும். மேலும் ஒரு நொடியில் நமக்கு கொடுக்கிறது. ஆனால் இந்த வினாடி பல முக்கியமான செயல்முறைகளை உள்ளடக்கியது, அதை நாம் இப்போது விரிவாகக் கருதுவோம்.

இணைய அட்டவணைப்படுத்தல்

Yandex ru இணையத்தில் அதன் கைகளில் கிடைக்கும் அனைத்து தகவல்களையும் சேகரிக்கிறது. சிறப்பு உபகரணங்களைப் பயன்படுத்தி, காட்சி அளவுருக்களின் அடிப்படையில் படங்கள் உட்பட அனைத்து உள்ளடக்கங்களும் மதிப்பாய்வு செய்யப்படுகின்றன. தேடுபொறி அத்தகைய சேகரிப்பில் ஈடுபட்டுள்ளது, மேலும் தரவுகளை சேகரித்து தயாரிக்கும் செயல்முறை அட்டவணைப்படுத்தல் என்று அழைக்கப்படுகிறது. அத்தகைய இயந்திரத்தின் அடிப்படை ஒரு கணினி அமைப்பு ஆகும், இது ஒரு தேடல் ரோபோ என்று அழைக்கப்படுகிறது. இது அட்டவணையிடப்பட்ட தளங்களைத் தொடர்ந்து வலைவலம் செய்கிறது, புதிய உள்ளடக்கத்திற்காக அவற்றைச் சரிபார்க்கிறது, மேலும் நீக்கப்பட்ட பக்கங்களுக்கு இணையத்தை ஸ்கேன் செய்கிறது. இது போன்ற சில பக்கம் இனி இல்லை அல்லது அட்டவணைப்படுத்தலில் இருந்து மூடப்பட்டால், அது தேடலில் இருந்து அதை நீக்குகிறது.

ஒரு தேடல் ரோபோ எப்படி புதிய தளங்களை கண்டுபிடிக்கும்? முதலில், மற்ற தளங்களிலிருந்து வரும் இணைப்புகளுக்கு நன்றி. ஏனெனில் ஏற்கனவே அட்டவணைப்படுத்தப்பட்ட தளத்திலிருந்து ஒரு புதிய வலை ஆதாரத்தில் ஒரு இணைப்பு வைக்கப்பட்டால், அடுத்த முறை நீங்கள் இரண்டாவது இடத்திற்குச் செல்லும் போது, ​​ரோபோ முதல் ஒன்றைப் பார்வையிடும். இரண்டாவதாக, "addurlka" என்று பிரபலமாக அழைக்கப்படும் ஒரு அற்புதமான சேவை உள்ளது (ஆங்கிலத்தில் உள்ள சொற்றொடரில் இருந்து -addurl - add address). அதில் உங்கள் புதிய தளத்தின் முகவரியை உள்ளிடலாம், சிறிது நேரம் கழித்து ஒரு தேடல் ரோபோ பார்வையிடும். மூன்றாவதாக, ஒரு சிறப்பு நிரல் "Yandex.Bar" உதவியுடன், அதைப் பயன்படுத்தும் பயனர்களின் வருகைகள் கண்காணிக்கப்படுகின்றன. அதன்படி, ஒரு நபர் புதிய வலை வளத்தில் இறங்கினால், விரைவில் ஒரு ரோபோ அங்கு தோன்றும்.

எல்லா பக்கங்களும் தேடலில் சேர்க்கப்பட்டுள்ளதா? ஒவ்வொரு நாளும் மில்லியன் கணக்கான பக்கங்கள் அட்டவணைப்படுத்தப்படுகின்றன. அவற்றில் வெவ்வேறு தரத்தின் பக்கங்கள் உள்ளன, அவை வெவ்வேறு தகவல்களைக் கொண்டிருக்கலாம் - தனித்துவமான உள்ளடக்கத்திலிருந்து முழுமையான குப்பை வரை. மேலும், புள்ளிவிவரங்கள் சொல்வது போல், இணையத்தில் அதிக குப்பை உள்ளது. தேடல் ரோபோ ஒவ்வொரு ஆவணத்தையும் சிறப்பு அல்காரிதம்களைப் பயன்படுத்தி பகுப்பாய்வு செய்கிறது. இதில் ஏதேனும் பயனுள்ள தகவல் உள்ளதா மற்றும் பயனரின் கோரிக்கைக்கு பதிலளிக்க முடியுமா என்பதை இது தீர்மானிக்கிறது. இல்லையெனில், அத்தகைய பக்கங்கள் "விண்வெளி வீரர்கள்" என்று ஏற்றுக்கொள்ளப்படாது, ஆனால் அப்படியானால், அது தேடலில் சேர்க்கப்படும்.

ஒரு ரோபோ ஒரு பக்கத்தைப் பார்வையிட்டு அதன் பயனைத் தீர்மானித்த பிறகு, அது தேடுபொறியின் சேமிப்பகத்தில் தோன்றும். ஆட்டோ சென்டர் மாஸ்டர்கள் சொல்வது போல், எந்த ஒரு ஆவணத்தையும் அடிப்படைகள் வரை இங்கு பகுப்பாய்வு செய்கிறோம். பக்கம் html மார்க்அப்பில் இருந்து அழிக்கப்பட்டது, சுத்தமான உரை முழு சரக்குக்கு உட்பட்டது - ஒவ்வொரு வார்த்தையின் இருப்பிடமும் கணக்கிடப்படுகிறது. இந்த பிரித்தெடுக்கப்பட்ட வடிவத்தில், பக்கம் எண்கள் மற்றும் எழுத்துக்களைக் கொண்ட அட்டவணையாக மாறும், இல்லையெனில் அது குறியீட்டு என்று அழைக்கப்படுகிறது. இப்போது, ​​இந்தப் பக்கத்தைக் கொண்டிருக்கும் இணைய ஆதாரத்திற்கு என்ன நடந்தாலும், அதன் சமீபத்திய நகல் தேடலில் எப்போதும் கிடைக்கும். தளம் இல்லாவிட்டாலும், அதன் ஆவணங்களின் நகல்கள் இணையத்தில் சிறிது நேரம் சேமிக்கப்படும்.

ஒவ்வொரு அட்டவணையும், ஆவண வகைகள், குறியாக்கம், மொழி, நகல்களுடன் சேர்ந்து தேடல் தரவுத்தள . இது அவ்வப்போது புதுப்பிக்கப்படுகிறது, எனவே இது சிறப்பு சேவையகங்களில் அமைந்துள்ளது, இதன் உதவியுடன் தேடுபொறி பயனர்களின் கோரிக்கைகள் செயலாக்கப்படுகின்றன.

அட்டவணைப்படுத்தல் செயல்முறை எவ்வளவு அடிக்கடி நிகழ்கிறது? முதலில், இது தளங்களின் வகைகளைப் பொறுத்தது. முதல் வகை வலை வளமானது அதன் பக்கங்களின் உள்ளடக்கத்தை அடிக்கடி மாற்றுகிறது. அதாவது, ஒவ்வொரு முறையும் இந்தப் பக்கங்களுக்கு ஒரு தேடல் ரோபோ வரும்போது, ​​அவை ஒவ்வொரு முறையும் வெவ்வேறு உள்ளடக்கங்களைக் கொண்டிருக்கும். அடுத்த முறை நீங்கள் அவற்றைப் பயன்படுத்தி எதையும் கண்டுபிடிக்க முடியாது, எனவே அத்தகைய தளங்கள் குறியீட்டில் சேர்க்கப்படவில்லை. இரண்டாவது வகை தளம் ஒரு தரவுக் கிடங்கு ஆகும், அதன் பக்கங்களில் பதிவிறக்குவதற்கான ஆவணங்களுக்கான இணைப்புகள் அவ்வப்போது சேர்க்கப்படுகின்றன. அத்தகைய தளத்தின் உள்ளடக்கம் பொதுவாக மாறாது, எனவே ரோபோ அதை மிகவும் அரிதாகவே பார்வையிடுகிறது. பிற தளங்கள் பொருளைப் புதுப்பிக்கும் அதிர்வெண்ணைப் பொறுத்தது. இது பின்வருவனவற்றைக் குறிக்கிறது: தளத்தில் புதிய உள்ளடக்கம் எவ்வளவு வேகமாகத் தோன்றுகிறதோ, அவ்வளவு அடிக்கடி தேடல் ரோபோ வருகிறது. மேலும் மிக முக்கியமான இணைய ஆதாரங்களுக்கு முதலில் முன்னுரிமை அளிக்கப்படுகிறது (உதாரணமாக, எந்த வலைப்பதிவையும் விட ஒரு செய்தித் தளம் மிக முக்கியமான ஒரு வரிசையாகும்).

அட்டவணைப்படுத்தல் தேடுபொறியின் முதல் செயல்பாட்டைச் செய்ய உங்களை அனுமதிக்கிறது - இணையத்தில் புதிய பக்கங்களில் தகவல்களைச் சேகரிப்பது. ஆனால் யாண்டெக்ஸ் இரண்டாவது செயல்பாட்டையும் கொண்டுள்ளது - ஏற்கனவே தயாரிக்கப்பட்ட தேடல் தரவுத்தளத்தில் பயனரின் கோரிக்கைக்கான பதிலைத் தேடுகிறது.

Yandex ஒரு பதிலைத் தயாரிக்கிறது

கோரிக்கையைச் செயலாக்குதல் மற்றும் தொடர்புடைய பதில்களை வழங்குதல் ஆகியவற்றால் கையாளப்படுகிறது கணினி அமைப்பு "மெட்டா தேடல்" . அதன் பணிக்காக, இது முதலில் அனைத்து உள்ளீட்டுத் தகவல்களையும் சேகரிக்கிறது: கோரிக்கை எந்தப் பகுதியில் இருந்து செய்யப்பட்டது, அது எந்த வகுப்பைச் சேர்ந்தது, கோரிக்கையில் பிழைகள் உள்ளதா போன்றவை. அத்தகைய செயலாக்கத்திற்குப் பிறகு, தரவுத்தளத்தில் அதே அளவுருக்களுடன் ஒரே மாதிரியான வினவல்கள் உள்ளதா என்பதை மெட்டாசர்ச் சரிபார்க்கிறது. பதில் ஆம் எனில், கணினி பயனருக்கு முன்பு சேமித்த முடிவுகளைக் காட்டுகிறது. தரவுத்தளத்தில் அத்தகைய கேள்வி இல்லை என்றால், குறியீட்டுத் தரவைக் கொண்ட தேடல் தரவுத்தளத்தை மெட்டாசேர்ச் குறிப்பிடுகிறது.

மேலும் இங்குதான் ஆச்சரியமான விஷயங்கள் நடக்கின்றன. தேடல் ரோபோக்களால் செயலாக்கப்பட்ட முழு இணையத்தையும் சேமிக்கும் ஒரு சூப்பர் சக்திவாய்ந்த கணினி உள்ளது என்று கற்பனை செய்து பாருங்கள். பயனர் ஒரு வினவலை அமைக்கிறார் மற்றும் வினவலில் உள்ள அனைத்து ஆவணங்களுக்கும் நினைவக கலங்களில் ஒரு தேடல் தொடங்குகிறது. விடை கிடைத்து அனைவரும் மகிழ்ச்சி அடைந்துள்ளனர். ஆனால் அவர்களின் உடலில் ஒரே வார்த்தைகளைக் கொண்ட கோரிக்கைகள் நிறைய இருக்கும்போது மற்றொரு வழக்கை எடுத்துக்கொள்வோம். கணினி ஒவ்வொரு முறையும் அதே நினைவக செல்கள் வழியாக செல்ல வேண்டும், இது தரவை கணிசமாக செயலாக்க எடுக்கும் நேரத்தை அதிகரிக்கும். அதன்படி, நேரம் அதிகரிக்கிறது, இது பயனரின் இழப்புக்கு வழிவகுக்கும் - அவர் உதவிக்காக மற்றொரு தேடுபொறிக்கு திரும்புவார்.

இத்தகைய தாமதங்களைத் தவிர்க்க, தள அட்டவணையில் உள்ள அனைத்து நகல்களும் வெவ்வேறு கணினிகளில் விநியோகிக்கப்படுகின்றன. கோரிக்கையை அனுப்பிய பிறகு, மெட்டா தேடல் அத்தகைய சேவையகங்களை அவற்றின் உரையைத் தேட அறிவுறுத்துகிறது. அதன் பிறகு, இந்த இயந்திரங்களில் இருந்து அனைத்து தரவுகளும் மத்திய கணினிக்குத் திரும்புகின்றன, இது பெறப்பட்ட அனைத்து முடிவுகளையும் ஒருங்கிணைத்து, பயனருக்கு முதல் பத்து சிறந்த பதில்களை வழங்குகிறது. இந்த தொழில்நுட்பத்தின் மூலம், இரண்டு பறவைகள் ஒரே நேரத்தில் கொல்லப்படுகின்றன: தேடல் நேரம் பல முறை குறைக்கப்படுகிறது (பதில் ஒரு பிளவு நொடியில் பெறப்படுகிறது) மற்றும் தளங்களின் அதிகரிப்புக்கு நன்றி, தகவல் நகலெடுக்கப்படுகிறது (திடீர் முறிவுகள் காரணமாக தரவு இழக்கப்படாது) . நகல் தகவல்களைக் கொண்ட கணினிகள் ஒரு தரவு மையத்தை உருவாக்குகின்றன - இது சேவையகங்களைக் கொண்ட அறை.

ஒரு தேடுபொறி பயனர் ஒரு வினவல் கேட்கும் போது, ​​100க்கு 20 முறை, கேள்வியில் உள்ள இலக்குகள் தெளிவற்றதாக இருக்கும். எடுத்துக்காட்டாக, அவர் தேடல் பட்டியில் “நெப்போலியன்” என்ற வார்த்தையை எழுதினால், அவர் என்ன பதிலை எதிர்பார்க்கிறார் என்பது இன்னும் தெரியவில்லை - ஒரு கேக் செய்முறை அல்லது சிறந்த தளபதியின் வாழ்க்கை வரலாறு. அல்லது "பிரதர்ஸ் கிரிம்" என்ற சொற்றொடர் - விசித்திரக் கதைகள், திரைப்படங்கள், இசைக் குழு. அத்தகைய சாத்தியமான இலக்குகளை குறிப்பிட்ட பதில்களுக்கு சுருக்க, Yandex ஒரு சிறப்பு தொழில்நுட்பத்தைக் கொண்டுள்ளது சரகம். இது தேடல் வினவல் புள்ளிவிவரங்களைப் பயன்படுத்தி பயனர் தேவைகளை கணக்கில் எடுத்துக்கொள்கிறது. யாண்டெக்ஸில் பார்வையாளர்களால் கேட்கப்படும் அனைத்து கேள்விகளிலும், ஸ்பெக்ட்ரம் அவற்றில் உள்ள பல்வேறு பொருட்களை அடையாளம் காட்டுகிறது (மக்களின் பெயர்கள், புத்தகங்களின் தலைப்புகள், கார் மாதிரிகள் போன்றவை) இந்த பொருள்கள் சில வகைகளாக விநியோகிக்கப்படுகின்றன. தற்போது இதுபோன்ற 60 க்கும் மேற்பட்ட வகைகள் உள்ளன. அவர்களின் உதவியுடன், தேடுபொறி அதன் தரவுத்தளத்தில் பயனர் வினவல்களில் சொற்களின் வெவ்வேறு அர்த்தங்களைக் கொண்டுள்ளது. சுவாரஸ்யமாக, இந்த வகைகள் அவ்வப்போது சரிபார்க்கப்படுகின்றன (பகுப்பாய்வு வாரத்திற்கு இரண்டு முறை நிகழ்கிறது), இது Yandex ஐ மிகவும் துல்லியமாக கேட்கும் கேள்விகளுக்கான பதில்களை வழங்க அனுமதிக்கிறது.

ஸ்பெக்ட்ரம் தொழில்நுட்பத்தின் அடிப்படையில், Yandex ஒழுங்கமைக்கப்பட்ட உரையாடல் கேட்கிறது. பயனர் தனது தெளிவற்ற வினவலைத் தட்டச்சு செய்யும் தேடல் பட்டியின் கீழே அவை தோன்றும். கேள்வியின் பொருள் எந்த வகையைச் சேர்ந்தது என்பதை இந்த வரி பிரதிபலிக்கிறது. மேலும் தேடல் முடிவுகள் இந்த வகையின் பயனரின் விருப்பத்தைப் பொறுத்தது.

யாண்டெக்ஸ் தேடுபொறியின் அனைத்து பயனர்களில் 15 முதல் 30% வரை உள்ளூர் தகவல்களை மட்டுமே பெற விரும்புகிறார்கள் (அவர்கள் வசிக்கும் பிராந்தியத்திலிருந்து தரவு). உதாரணமாக, உங்கள் நகரத்தில் உள்ள திரையரங்குகளில் புதிய படங்களைப் பற்றி. எனவே, அத்தகைய கோரிக்கைக்கான பதில் ஒவ்வொரு பிராந்தியத்திற்கும் வித்தியாசமாக இருக்க வேண்டும். இது சம்பந்தமாக, Yandex அதன் தொழில்நுட்பத்தைப் பயன்படுத்துகிறது பிராந்தியங்களின் அடிப்படையில் தேடல் . எடுத்துக்காட்டாக, ஒக்டியாப்ர் சினிமாவில் படங்களின் தொகுப்பைத் தேடும் குடியிருப்பாளர்கள் பெறக்கூடிய பதில்கள் இவை:

ஆனால் இதே கோரிக்கைக்காக ஸ்டாவ்ரோபோல் நகரவாசிகள் பெறும் முடிவு இதுதான்:

பயனரின் பகுதி முதன்மையாக அதன் ஐபி முகவரியால் தீர்மானிக்கப்படுகிறது. சில நேரங்களில் இந்தத் தரவு துல்லியமாக இருக்காது, ஏனெனில் பல வழங்குநர்கள் ஒரே நேரத்தில் பல பிராந்தியங்களில் வேலை செய்யலாம், எனவே அவர்களின் பயனர்களின் ஐபி முகவரிகளை மாற்றலாம். கொள்கையளவில், இது உங்களுக்கு நடந்தால், தேடுபொறியில் உள்ள அமைப்புகளில் உங்கள் பிராந்தியத்தை எளிதாக மாற்றலாம். இது முடிவுகள் பக்கத்தின் மேல் வலது மூலையில் பட்டியலிடப்பட்டுள்ளது. நீங்கள் அதை மாற்றலாம்.

தேடுபொறி Yandex ru - பதில் முடிவுகள்

Metasearch ஒரு பதிலைத் தயாரித்தவுடன், Yandex தேடுபொறி அதை முடிவுகள் பக்கத்தில் காண்பிக்க வேண்டும். கண்டுபிடிக்கப்பட்ட ஆவணங்களுக்கான இணைப்புகளின் பட்டியலாகும், ஒவ்வொன்றிலும் ஒரு சிறிய தகவல் உள்ளது. முடிவுகளை வழங்குவதற்கான தொழில்நுட்பத்தின் பணியானது பயனருக்கு மிகவும் பொருத்தமான பதில்களை மிகவும் தகவலறிந்த முறையில் வழங்குவதாகும். அத்தகைய இணைப்புக்கான டெம்ப்ளேட் இதுபோல் தெரிகிறது:

இந்த முடிவு வடிவத்தை இன்னும் விரிவாகப் பார்ப்போம். க்கு தேடல் முடிவு தலைப்பு Yandex பெரும்பாலும் பக்க தலைப்பின் பெயரைப் பயன்படுத்துகிறது (தலைப்பு குறிச்சொல்லில் மேம்படுத்துபவர்கள் என்ன எழுதுகிறார்கள்). அது இல்லை என்றால், கட்டுரை அல்லது இடுகையின் தலைப்பில் உள்ள வார்த்தைகள் இங்கே தோன்றும். தலைப்பு உரை பெரியதாக இருந்தால், கொடுக்கப்பட்ட வினவலுக்கு மிகவும் பொருத்தமான பகுதியை தேடுபொறி இந்த புலத்தில் வைக்கிறது.

மிகவும் அரிதாக, ஆனால் கோரிக்கையின் உள்ளடக்கத்துடன் தலைப்பு பொருந்தவில்லை. இந்த வழக்கில், கட்டுரை அல்லது இடுகையில் உள்ள உரையைப் பயன்படுத்தி Yandex அதன் தேடல் முடிவு தலைப்பை உருவாக்குகிறது. அதில் கண்டிப்பாக கேள்வி வார்த்தைகள் இருக்கும்.

க்கு துணுக்குதேடுபொறி பக்கத்தில் உள்ள அனைத்து உரைகளையும் பயன்படுத்துகிறது. இது வினவலுக்கு பதில் இருக்கும் அனைத்து துண்டுகளையும் தேர்ந்தெடுத்து, பின்னர் மிகவும் பொருத்தமான ஒன்றைத் தேர்ந்தெடுத்து, ஆவணத்திற்கான இணைப்புகளை படிவ புலத்தில் செருகும். இந்த அணுகுமுறைக்கு நன்றி, ஒரு திறமையான ஆப்டிமைசர் ஒரு துணுக்கைப் பார்த்த பிறகு அதை ரீமேக் செய்யலாம், இதன் மூலம் இணைப்பின் கவர்ச்சியை மேம்படுத்தலாம்.

பயனரின் கோரிக்கையின் முடிவை நன்றாக உணர, தலைப்புகள் உரையில் உள்ள இணைப்புகளாக வடிவமைக்கப்பட்டுள்ளன (அடிக்கோடிடுடன் நீல நிறத்தில் சிறப்பிக்கப்பட்டுள்ளது). வலை வளத்தை கவர்ச்சிகரமானதாகவும் அடையாளம் காணக்கூடியதாகவும் மாற்ற, ஒரு ஃபேவிகான் சேர்க்கப்பட்டது - தளத்தின் சிறிய கார்ப்பரேட் ஐகான். இது தலைப்புக்கு முன் முதல் வரியில் உரையின் இடதுபுறத்தில் தோன்றும். பதிலில் உள்ள கோரிக்கையில் சேர்க்கப்பட்டுள்ள அனைத்து வார்த்தைகளும் எளிதில் உணரும் வகையில் தடிமனான எழுத்துக்களில் முன்னிலைப்படுத்தப்பட்டுள்ளன.

சமீபத்தில், யாண்டெக்ஸ் தேடுபொறியானது துணுக்கில் பல்வேறு தகவல்களைச் சேர்த்து வருகிறது, இது பயனருக்கு அவர்களின் பதிலை இன்னும் வேகமாகவும் துல்லியமாகவும் கண்டறிய உதவும். எடுத்துக்காட்டாக, ஒரு பயனர் தனது கோரிக்கையில் ஒரு நிறுவனத்தின் பெயரை எழுதினால், Yandex அதன் முகவரி, தொடர்பு எண்கள் மற்றும் இருப்பிடத்திற்கான இணைப்பை புவியியல் வரைபடங்களில் துணுக்கில் சேர்க்கும். தேடுபொறி தளத்தின் கட்டமைப்பை நன்கு அறிந்திருந்தால், பயனருக்கான பதிலுடன் ஒரு ஆவணம் உள்ளது, அது நிச்சயமாக அதைக் காண்பிக்கும். கூடுதலாக, Yandex உடனடியாக அத்தகைய வலை வளத்தின் அதிகம் பார்வையிடப்பட்ட பக்கங்களை துணுக்கில் சேர்க்க முடியும், இதனால், விரும்பினால், பார்வையாளர் உடனடியாக தனக்குத் தேவையான பகுதிக்குச் சென்று, தனது நேரத்தை மிச்சப்படுத்தலாம்.

ஒரு ஆன்லைன் ஸ்டோர், ஒரு ஹோட்டல் அல்லது உணவகத்திற்கான நட்சத்திரங்களின் வடிவத்தில் ஒரு தயாரிப்பின் விலை மற்றும் தேடல் ஆவணங்களில் உள்ள பொருட்களைப் பற்றிய பல்வேறு எண்களைக் கொண்ட பிற சுவாரஸ்யமான தகவல்கள் அடங்கிய துணுக்குகள் உள்ளன. அத்தகைய தகவலின் நோக்கம் பயனருக்கு ஆர்வமுள்ள பொருட்கள் அல்லது பொருட்களைப் பற்றிய முழுமையான தரவை வழங்குவதாகும்.

பொதுவாக, பல்வேறு எடுத்துக்காட்டுகளுடன், பதில்களைக் கொண்ட பக்கம் இப்படி இருக்கும்:

தரவரிசை மற்றும் மதிப்பீட்டாளர்கள்

Yandex இன் பணியில் சாத்தியமான அனைத்து பதில் விருப்பங்களையும் தேடுவது மட்டுமல்லாமல், சிறந்த (தொடர்புடைய) ஒன்றைத் தேர்ந்தெடுப்பதும் அடங்கும். எல்லாவற்றிற்கும் மேலாக, தேடல் விளைவாக யாண்டெக்ஸ் அவருக்கு வழங்கும் அனைத்து இணைப்புகளையும் பயனர் சலசலக்க மாட்டார். தேடல் முடிவுகளை ஒழுங்கமைக்கும் செயல்முறை அழைக்கப்படுகிறது தரவரிசை . அதாவது, முன்மொழியப்பட்ட பதில்களின் தரத்தை நிர்ணயிக்கும் தரவரிசை.

Yandex தொடர்புடைய பக்கங்களை தீர்மானிக்கும் விதிகள் உள்ளன:

  • தேடல் தரத்தை குறைக்கும் தளங்கள் முடிவுகள் பக்கத்தில் உள்ள நிலைகளில் தரமிறக்கப்படும். பொதுவாக இவை வலை வளங்கள், அதன் உரிமையாளர்கள் தேடுபொறியை ஏமாற்ற முயற்சிக்கின்றனர். எடுத்துக்காட்டாக, இவை அர்த்தமற்ற அல்லது கண்ணுக்கு தெரியாத உரையைக் கொண்ட பக்கங்களைக் கொண்ட தளங்கள். நிச்சயமாக, இது ஒரு தேடல் ரோபோவுக்குத் தெரியும் மற்றும் புரிந்துகொள்ளக்கூடியது, ஆனால் இந்த ஆவணத்தைப் படிக்கும் பார்வையாளருக்கு அல்ல. அல்லது தேடல் முடிவுகள் பகுதியில் உள்ள இணைப்பைக் கிளிக் செய்யும் போது, ​​உடனடியாக பயனரை முற்றிலும் வேறுபட்ட தளத்திற்கு மாற்றும் தளங்கள்.
  • சிற்றின்ப உள்ளடக்கம் கொண்ட தளங்கள் முடிவுகளில் சேர்க்கப்படவில்லை அல்லது தரவரிசையில் பெரிதும் குறைக்கப்பட்டுள்ளன. இத்தகைய வலை வளங்கள் பெரும்பாலும் ஆக்கிரமிப்பு ஊக்குவிப்பு முறைகளைப் பயன்படுத்துவதே இதற்குக் காரணம்.
  • வைரஸ்களால் பாதிக்கப்பட்ட தளங்கள் தேடல் முடிவுகளில் குறைக்கப்படவில்லை மற்றும் தேடல் முடிவுகளிலிருந்து விலக்கப்படவில்லை - இந்த விஷயத்தில், ஒரு சிறப்பு ஐகானைப் பயன்படுத்தி ஆபத்து குறித்து பயனருக்குத் தெரிவிக்கப்படுகிறது. தேடுபொறி பார்வையாளரின் வேண்டுகோளின் பேரில் இத்தகைய வலை ஆதாரங்கள் முக்கியமான ஆவணங்களைக் கொண்டிருக்கலாம் என்று யாண்டெக்ஸ் கருதுகிறது என்பதே இதற்குக் காரணம்.

எடுத்துக்காட்டாக, “ஆப்பிள்” வினவலுக்கு யாண்டெக்ஸ் தளங்களை தரவரிசைப்படுத்தும்:

தரவரிசை காரணிகளுக்கு கூடுதலாக, தேடுபொறி பயனர்கள் மிகவும் பொருத்தமானதாக கருதும் வினவல்கள் மற்றும் பதில்களுடன் சிறப்பு மாதிரிகளை Yandex பயன்படுத்துகிறது. இந்த நேரத்தில் எந்த இயந்திரமும் அத்தகைய மாதிரிகளை உருவாக்க முடியாது - இது மனிதனின் தனிச்சிறப்பு. Yandex இல், அத்தகைய நிபுணர்கள் அழைக்கப்படுகிறார்கள் மதிப்பீட்டாளர்கள். அவர்களின் பணி அனைத்து தேடல் ஆவணங்களையும் முழுமையாக பகுப்பாய்வு செய்வது மற்றும் குறிப்பிட்ட வினவல்களுக்கான பதில்களை மதிப்பீடு செய்வது. அவர்கள் சிறந்த பதில்களைத் தேர்ந்தெடுத்து ஒரு சிறப்பு பயிற்சித் தொகுப்பை உருவாக்குகிறார்கள். அதில், தேடுபொறி தொடர்புடைய பக்கங்களுக்கும் அவற்றின் பண்புகளுக்கும் இடையிலான உறவைப் பார்க்கிறது. அத்தகைய தகவலைக் கொண்டு, Yandex ஒவ்வொரு கோரிக்கைக்கும் உகந்த தரவரிசை சூத்திரத்தைத் தேர்ந்தெடுக்கலாம். அத்தகைய சூத்திரத்தை உருவாக்குவதற்கான முறை மேட்ரிக்ஸ்நெட் என்று அழைக்கப்படுகிறது. இந்த அமைப்பின் நன்மை என்னவென்றால், இது அதிகப்படியான பொருத்தத்திற்கு எதிர்ப்புத் தெரிவிக்கிறது, இது தேவையற்ற மதிப்பீடுகள் மற்றும் வடிவங்களின் எண்ணிக்கையை அதிகரிக்காமல் அதிக எண்ணிக்கையிலான தரவரிசை காரணிகளை கணக்கில் எடுத்துக்கொள்ள உங்களை அனுமதிக்கிறது.

எனது இடுகையின் முடிவில், யாண்டெக்ஸ் தேடுபொறி அதன் பணியின் செயல்பாட்டில் சேகரிக்கப்பட்ட சுவாரஸ்யமான புள்ளிவிவரங்களை உங்களுக்குக் காட்ட விரும்புகிறேன்.

1. ரஷ்யா மற்றும் ரஷ்ய நகரங்களில் தனிப்பட்ட பெயர்களின் புகழ் (மார்ச் 2012 இல் பதிவர்கள் மற்றும் சமூக வலைப்பின்னல் பயனர்களின் கணக்குகளில் இருந்து எடுக்கப்பட்ட தரவு).

பெரிய பார்ப்பான்

1863 ஆம் ஆண்டில், சிறந்த எழுத்தாளர் ஜூல்ஸ் வெர்ன் தனது அடுத்த புத்தகமான "பாரிஸ் இன் 20 ஆம் நூற்றாண்டில்" உருவாக்கினார். அதில், அவர் சுரங்கப்பாதை, கார், மின்சார நாற்காலி, கணினி மற்றும் இன்டர்நெட் கூட விரிவாக விவரித்தார். இருப்பினும், வெளியீட்டாளர் புத்தகத்தை அச்சிட மறுத்துவிட்டார், மேலும் அது 1989 இல் ஜூல்ஸ் வெர்னின் கொள்ளுப் பேரனால் கண்டுபிடிக்கப்படும் வரை 120 ஆண்டுகளுக்கும் மேலாக அங்கேயே கிடந்தது. புத்தகம் 1994 இல் வெளியிடப்பட்டது.

1. விதிமுறைகள் மற்றும் வரையறைகள் தனிப்பட்ட தரவின் செயலாக்கம் குறித்த இந்த ஒப்பந்தத்தில் (இனிமேல் ஒப்பந்தம் என குறிப்பிடப்படுகிறது), கீழே உள்ள விதிமுறைகள் பின்வரும் வரையறைகளைக் கொண்டுள்ளன: ஆபரேட்டர் - தனிப்பட்ட தொழில்முனைவோர் ஒலெக் அலெக்ஸாண்ட்ரோவிச் டினெப்ரோவ்ஸ்கி. ஒப்பந்தத்தை ஏற்றுக்கொள்வது - தனிப்பட்ட தரவை அனுப்புதல் மற்றும் செயலாக்குவதன் மூலம் ஒப்பந்தத்தின் அனைத்து விதிமுறைகளையும் முழுமையாகவும் நிபந்தனையற்றதாகவும் ஏற்றுக்கொள்வது. தனிப்பட்ட தரவு - தளத்தில் பயனர் (தனிப்பட்ட தரவின் பொருள்) உள்ளிட்ட தகவல் மற்றும் நேரடியாகவோ அல்லது மறைமுகமாகவோ இந்த பயனருடன் தொடர்புடையது. பயனர் - தளத்தில் உள்ளீடு புலங்களை நிரப்புவதற்கான நடைமுறையை வெற்றிகரமாக முடித்த எந்தவொரு தனிநபர் அல்லது சட்ட நிறுவனம். உள்ளீட்டு புலங்களை நிரப்புவது என்பது, பயனர் தனது முதல் பெயர், கடைசிப் பெயர், தொலைபேசி எண், தனிப்பட்ட மின்னஞ்சல் முகவரி (இனிமேல் தனிப்பட்ட தரவு என குறிப்பிடப்படும்) தளத்தின் பதிவு செய்யப்பட்ட பயனர்களின் தரவுத்தளத்திற்கு அனுப்புவதற்கான செயல்முறையாகும். பயனீட்டாளர். உள்ளீட்டு புலங்களை நிரப்புவதன் விளைவாக, தனிப்பட்ட தரவு ஆபரேட்டரின் தரவுத்தளத்திற்கு அனுப்பப்படுகிறது. உள்ளீட்டு புலங்களை நிரப்புவது தன்னார்வமானது. வலைத்தளம் - இணையத்தில் அமைந்துள்ள ஒரு வலைத்தளம் மற்றும் ஒரு பக்கத்தைக் கொண்டுள்ளது. 2. பொது விதிகள் 2.1. இந்த ஒப்பந்தம் ஜூலை 27, 2006 எண் 152-FZ இன் "தனிப்பட்ட தரவுகளில்" ஃபெடரல் சட்டத்தின் தேவைகள் மற்றும் "ரஷ்ய கூட்டமைப்பின் சட்டத்தை மீறுவது" குறித்த கட்டுரை 13.11 இன் விதிகளின் அடிப்படையில் வரையப்பட்டது. ரஷ்ய கூட்டமைப்பின் நிர்வாகக் குற்றங்களின் குறியீட்டின் தனிப்பட்ட தரவு” மற்றும் தளத்தைப் பயன்படுத்தும் போது ஆபரேட்டர் பயனரைப் பற்றி பெறக்கூடிய அனைத்து தனிப்பட்ட தரவுகளுக்கும் செல்லுபடியாகும். 2.2 தளத்தில் உள்ள பயனரால் உள்ளீட்டு புலங்களை நிரப்புவது என்பது இந்த ஒப்பந்தத்தின் அனைத்து விதிமுறைகளுடன் (ஒப்பந்தத்தை ஏற்றுக்கொள்வது) பயனரின் நிபந்தனையற்ற ஒப்பந்தமாகும். இந்த நிபந்தனைகளுடன் கருத்து வேறுபாடு ஏற்பட்டால், பயனர் தளத்தில் உள்ளீடு புலங்களை நிரப்புவதில்லை. 2.3 ஆபரேட்டருக்கு தனிப்பட்ட தரவை வழங்குவதற்கும், ஆபரேட்டரால் அவற்றின் செயலாக்கத்திற்கும் பயனரின் ஒப்புதல், ஆபரேட்டரின் செயல்பாடுகள் நிறுத்தப்படும் வரை அல்லது பயனர் ஒப்புதலை திரும்பப் பெறும் வரை செல்லுபடியாகும். இந்த ஒப்பந்தத்தை ஏற்று, பதிவு செய்யும் நடைமுறையை மேற்கொள்வதன் மூலமும், பின்னர் தளத்தை அணுகுவதன் மூலமும், பயனர் தனது சொந்த விருப்பத்தின் பேரில் செயல்படுவதை உறுதிப்படுத்துகிறார் அவர்களின் செயலாக்கம். ஜூலை 27, 2006 எண் 152-FZ "தனிப்பட்ட தரவுகளில்" ஃபெடரல் சட்டத்தின் அடிப்படையில் ஆபரேட்டரால் அவரது தனிப்பட்ட தரவின் செயலாக்கம் மேற்கொள்ளப்படும் என்று பயனருக்கு அறிவிக்கப்பட்டுள்ளது. 3. ஆபரேட்டருக்கு மாற்றப்பட வேண்டிய பயனர் பற்றிய தனிப்பட்ட தரவு மற்றும் பிற தகவல்களின் பட்டியல் 3. 1. ஆபரேட்டரின் இணையதளத்தைப் பயன்படுத்தும் போது, ​​பயனர் பின்வரும் தனிப்பட்ட தரவை வழங்குகிறார்: 3.1.1. உள்ளீட்டு புலங்களை நிரப்பும்போது மற்றும்/அல்லது கடைசிப் பெயர், முதல் பெயர், புரவலன், தொலைபேசி எண் (வீடு அல்லது மொபைல்), தனிப்பட்ட மின்னஞ்சல் முகவரி உள்ளிட்ட தள சேவைகளைப் பயன்படுத்தும் போது பயனர் தன்னைப் பற்றி சுயாதீனமாக வழங்கும் நம்பகமான தனிப்பட்ட தகவல். 3.1.2. ஐபி முகவரி, குக்கீகளில் உள்ள தகவல்கள், பயனரின் உலாவி பற்றிய தகவல்கள் (அல்லது சேவைகளை அணுகும் பிற நிரல்) உள்ளிட்ட பயனரின் சாதனத்தில் நிறுவப்பட்ட மென்பொருளைப் பயன்படுத்தி, தள சேவைகளுக்குத் தானாகப் பரிமாற்றப்படும் தரவு. 3.2 பயனர் வழங்கிய தனிப்பட்ட தரவின் துல்லியத்தை ஆபரேட்டர் சரிபார்க்கவில்லை. இந்த வழக்கில், உள்ளீட்டு புலங்களில் முன்மொழியப்பட்ட கேள்விகளில் பயனர் நம்பகமான மற்றும் போதுமான தனிப்பட்ட தகவலை வழங்குகிறார் என்று ஆபரேட்டர் கருதுகிறார். 4. தனிப்பட்ட தரவு சேகரிப்பு மற்றும் பயன்பாட்டிற்கான நோக்கங்கள், விதிகள் 4.1. சேவைகளை வழங்குவதற்கும் பயனருக்கு சேவைகளை வழங்குவதற்கும் தேவையான தனிப்பட்ட தரவை ஆபரேட்டர் செயலாக்குகிறார். 4.2 பயனரின் தனிப்பட்ட தரவு பின்வரும் நோக்கங்களுக்காக ஆபரேட்டரால் பயன்படுத்தப்படுகிறது: 4.2.1. பயனர் அடையாளம்; 4.2.2. தனிப்பயனாக்கப்பட்ட சேவைகளை பயனருக்கு வழங்குதல் (அத்துடன் நிறுவனத்தின் புதிய விளம்பரங்கள் மற்றும் சேவைகளைப் பற்றி கடிதங்களை அனுப்புவதன் மூலம் தெரிவிக்கவும்); 4.2.3. சேவைகளைப் பயன்படுத்துவது தொடர்பான அறிவிப்புகள், கோரிக்கைகள் மற்றும் தகவல்களை அனுப்புதல், சேவைகளை வழங்குதல், அத்துடன் பயனரிடமிருந்து கோரிக்கைகள் மற்றும் பயன்பாடுகளைச் செயலாக்குதல் உட்பட, தேவைப்பட்டால் பயனருடன் தொடர்பைப் பேணுதல்; 4.3 தனிப்பட்ட தரவு செயலாக்கத்தின் போது, ​​பின்வரும் செயல்கள் செய்யப்படும்: சேகரிப்பு, பதிவு செய்தல், முறைப்படுத்துதல், குவித்தல், சேமிப்பு, தெளிவுபடுத்துதல் (புதுப்பித்தல், மாற்றுதல்), பிரித்தெடுத்தல், பயன்படுத்துதல், தடுப்பது, நீக்குதல், அழித்தல். 4.4 சில சந்தர்ப்பங்களில் அவரால் குறிப்பிடப்பட்ட தகவல்கள் ரஷ்ய கூட்டமைப்பின் தற்போதைய சட்டத்தின்படி ரஷ்ய கூட்டமைப்பின் அங்கீகரிக்கப்பட்ட மாநில அமைப்புகளுக்கு வழங்கப்படலாம் என்பதை பயனர் எதிர்க்கவில்லை. 4.5 பயனரின் தனிப்பட்ட தரவு, ஆபரேட்டரின் செயல்பாடு முழுவதும் இந்த ஒப்பந்தத்தில் வழங்கப்பட்ட முறையில் ஆபரேட்டரால் சேமிக்கப்பட்டு செயலாக்கப்படுகிறது. 4.6 தரவுத்தளங்கள், தானியங்கி, இயந்திர மற்றும் கையேடு முறைகளை பராமரிப்பதன் மூலம் தனிப்பட்ட தரவை செயலாக்குவது ஆபரேட்டரால் மேற்கொள்ளப்படுகிறது. 4.7. தள சேவைகளின் பயன்பாட்டைக் கண்காணிக்க குக்கீகள் மற்றும் பிற தொழில்நுட்பங்களைப் பயன்படுத்துகிறது. தளத்தின் தொழில்நுட்ப செயல்பாட்டை மேம்படுத்தவும், சேவை வழங்கலின் தரத்தை மேம்படுத்தவும் இந்தத் தரவு அவசியம். தளத்திற்கு வரும் ஒவ்வொரு பார்வையாளரைப் பற்றிய தகவலை (URL, IP முகவரி, உலாவி வகை, மொழி, தேதி மற்றும் கோரிக்கை நேரம் உட்பட) தளம் தானாகவே பதிவு செய்கிறது. தளத்தைப் பார்வையிடும்போது தனிப்பட்ட தரவை வழங்க மறுக்க அல்லது குக்கீகளை முடக்க பயனருக்கு உரிமை உண்டு, ஆனால் இந்த விஷயத்தில், தளத்தின் அனைத்து செயல்பாடுகளும் சரியாக வேலை செய்யாது. 4.8 இந்த ஒப்பந்தத்தில் வழங்கப்பட்டுள்ள ரகசியத்தன்மை நிபந்தனைகள், தளத்தின் மற்றும் தளத்தைப் பயன்படுத்தும் போது, ​​பயனர் பற்றி ஆபரேட்டர் பெறக்கூடிய அனைத்து தகவல்களுக்கும் பொருந்தும். 4.9 இந்த ஒப்பந்தத்தை நிறைவேற்றும் போது பகிரங்கமாக வெளியிடப்படும் தகவல்களும், எந்தவொரு நபருக்கும் இலவச அணுகல் உள்ள மூலங்களிலிருந்து கட்சிகள் அல்லது மூன்றாம் தரப்பினரால் பெறக்கூடிய தகவல்கள் இரகசியமானவை அல்ல. 4.10. பயனரின் தனிப்பட்ட தரவின் ரகசியத்தன்மையை அங்கீகரிக்கப்படாத அணுகல், மாற்றம், வெளிப்படுத்துதல் அல்லது அழித்தல் ஆகியவற்றிலிருந்து பாதுகாக்க தேவையான அனைத்து நடவடிக்கைகளையும் ஆபரேட்டர் மேற்கொள்கிறார். தரவின் உடல் பாதுகாப்பை உறுதிசெய்கிறது, ஆபரேட்டர் தனிப்பட்ட தரவைச் சேமிக்கும் தளத்தின் செயல்பாட்டை உறுதி செய்யும் தொழில்நுட்ப அமைப்புகளுக்கு அங்கீகரிக்கப்படாத அணுகலைத் தடுக்கிறது; பயனருக்கு சேவைகளை வழங்குதல், அத்துடன் தளத்தின் செயல்பாடு, மேம்பாடு மற்றும் மேம்பாடு ஆகியவற்றுடன் நேரடியாக தொடர்புடைய கடமைகளைச் செய்ய இந்தத் தகவல் தேவைப்படும் ஆபரேட்டரின் பணியாளர்கள் அல்லது அங்கீகரிக்கப்பட்ட நபர்களுக்கு மட்டுமே தனிப்பட்ட தரவுகளுக்கான அணுகலை வழங்குகிறது. 4.11. வரம்பற்ற நபர்களுக்கு பொது அணுகலுக்காக பயனர் தானாக முன்வந்து தன்னைப் பற்றிய தகவல்களை வழங்கும் சந்தர்ப்பங்களில் தவிர, பயனரின் தனிப்பட்ட தரவு ரகசியமாகவே இருக்கும். 4.12. ஆபரேட்டரின் மறுசீரமைப்பு மற்றும் ஆபரேட்டரின் சட்டப்பூர்வ வாரிசுக்கு உரிமைகளை மாற்றும் போது பயனரின் தனிப்பட்ட தரவை ஆபரேட்டரால் மாற்றுவது சட்டபூர்வமானது, அதே நேரத்தில் அவர் பெற்ற தனிப்பட்ட தகவல்கள் தொடர்பாக இந்த ஒப்பந்தத்தின் விதிமுறைகளுக்கு இணங்குவதற்கான அனைத்து கடமைகளும் சட்ட வாரிசுக்கு மாற்றப்பட்டது. 4.13. இந்த அறிக்கை ஆபரேட்டரின் இணையதளத்திற்கு மட்டுமே பொருந்தும். தேடல் முடிவுகள் உட்பட, ஆபரேட்டரின் இணையதளத்தில் கிடைக்கும் இணைப்புகள் மூலம் பயனர் அணுகக்கூடிய மூன்றாம் தரப்பு தளங்களுக்கு (சேவைகள்) நிறுவனம் கட்டுப்படுத்தாது மற்றும் பொறுப்பல்ல. அத்தகைய தளங்களில் (சேவைகள்), பிற தனிப்பட்ட தகவல்கள் சேகரிக்கப்படலாம் அல்லது பயனரிடமிருந்து கோரப்படலாம், மேலும் பிற செயல்கள் செய்யப்படலாம் 5. தனிப்பட்ட தரவுகளின் பொருளாக பயனரின் உரிமைகள், பயனரால் தனிப்பட்ட தரவை மாற்றுதல் மற்றும் நீக்குதல் 5.1. பயனருக்கு உரிமை உள்ளது: 5.1.2. ஆபரேட்டரின் தனிப்பட்ட தரவை தெளிவுபடுத்தவும், அதைத் தடுக்கவும் அல்லது அழிக்கவும், தனிப்பட்ட தரவு முழுமையற்றது, காலாவதியானது, தவறானது, சட்டவிரோதமாகப் பெறப்பட்டது அல்லது செயலாக்கத்தின் கூறப்பட்ட நோக்கத்திற்காக அவசியமில்லை, மேலும் அவரது உரிமைகளைப் பாதுகாக்க சட்டத்தால் வழங்கப்பட்ட நடவடிக்கைகளை எடுக்கவும். 5.1.3. 5.1.3.1 அடங்கிய தகவல் உட்பட, அவரது தனிப்பட்ட தரவை செயலாக்குவது தொடர்பான தகவலைப் பெறவும். ஆபரேட்டரால் தனிப்பட்ட தரவை செயலாக்குவதற்கான உண்மையை உறுதிப்படுத்துதல்; 5.1.3.2. ஆபரேட்டரால் பயன்படுத்தப்படும் தனிப்பட்ட தரவை செயலாக்குவதற்கான நோக்கங்கள் மற்றும் முறைகள்; 5.1.3.3. ஆபரேட்டரின் பெயர் மற்றும் இடம்; 5.1.3.4. தனிப்பட்ட தரவின் தொடர்புடைய பொருள் தொடர்பான செயலாக்கப்பட்ட தனிப்பட்ட தரவு, அவற்றின் ரசீதுக்கான ஆதாரம், அத்தகைய தரவை வழங்குவதற்கான வேறுபட்ட நடைமுறை கூட்டாட்சி சட்டத்தால் வழங்கப்படாவிட்டால்; 5.1.3.5. தனிப்பட்ட தரவை செயலாக்குவதற்கான விதிமுறைகள், அவற்றின் சேமிப்பக காலங்கள் உட்பட; 5.1.3.6. ரஷ்ய கூட்டமைப்பின் தற்போதைய சட்டத்தால் வழங்கப்பட்ட பிற தகவல்கள். 5.2 தனிப்பட்ட தரவை செயலாக்குவதற்கான ஒப்புதலை திரும்பப் பெறுவது, ஆபரேட்டருக்கு பொருத்தமான எழுதப்பட்ட (உறுதியான ஊடகத்தில் அச்சிடப்பட்டு பயனரால் கையொப்பமிடப்பட்ட) அறிவிப்பை அனுப்புவதன் மூலம் பயனரால் மேற்கொள்ளப்படும். 6. ஆபரேட்டரின் பொறுப்புகள். தனிப்பட்ட தரவுக்கான அணுகல் 6.1. ஆபரேட்டரின் வலைத்தளத்தின் பயனர்களின் தனிப்பட்ட தரவுகளுக்கு அங்கீகரிக்கப்படாத மற்றும் இலக்கு இல்லாத அணுகலைத் தடுப்பதை ஆபரேட்டர் உறுதிசெய்கிறார். இந்த வழக்கில், தள பயனர்களின் தனிப்பட்ட தரவுக்கான அங்கீகரிக்கப்பட்ட மற்றும் இலக்கு அணுகல் அனைத்து ஆர்வமுள்ள தரப்பினராலும் அணுகப்படும், இது ஆபரேட்டரின் தளத்தின் குறிக்கோள்கள் மற்றும் பொருளின் கட்டமைப்பிற்குள் செயல்படுத்தப்படும். அதே நேரத்தில், பயனர்களின் தனிப்பட்ட தரவை தவறாகப் பயன்படுத்துவதற்கு ஆபரேட்டர் பொறுப்பல்ல, இதன் விளைவாக ஏற்படும்: மென்பொருள் மற்றும் வன்பொருள் மற்றும் நெட்வொர்க்குகளில் ஆபரேட்டரின் கட்டுப்பாட்டிற்கு அப்பாற்பட்ட தொழில்நுட்ப சிக்கல்கள்; மூன்றாம் தரப்பினரின் நோக்கத்திற்காக அல்லாமல், ஆபரேட்டரின் வலைத்தளங்களை வேண்டுமென்றே அல்லது தற்செயலாகப் பயன்படுத்துவது தொடர்பாக; 6.2 பயனரின் தனிப்பட்ட தகவலை அங்கீகரிக்கப்படாத அல்லது தற்செயலான அணுகல், அழிவு, மாற்றம், தடுப்பது, நகலெடுத்தல், விநியோகம் மற்றும் அதனுடன் உள்ள மூன்றாம் தரப்பினரின் பிற சட்டவிரோத செயல்களில் இருந்து பாதுகாக்க தேவையான மற்றும் போதுமான நிறுவன மற்றும் தொழில்நுட்ப நடவடிக்கைகளை ஆபரேட்டர் எடுக்கிறார். 7. தனியுரிமைக் கொள்கையில் மாற்றங்கள். பொருந்தக்கூடிய சட்டம் 7.1. பயனர்களுக்கு எந்த சிறப்பு அறிவிப்பும் இல்லாமல் இந்த விதிமுறைகளில் மாற்றங்களைச் செய்ய ஆபரேட்டருக்கு உரிமை உண்டு. தற்போதைய பதிப்பில் மாற்றங்கள் செய்யப்படும்போது, ​​கடைசியாக புதுப்பிக்கப்பட்ட தேதி குறிப்பிடப்படும். ஒழுங்குமுறைகளின் புதிய பதிப்பு, விதிமுறைகளின் புதிய பதிப்பால் வழங்கப்படாவிட்டால், அது வெளியிடப்பட்ட தருணத்திலிருந்து நடைமுறைக்கு வரும். 7.2 ரஷ்ய கூட்டமைப்பின் சட்டம் இந்த ஒழுங்குமுறை மற்றும் ஒழுங்குமுறையின் பயன்பாடு தொடர்பாக எழும் பயனர் மற்றும் ஆபரேட்டர் இடையேயான உறவுக்கு பொருந்தும். ஏற்கிறேன் நான் ஏற்கவில்லை