உரை ஆவணங்களுக்கான சிறப்பு மார்க்அப் மொழி அழைக்கப்படுகிறது. HTML ஆவண மார்க்அப் மொழி. தருக்க மற்றும் காட்சி மார்க்அப்

மார்க்அப் மொழிகள்) என்பது குறிச்சொற்கள் எனப்படும் சிறப்பு வழிமுறைகளின் தொகுப்பாகும், இது ஆவணங்களில் ஒரு கட்டமைப்பை உருவாக்க மற்றும் இந்த கட்டமைப்பின் பல்வேறு கூறுகளுக்கு இடையிலான உறவுகளை வரையறுக்க வடிவமைக்கப்பட்டுள்ளது. வேறு வார்த்தைகளில் கூறுவதானால், மார்க்அப் ஆவணத்தின் எந்தப் பகுதி தலைப்பு, இது ஒரு வசனம், ஆசிரியரின் பெயரைக் கருதுவது போன்றவற்றைக் காட்டுகிறது. மார்க்அப் ஸ்டைலிஸ்டிக் மார்க்அப், கட்டமைப்பு மற்றும் சொற்பொருள் என பிரிக்கப்பட்டுள்ளது. ஸ்டைலிஸ்டிக் மார்க்அப்

ஆவணத்தின் தோற்றத்திற்கு ஸ்டைலிஸ்டிக் மார்க்அப் பொறுப்பு. எடுத்துக்காட்டாக, HTML இல் இந்த வகை மார்க்அப் போன்ற குறிச்சொற்கள் அடங்கும் (சாய்வு), (தடித்தது), (அடிக்கோடு), (உரையின் மூலம் அடிக்கோடு) போன்றவை.

கட்டமைப்பு குறித்தல்

கட்டமைப்பு மார்க்அப் ஆவணத்தின் கட்டமைப்பை வரையறுக்கிறது. HTML இல், எடுத்துக்காட்டாக, குறிச்சொற்கள் (பத்தி), (தலைப்பு), (பிரிவு) போன்றவை இந்த வகை மார்க்அப்களுக்கு பொறுப்பாகும்.

சொற்பொருள் மார்க்அப்

சொற்பொருள் மார்க்அப் தரவின் உள்ளடக்கத்தை தெரிவிக்கிறது. குறிச்சொற்கள் (ஆவணத்தின் பெயர்), (குறியீடு, குறியீடு பட்டியல்களுக்குப் பயன்படுத்தப்படுகிறது), (மாறி), (ஆசிரியரின் முகவரி) ஆகியவை இந்த வகை மார்க்அப்பின் எடுத்துக்காட்டுகள்.

எந்த மார்க்அப் மொழியின் அடிப்படைக் கருத்துக்களும் குறிச்சொற்கள், கூறுகள் மற்றும் பண்புக்கூறுகள் ஆகும்.

குறிச்சொற்கள் மற்றும் கூறுகள்.

குறிச்சொற்கள் மற்றும் கூறுகளின் அர்த்தங்கள் பெரும்பாலும் குழப்பமடைகின்றன.

குறிச்சொற்கள் அல்லது கட்டுப்பாட்டு விளக்கங்கள் என்றும் அழைக்கப்படும், குறிச்சொல்லின் உள்ளடக்கங்களை என்ன செய்வது என்பது குறித்த ஆவணத்தின் உள்ளடக்கங்களை கிளையன்ட் பக்கத்தில் காண்பிக்கும் நிரலுக்கான வழிமுறைகளாகச் செயல்படுகின்றன. ஆவணத்தின் முக்கிய உள்ளடக்கத்துடன் தொடர்புடைய குறிச்சொல்லை முன்னிலைப்படுத்த, கோண அடைப்புக்குறிகள் பயன்படுத்தப்படுகின்றன: குறிச்சொல் () குறியீட்டைக் காட்டிலும் குறைவாகத் தொடங்குகிறது, அதன் உள்ளே அறிவுறுத்தல்களின் பெயர் மற்றும் அவற்றின் அளவுருக்கள் வைக்கப்படுகின்றன. எடுத்துக்காட்டாக, HTML இல் குறிச்சொல் பின்வரும் உரை சாய்வாக இருக்க வேண்டும் என்பதைக் குறிக்கிறது.

ஒரு உறுப்பு என்பது அவற்றின் உள்ளடக்கத்துடன் குறிச்சொற்கள் ஆகும். பின்வரும் கட்டுமானம் ஒரு உறுப்புக்கு ஒரு எடுத்துக்காட்டு:

இந்த உரை சாய்வு எழுத்துக்களில் உள்ளது .

உறுப்பு ஒரு தொடக்க குறிச்சொல்லைக் கொண்டுள்ளது (எங்கள் எடுத்துக்காட்டில் இது குறிச்சொல் ), டேக் உள்ளடக்கம் (உதாரணத்தில் இது "இது சாய்வு எழுத்துக்களில் உள்ள உரை") மற்றும் மூடும் குறிச்சொல்(), சில நேரங்களில் HTML இல் இருந்தாலும், மூடும் குறிச்சொல் தவிர்க்கப்படலாம்.

பண்புக்கூறுகள்

ஒரு உறுப்பை வரையறுக்கும்போது இந்த உறுப்பின் பண்புகளை தெளிவுபடுத்தும் எந்த அளவுருக்களையும் அமைக்க, பண்புக்கூறுகள் பயன்படுத்தப்படுகின்றன.

பண்புக்கூறுகள் ஒரு பெயர் = மதிப்பு ஜோடியைக் கொண்டிருக்கும், அவை தொடக்கக் குறிச்சொல்லில் ஒரு உறுப்பை வரையறுக்கும்போது குறிப்பிடலாம். சம சின்னத்தின் இடது மற்றும் வலதுபுறத்தில் இடைவெளிகளை நீங்கள் விடலாம். பண்புக்கூறு மதிப்பு ஒற்றை அல்லது இரட்டை மேற்கோள்களில் இணைக்கப்பட்ட சரமாக குறிப்பிடப்படுகிறது.

அந்த பண்பு வரையறுக்கப்பட்டால் எந்த குறிச்சொல்லும் ஒரு பண்புக்கூறைக் கொண்டிருக்கலாம்.

பண்புக்கூறு பயன்படுத்தப்படும்போது, ​​உறுப்பு பின்வரும் வடிவத்தை எடுக்கும்:

குறிச்சொல் உள்ளடக்கம்

உரை மையத்தில் சீரமைக்கப்பட்டுள்ளது

ஒரு தொடக்கக் குறிச்சொல் பல பண்புக்கூறுகளைக் கொண்டிருக்கலாம், எடுத்துக்காட்டாக:

குறிப்பிட்ட உரை அளவு மற்றும் வண்ணம்

மார்க்அப் மொழிகளின் வளர்ச்சியின் வரலாறு.

ஹைபர்டெக்ஸ்ட் என்ற கருத்து 1945 இல் டபிள்யூ. புஷ்ஷால் அறிமுகப்படுத்தப்பட்டது, மேலும் 60 களில் தொடங்கி, ஹைபர்டெக்ஸ்ட் தரவைப் பயன்படுத்தும் முதல் பயன்பாடுகள் தோன்றத் தொடங்கின. இருப்பினும், பல தகவல் வளங்களை இணைப்பதற்கான ஒரு பொறிமுறையின் உண்மையான தேவை எழுந்தபோது, ​​இந்த தொழில்நுட்பம் அதன் முக்கிய வளர்ச்சியைப் பெற்றது, இது நேரியல் அல்லாத உரையை உருவாக்கும் மற்றும் பார்க்கும் திறனை வழங்குகிறது.

1986 இல், ஐஎஸ்ஓ தரநிலைப்படுத்தப்பட்ட பொதுவான மார்க்அப் மொழிக்கு ஒப்புதல் அளித்தது. இந்த மொழி பிற மார்க்அப் மொழிகளை உருவாக்குவதற்காக வடிவமைக்கப்பட்டுள்ளது; இது செல்லுபடியாகும் குறிச்சொற்கள், அவற்றின் பண்புக்கூறுகள் மற்றும் ஆவணத்தின் உள் அமைப்பு ஆகியவற்றை வரையறுக்கிறது. எனவே, ஆவணத்தின் உள்ளடக்கம் தொடர்பான உங்கள் சொந்த குறிச்சொற்களை உருவாக்க முடியும். ஆவண வகை வரையறையில் (DTD) சேமிக்கப்பட்டுள்ள மார்க்அப் மொழி வரையறை இல்லாமல் அத்தகைய ஆவணங்களை விளக்குவது கடினம் என்பது இப்போது தெளிவாகிறது. SGML தரநிலையில் மொழியின் அனைத்து விதிகளையும் DTD குழுவாக்குகிறது. வேறு வார்த்தைகளில் கூறுவதானால், DTD குறிச்சொற்களின் உறவையும் அவற்றின் பயன்பாட்டிற்கான விதிகளையும் விவரிக்கிறது. மேலும், ஒவ்வொரு வகை ஆவணங்களுக்கும், தொடர்புடைய மார்க்அப் மொழியின் இலக்கணத்தை விவரிக்கும் அதன் சொந்த விதிகள் வரையறுக்கப்பட்டுள்ளன. எனவே, டிடிடியின் உதவியுடன் மட்டுமே குறிச்சொற்களின் சரியான பயன்பாட்டை ஒருவர் சரிபார்க்க முடியும், எனவே, அது SGML ஆவணத்துடன் அனுப்பப்பட வேண்டும் அல்லது ஆவணத்தில் சேர்க்கப்பட வேண்டும்.

அந்த நேரத்தில், SGML ஐத் தவிர, பல ஒத்த மொழிகள் ஒருவருக்கொருவர் போட்டியிடுகின்றன, ஆனால் புகழ் (HTML, அதன் சந்ததியினரில் ஒன்றாகும்) SGML ஐ அதன் சகாக்களை விட மறுக்க முடியாத நன்மையைக் கொடுத்தது.

SGML ஐப் பயன்படுத்தி, நீங்கள் கட்டமைக்கப்பட்ட தரவை விவரிக்கலாம், ஆவணங்களில் உள்ள தகவலை ஒழுங்கமைக்கலாம் மற்றும் சில தரப்படுத்தப்பட்ட வடிவத்தில் இந்தத் தகவலை வழங்கலாம். ஆனால் அதன் சிக்கலான தன்மை காரணமாக, மற்ற மொழிகளின் தொடரியல் விவரிக்க SGML பயன்படுத்தப்பட்டது, மேலும் சில பயன்பாடுகள் SGML ஆவணங்களுடன் நேரடியாக வேலை செய்தன. SGML பொதுவாக பெரிய திட்டங்களில் மட்டுமே பயன்படுத்தப்படுகிறது, எடுத்துக்காட்டாக, ஒரு பெரிய நிறுவனத்திற்கான ஒருங்கிணைந்த ஆவண மேலாண்மை அமைப்பை உருவாக்க.

HTML மார்க்அப் மொழி SGML ஐ விட மிகவும் எளிமையானது மற்றும் மிகவும் வசதியானது, அதன் வழிமுறைகள் முதன்மையாக திரையில் ஆவண உள்ளடக்கத்தைக் காண்பிக்கும் செயல்முறையைக் கட்டுப்படுத்தும் நோக்கம் கொண்டது. HTML தொழில்நுட்ப ஆவணங்களைக் குறிக்கும் ஒரு வழியாக 1991 இல் டிம் பெர்னர்ஸ்-லீ அவர்களால் விஞ்ஞான சமூகத்திற்காக உருவாக்கப்பட்டது. இது முதலில் SGML பயன்பாடுகளில் ஒன்றாகும்.

ஒரு ஆவணத்தின் பகுதிகளை வகைப்படுத்தி, உலாவியில் அதன் சரியான காட்சியை உறுதி செய்வதே HTML ஆல் செய்யக்கூடிய ஒரே விஷயம் என்றாலும், இது மிகவும் பிரபலமான மார்க்அப் மொழியாகும். ஏனென்றால் HTML கற்றுக்கொள்வது மிகவும் எளிதானது. நீங்கள் செய்ய வேண்டியது HTML கட்டளைகளைக் கற்றுக்கொள்வது மட்டுமே. HTML க்கான DTD உலாவியில் சேமிக்கப்படுகிறது. கூடுதலாக, HTML பல்வேறு தளங்களில் வேலை செய்ய வடிவமைக்கப்பட்டுள்ளது என்பதை கவனத்தில் கொள்ள வேண்டும். ஆனால் இது பல குறிப்பிடத்தக்க வரம்புகளைக் கொண்டுள்ளது:

  • HTML ஆனது நிலையான குறிச்சொற்களை கொண்டுள்ளது, மேலும் இந்த தொகுப்பை விரிவாக்கவோ மாற்றவோ முடியாது;
  • HTML மொழி குறிச்சொற்கள் தரவு எவ்வாறு வழங்கப்பட வேண்டும் என்பதை மட்டுமே காட்டுகின்றன, அதாவது ஆவணத்தின் தோற்றம். குறிச்சொற்களில் உள்ள உள்ளடக்கத்தின் பொருள் அல்லது ஆவணத்தின் அமைப்பு பற்றிய தகவலை HTML கொண்டு செல்லாது.
  • பிப்ரவரி 1998 இன் தொடக்கத்தில், சர்வதேச அமைப்பான W3C, எக்ஸ்எம்எல் தரநிலையின் அடிப்படையில் இணையத்தில் தகவல்களைப் பரிமாற்றுவதற்கான பல புதிய மார்க்அப் மொழிகளின் வளர்ச்சியின் தொடக்கத்தைக் குறித்தது. சாராம்சத்தில், இது ஹைபர்டெக்ஸ்ட் மார்க்அப் மொழிகளின் வளர்ச்சியில் ஒரு புதிய படியைக் குறிக்கிறது. அதன் இருப்பு நான்கு ஆண்டுகளில், எக்ஸ்எம்எல் சாதாரண பயனர்கள் மற்றும் பல வலை வடிவமைப்பாளர்களிடமிருந்து கவனத்தை ஈர்த்தது மட்டுமல்லாமல், இணையத்தின் ஒருங்கிணைந்த பகுதியாகவும் மாறியுள்ளது. இன்று, இந்த தொழில்நுட்பத்தை HTML இன் அனலாக் ஆக பயன்படுத்தாத சேவையகங்கள் எதுவும் நடைமுறையில் இல்லை. எவ்வாறாயினும், உலகளாவிய நெட்வொர்க்கில் ஹைபர்டெக்ஸ்டை அனுப்பும் முக்கிய முறையாக எக்ஸ்எம்எல் இப்போது மாறி வருகிறது என்று கூறுவது இன்னும் முன்கூட்டியே உள்ளது. மொழி இன்னும் இளமையாக உள்ளது, மேலும் அதன் சில கூறுகள் இன்னும் வளர்ச்சியில் உள்ளன. இதுவரை, எதிர்காலத்தில் HTML ஐ மாற்றுவது என்ன என்பதற்கான பொதுவான கட்டமைப்பை மட்டுமே உருவாக்கியுள்ளது, ஆனால் அது எந்த வடிவத்தில் இருக்கும் என்று இன்னும் சொல்ல முடியாது.

    தொடக்கத்தில் இருந்து

    நவம்பர் 1990 இல், இணைய பயனர்கள் ஒரு புதிய தொழில்நுட்பத்தைப் பற்றி முதன்முதலில் கேள்விப்பட்டபோது, ​​​​அதன் பெயர் மூன்று எழுத்துக்களில் எளிதில் பொருந்தக்கூடியது, மிகக் குறைந்த நேரம் கடக்கும் என்று யாரும் கற்பனை செய்து பார்க்க முடியாது, மேலும் இந்த தொழில்நுட்பம் நடைமுறையில் தகவல்களை அனுப்புவதற்கான ஒரே வழியாகும். உலகளாவிய நெட்வொர்க். இன்று, பல அனுபவமற்ற பயனர்களுக்கு, இண்டர்நெட் என்ற வார்த்தை WWW உடன் வலுவாக தொடர்புடையது, உண்மையில் இந்த விஷயங்கள், நிச்சயமாக, ஒருவருக்கொருவர் தொடர்புடையவை, ஆனால் இன்னும் கொஞ்சம் வித்தியாசமாக உள்ளன.

    மொத்தத்தில், உலகளாவிய வலை மற்றும் அதன் ஒருங்கிணைந்த பகுதியான HTML இன் நம்பமுடியாத புகழ், இது நிச்சயமாக ஆவணங்களின் ஹைபர்டெக்ஸ்ட் மார்க்அப் கட்டமைப்புகளில் அதிக கவனம் செலுத்த காரணமாக அமைந்தது.

    ஹைபர்டெக்ஸ்ட் என்ற கருத்து முதன்முதலில் வி. புஷ்ஷால் 1945 இல் அறிமுகப்படுத்தப்பட்டது. இருப்பினும், அத்தகைய தரவு கட்டமைப்புகளைப் பயன்படுத்தும் உண்மையான பயன்பாடுகள் 60 களில் இருந்து மட்டுமே பயன்படுத்தத் தொடங்கின, மேலும் பல தகவல் வளங்களை இணைப்பதற்கான ஒரு பொறிமுறையின் உண்மையான தேவை இருக்கும்போது மட்டுமே இந்த தொழில்நுட்பத்தைச் சுற்றி ஒரு உண்மையான அசாதாரண செயல்பாடு தொடங்கியது. நேரியல் அல்லாத உரையைக் காண்க. இந்த பொறிமுறையை செயல்படுத்துவதற்கான ஒரு எடுத்துக்காட்டு அதே WWW ஆகும்.

    ஆவண மார்க்அப் மொழி என்பது குறிச்சொற்கள் எனப்படும் சிறப்பு வழிமுறைகளின் தொகுப்பாகும் (சில மொழிபெயர்க்கப்பட்ட வெளியீடுகளில், குறிச்சொற்கள் குறுக்குவழிகள் என அழைக்கப்படுகின்றன), ஆவணங்களில் ஒரு கட்டமைப்பை உருவாக்கவும், இந்த கட்டமைப்பின் பல்வேறு கூறுகளுக்கு இடையே முறையே உறவுகளை வரையறுக்கவும் வடிவமைக்கப்பட்டுள்ளது. மார்க்அப் மொழி குறிச்சொற்கள் அல்லது சில நேரங்களில் அழைக்கப்படும் கட்டுப்பாட்டு விளக்கங்கள், அத்தகைய ஆவணங்களில் குறியாக்கம் செய்யப்படுகின்றன, அவை ஆவணத்தின் முக்கிய உள்ளடக்கத்துடன் தொடர்புடையதாக ஒதுக்கப்பட்டு, அதன் உள்ளடக்கங்களை விளக்கி காண்பிக்கும் நிரலுக்கான வழிமுறைகளாக செயல்படுகின்றன. ஆவணம், உண்மையில், அதைப் பார்க்கும் நபருக்கு, நீங்கள் இணையத்துடன் ஒப்புமைகளைக் கண்டுபிடிக்க முயற்சித்தால், இது யாரோ கிளையன்ட், மற்றும் மிகவும் பொதுவான வழக்கில் மொழிபெயர்ப்பாளர் நிரல் உலாவி). ஏற்கனவே முதல் அமைப்புகளில், இந்த கட்டளைகளை நியமிக்க "" சின்னங்களைப் பயன்படுத்த முடிவு செய்யப்பட்டது, அதன் உள்ளே அறிவுறுத்தல்களின் பெயர்கள் மற்றும் அவற்றின் அளவுருக்கள் வைக்கப்பட்டுள்ளன. இன்று, குறிச்சொற்களை பெயரிடும் இந்த முறை பொதுவாக ஏற்றுக்கொள்ளப்பட்ட தரநிலையாகும்.

    நவீன தகவல் அமைப்புகளில் ஒரு உரை ஆவணத்தின் ஹைபர்டெக்ஸ்ட் முறிவின் பயன்பாடு பெரும்பாலும் ஹைபர்டெக்ஸ்ட் தகவலை நேரியல் அல்லாத பார்வைக்கு ஒரு பொறிமுறையை உருவாக்க உங்களை அனுமதிக்கிறது என்பதன் காரணமாகும். இதன் பொருள், கணினிகளில், தரவு என்பது உரை கட்டமைப்புகளின் தொடர்ச்சியான ஸ்ட்ரீமாக வழங்கப்படுவதில்லை, ஆனால் ஹைப்பர்லிங்க்களைப் பயன்படுத்தி வழிசெலுத்தப்படும் ஒன்றோடொன்று இணைக்கப்பட்ட கூறுகளின் தொகுப்பாகும்.

    இன்று மிகவும் பிரபலமான மற்றும் நன்கு அறியப்பட்ட ஹைபர்டெக்ஸ்ட் மார்க்அப் மொழி, HTML, குறிப்பாக இணையத்தில் அமைந்துள்ள தகவல்களை கட்டமைக்கவும் அனுப்பவும் உருவாக்கப்பட்டது, மேலும் இது சந்தேகத்திற்கு இடமின்றி WWW தொழில்நுட்பத்தின் முக்கிய அங்கமாகும். ஹைப்பர்டெக்ஸ்ட் ஆவண மாதிரியைப் பயன்படுத்துவதன் மூலம், நெட்வொர்க்கில் பல்வேறு தகவல் ஆதாரங்களை வழங்குவதற்கான வழி மிகவும் ஒழுங்கமைக்கப்பட்டுள்ளது, மேலும் பயனர்கள் தேவையான தகவல்களைத் தேடுவதற்கும் பார்ப்பதற்கும் வசதியான வழிமுறையைப் பெற்றுள்ளனர். இருப்பினும், இந்த விஷயத்தில் முதல் அடையாளம் இன்னும் பழைய மொழியாகக் கருதப்படுகிறது - SGML.

    எஸ்ஜிஎம்எல் (தரநிலை பொதுமைப்படுத்தப்பட்ட மார்க்அப் மொழி) 1986 இல் அதிகாரப்பூர்வமாக ஒரு சர்வதேச தரமாக (ISO 8879:1986) உள்ளீடு/வெளியீட்டு சாதனம் மற்றும் மின்னணு வடிவத்தில் உரைத் தகவலைப் பிரதிநிதித்துவப்படுத்துவதற்கான சூழல் சார்பற்ற முறைகளை விவரிக்கிறது. அதன் உருவாக்கத்திற்கான அடிப்படையானது பழைய மார்க்அப் மொழி GML (பொதுவாக்கப்பட்ட மார்க்அப் மொழி) ஆகும், இது முதல் தனிப்பட்ட கணினிகளின் நாட்களில் IBM ஆல் உருவாக்கப்பட்டது. துல்லியமாகச் சொல்வதானால், SGML என்பது மற்ற மார்க்அப் மொழிகளை விவரிக்க வடிவமைக்கப்பட்ட ஒரு உலோக மொழியாகும்.

    முதலில், மார்க்அப் என்ற சொல் பொதுவாக ஒரு குறிப்பிட்ட பத்தியை எவ்வாறு தட்டச்சு செய்ய வேண்டும் என்பதை ஆவண எழுத்தாளருக்கு அல்லது "லேஅவுட் டிசைனர்" என்று சில சமயங்களில் அழைக்கப்படுகிறது. இத்தகைய முறைகளில் சாய்வுகளைக் குறிக்க squiggly அடிக்கோடிடுதல், சில சொற்றொடர்களைத் தவிர்க்க அல்லது குறிப்பிட்ட எழுத்துருவில் அச்சிடுவதற்கு சில சிறப்பு சின்னங்கள் போன்றவை இருக்கலாம். வடிவமைத்தல் மற்றும் அச்சிடுதல் ஆகியவை காலப்போக்கில் தானியங்கு ஆனதால், வடிவமைப்பு, அச்சிடுதல் அல்லது பிற செயலாக்கத்தைக் கட்டுப்படுத்த மின்னணு உரை ஆவணங்களில் செருகப்பட்ட அனைத்து வகையான சிறப்பு மார்க்அப் குறியீடுகளையும் இந்த வார்த்தை உள்ளடக்கியது.

    மார்க்அப் மொழி என்பது உரையின் தொகுதிகளை குறியாக்கப் பயன்படுத்தப்படும் வடிவமைப்பு மரபுகளின் தொகுப்பைக் குறிக்கிறது. கொடுக்கப்பட்ட ஆவணத்தில் என்ன மார்க்அப் ஏற்றுக்கொள்ளப்படுகிறது, என்ன மார்க்அப் தேவைப்படுகிறது, எளிய உரையிலிருந்து அதன் கூறுகளை எவ்வாறு வேறுபடுத்துவது மற்றும் மார்க்அப் என்றால் என்ன என்பதை மார்க்அப் மொழி தெளிவாகக் குறிக்க வேண்டும். SGML ஆல் முதல் மூன்று பிரச்சனைகளை தீர்க்க முடிந்தது, கடைசி பிரச்சனைக்கான தீர்வுக்கு முறைசாரா விளக்கம் தேவை.

    SGML, அதன் அடிப்படையில் உருவாக்கப்பட்ட மற்ற அனைத்து மார்க்அப் மொழிகளைப் போலல்லாமல், செயல்முறை மார்க்அப் என்பதற்குப் பதிலாக விளக்க மார்க்அப் என்று அழைக்கப்படும் கொள்கையைப் பயன்படுத்துகிறது. அத்தகைய அமைப்பு ஒரு ஆவணத்தின் தனிப்பட்ட பகுதிகளை குறிப்பிட்ட வகைகளுக்கு ஒதுக்க பெயர்களை வழங்கும் மார்க்அப் கூறுகளைப் பயன்படுத்துகிறது. வேறு வார்த்தைகளில் கூறுவதானால், Or \end(list) போன்ற குறிச்சொற்கள் ஒரு ஆவணத்தின் ஒரு பகுதியை வெறுமனே அடையாளம் கண்டு, "இந்தப் பகுதி ஒரு பத்தி" அல்லது "இந்தப் பகுதி தொடங்கப்பட்ட பட்டியலின் முடிவு" என்று குறிப்பிடுகிறது. செயல்முறை மார்க்அப்பைப் பயன்படுத்தும் அமைப்பு (உதாரணமாக, மைக்ரோசாஃப்ட் வேர்ட், சொல் செயலிகள் அடங்கும்) உரை ஆவணத்தில் ஒரு குறிப்பிட்ட கட்டத்தில் எந்த வகையான செயலாக்கம் செய்யப்பட வேண்டும் என்பதை தீர்மானிக்கிறது: "இந்த இடத்தில், அளவுருக்கள் 5 உடன் அத்தகைய செயல்முறையை அழைக்கவும், e மற்றும் z" அல்லது "எந்த உறுப்புக்கும் தொடர்புடைய ஆவணத்தின் எல்லையை 7 மிமீ வலதுபுறமாக நகர்த்தவும், ஒரு வரியைத் தவிர்க்கவும், அடுத்ததை சிவப்புக் கோட்டிலிருந்து தொடங்கவும். SGML இல், சில குறிப்பிட்ட நோக்கங்களுக்காக (உதாரணமாக, வடிவமைத்தல்) ஆவணத்தைச் செயலாக்கத் தேவையான வழிமுறைகள் ஆவணத்தில் உள்ள விளக்கமான மார்க்அப்பில் இருந்து தெளிவாகப் பிரிக்கப்படுகின்றன. அவை வழக்கமாக ஆவணத்திற்கு வெளியே தனி நடைமுறைகள் அல்லது திட்டங்களில் சேகரிக்கப்படுகின்றன.

    செயல்முறை மார்க்அப்பை விட விளக்கத்தைப் பயன்படுத்துவதன் மூலம், ஒரே ஆவணத்தை வெவ்வேறு நிரல்களால் செயலாக்க முடியும், அவை ஒவ்வொன்றும் அதன் சொந்த செயலாக்க வழிமுறைகளை அது முக்கியமானதாகக் கருதும் பகுதிகளுக்குப் பயன்படுத்தலாம். எடுத்துக்காட்டாக, ஒரு உள்ளடக்க பாகுபடுத்தும் நிரல் அடிக்குறிப்புகளை முழுவதுமாக புறக்கணிக்கக்கூடும், அதே சமயம் ஒரு வடிவமைப்பு நிரல் பிரித்தெடுத்து ஒவ்வொரு பகுதியின் முடிவிலும் அச்சிடுவதற்காக அவற்றைச் சேகரிக்கலாம். வெவ்வேறு வகையான செயலாக்க வழிமுறைகள் கோப்பின் ஒரே பகுதியுடன் தொடர்புடையதாக இருக்கலாம். எடுத்துக்காட்டாக, ஒரு நிரல் குறியீட்டு அல்லது தரவுத்தளத்தை உருவாக்க ஒரு ஆவணத்திலிருந்து நபர்களின் பெயர்கள் மற்றும் இடப் பெயர்களைப் பிரித்தெடுக்கலாம், அதே நேரத்தில் அதே உரையைச் செயலாக்கும் மற்றொரு நிரல் பெயர்களை வேறு எழுத்துருவில் அச்சிடலாம்.

    SGML ஒரு ஆவண வகையின் கருத்தையும் அறிமுகப்படுத்துகிறது, அதன்படி, அதை வரையறுக்கும் வழிகள் (ஆவண வகை வரையறை, DTD). மற்ற கணினியில் செயலாக்கப்பட்ட பொருட்களைப் போலவே ஆவணங்களும் தட்டச்சு செய்யப்பட்டதாகக் கருதப்படுகின்றன. ஆவணத்தின் வகை அதன் கூறுகள் மற்றும் அவற்றின் கட்டமைப்பால் முறையாக தீர்மானிக்கப்படுகிறது. எடுத்துக்காட்டாக, ஒரு தலைப்பு மற்றும் ஆசிரியரின் பெயரைக் கொண்ட ஒரு ஆவண வகையை ஒருவர் வரையறுக்கலாம், அதைத் தொடர்ந்து ஒரு சுருக்கம் மற்றும் ஒன்று அல்லது அதற்கு மேற்பட்ட பத்திகளின் வரிசை. இந்த முறையான வரையறையின்படி தலைப்பு இல்லாத எந்த ஆவணமும் ஒரு அறிக்கையாக இருக்காது, ஒரு மனிதனின் பார்வையில் ஆவணம் எவ்வளவு அறிக்கை போன்றதாக இருந்தாலும், ஒரு சுருக்கத்தைத் தொடர்ந்து பத்திகளின் வரிசையை விட அதிகமாக இருக்கும். வாசகர்..

    ஆவணங்கள் அறியப்பட்ட வகைகளாக இருப்பதால், ஒரு குறிப்பிட்ட வகையைச் சேர்ந்ததாகக் கூறும் ஆவணத்தை செயலாக்க, பாகுபடுத்தி எனப்படும் சிறப்பு நிரலைப் பயன்படுத்தலாம் மற்றும் அந்த ஆவண வகைக்குத் தேவையான அனைத்து கூறுகளும் உள்ளனவா மற்றும் சரியான வரிசையில் மற்றும் சரியாக உள்ளதா எனச் சரிபார்க்கலாம். கட்டமைக்கப்பட்ட. மிக முக்கியமாக, ஒரே மாதிரியான வெவ்வேறு ஆவணங்களை ஒரே மாதிரியான முறையில் செயலாக்க முடியும். ஒரு ஆவணத்தின் தகவல் கட்டமைப்பில் உள்ள அறிவைப் பயன்படுத்தும் நிரல்களை எழுதுவது சாத்தியமாகும், இது மிகவும் புத்திசாலித்தனமாக இருக்கும்.

    SGML, ஒரு உலோக மொழியாக, குறிப்பிட்ட பயன்பாடுகளை குறிவைக்கும் குறிப்பிட்ட மொழிகளின் (பெரும்பாலும் "SGML பயன்பாடுகள்" என்று அழைக்கப்படும்) வரையறையை அனுமதிக்கிறது. WWW இல் பரவலாகப் பயன்படுத்தப்படும் HTML மொழி இதற்கு ஒரு எடுத்துக்காட்டு. அத்தகைய ஒவ்வொரு மொழியும் ஒரு டிடிடி வடிவத்தில் விவரிக்கப்பட்டுள்ளது, கூறுகள் மற்றும் அவற்றின் பண்புகளை வரையறுக்கிறது. அத்தகைய டிடிடி கொடுக்கப்பட்டவுடன், எஸ்ஜிஎம்எல் மென்பொருள் அந்த டிடிடியின் படி எழுதப்பட்ட ஆவணங்களைச் சரியாகச் செயலாக்க முடியும்.

    திட்டத்தில் கூட, இப்போது நம்மிடம் உள்ள உலகளாவிய நெட்வொர்க்கிற்கு தகவல் பரிமாற்ற மாதிரியை செயல்படுத்த இந்த மொழி குறிப்பாக வடிவமைக்கப்பட்டுள்ளது. வேறு வார்த்தைகளில் கூறுவதானால், HTML என்பது இணையத்தின் ஒரு தயாரிப்பு ஆகும். உண்மையில், HTML என்பது ஸ்டாண்டர்ட் ஜெனரலைஸ்டு மார்க்அப் லாங்குவேஜ் - எஸ்ஜிஎம்எல் (ஸ்டாண்டர்ட் ஜெனரலைஸ்டு மார்க்அப் லாங்குவேஜ்) இன் எளிமைப்படுத்தப்பட்ட பதிப்பாகும், இது கடந்த நூற்றாண்டின் 80களில் ஐஎஸ்ஓ ஒரு தரநிலையாக அங்கீகரிக்கப்பட்டது. SGTML என்பது அதன் தூய வடிவில் உள்ள ஒரு மொழி அல்ல, மாறாக பிற மொழிகளை உருவாக்குவதற்கான விதிகள் மற்றும் விளக்கங்களின் தொகுப்பாகும்; இது செல்லுபடியாகும் குறிச்சொற்கள், அவற்றின் பண்புக்கூறுகள் மற்றும் ஆவணத்தின் உள் அமைப்பு ஆகியவற்றை வரையறுக்கிறது. டிஸ்கிரிப்டர்களின் சரியான பயன்பாட்டின் மீதான கட்டுப்பாடு DTD விளக்கங்கள் எனப்படும் சிறப்பு விதிகளைப் பயன்படுத்தி மேற்கொள்ளப்படுகிறது, இது ஆவணத்தை பாகுபடுத்தும் போது கிளையன்ட் மொழிபெயர்ப்பாளர் நிரலால் பயன்படுத்தப்படுகிறது. ஒவ்வொரு வகை ஆவணங்களுக்கும், அதனுடைய சொந்த விதிகள் வரையறுக்கப்பட்டுள்ளன, அவை தொடர்புடைய மார்க்அப் மொழியின் இலக்கணத்தை விவரிக்கின்றன. SGML ஐப் பயன்படுத்தி, ஆவணங்களில் உள்ள தகவலை ஒழுங்கமைக்கலாம், கட்டமைக்கப்பட்ட தரவை விவரிக்கலாம் மற்றும் இந்தத் தகவலை அடுத்தடுத்த பயன்பாட்டிற்காக சில தரப்படுத்தப்பட்ட வடிவத்தில் வழங்கலாம். இருப்பினும், அதன் சில சிக்கலான தன்மை காரணமாக, SGML முக்கியமாக மற்ற மொழிகளின் தொடரியல் விவரிக்கப் பயன்படுத்தப்பட்டது (அதில் மிகவும் பிரபலமானது HTML ஆகும்), மேலும் சில பயன்பாடுகள் SGML ஆவணங்களுடன் நேரடியாக வேலை செய்தன.

    HTML என்பது SGML ஐ விட மிகவும் வசதியான மற்றும் பயன்படுத்த எளிதான மொழியாகும். அதன் அடிப்படையில் கூடுதல் மொழிகளை வரையறுக்க இது அனுமதிக்காது. HTML ஐப் பயன்படுத்துவது ஒரு தரநிலையின்படி ஒரு ஆவணத்தைக் குறிப்பதை உள்ளடக்குகிறது, இது மிகவும் வரையறுக்கப்பட்ட வழிமுறைகள் அல்லது குறிச்சொற்களால் வரையறுக்கப்படுகிறது. அத்தகைய அறிவுறுத்தல்கள், முதலில், ஒரு கிளையன்ட் நிரலின் திரையில் ஒரு ஆவணத்தின் உள்ளடக்கங்களைக் காண்பிக்கும் செயல்முறையைக் கட்டுப்படுத்தவும், அதன் மூலம் ஆவணத்தை வழங்கும் முறையைத் தீர்மானிக்கவும், ஆனால் அதன் ஒட்டுமொத்த அமைப்பு அல்ல. பெரும்பாலான சந்தர்ப்பங்களில், HTML தரவு ஒரு எளிய உரை கோப்பில் குறிப்பிடப்படுகிறது, இது http நெறிமுறையைப் பயன்படுத்தி பிணையத்தில் எளிதாக மாற்றப்படும்.

    இருப்பினும், காலப்போக்கில், பிரபலமான தொழில்நுட்பங்கள் மீது கடுமையான கோரிக்கைகளை வைக்கும்போது, ​​நவீன பயன்பாடுகளுக்கு கிளையன்ட் திரையில் தரவை வழங்குவதற்கு ஒரு மொழி மட்டுமல்ல, ஒரு ஆவணத்தின் கட்டமைப்பைத் தீர்மானிக்கவும் அதில் உள்ள கூறுகளை விவரிக்கவும் அனுமதிக்கும் ஒரு பொறிமுறையும் தேவைப்படுகிறது. . HTML ஒரு எளிய கட்டளைகளைக் கொண்டுள்ளது மற்றும் உரைத் தகவலை விவரிக்கும் பணியை வெற்றிகரமாகச் சமாளிக்கிறது மற்றும் பார்க்கும் நிரலின் திரையில் காண்பிக்கும் - ஒரு உலாவி. இருப்பினும், காட்டப்படும் தரவு, வடிவமைப்பிற்குப் பயன்படுத்தப்படும் குறிச்சொற்களுடன் எந்த வகையிலும் தொடர்புடையது அல்ல, எனவே பாகுபடுத்தும் நிரல்களுக்கு நமக்குத் தேவையான ஆவணத் துண்டுகளைக் கண்டறிய HTML குறிச்சொற்களைப் பயன்படுத்தும் திறன் இல்லை. அந்த. உதாரணமாக, அத்தகைய விளக்கத்தை சந்தித்தது

    உயர்ந்தது

    குறிச்சொற்களில் உள்ள உரையை எந்த நிறத்தில் காட்ட வேண்டும் என்பதை பார்வையாளர் அறிந்துகொள்வார், பெரும்பாலும் அதை சரியாகக் காண்பிப்பார், ஆனால் ஆவணத்தில் இந்தக் குறிச்சொல் எங்கு காணப்படுகிறது, தற்போதைய துண்டு எந்தக் குறிச்சொற்களில் இணைக்கப்பட்டுள்ளது என்பதைப் பற்றி முற்றிலும் அலட்சியமாக இருக்கும். பொருட்களுக்கு இடையேயான உறவுகள் சரியாக கட்டமைக்கப்பட்டுள்ளதா, அதில் உள்ள துண்டுகள் உள்ளன. ஒரு ஆவணத்தின் கட்டமைப்பில் உள்ள இந்த "அலட்சியம்" அதன் உள்ளே உள்ள தகவல்களைத் தேடுவது அல்லது பகுப்பாய்வு செய்வது கூறுகளாக உடைக்கப்படாத தொடர்ச்சியான உரைக் கோப்புடன் வேலை செய்வதிலிருந்து வேறுபட்டதாக இருக்காது என்பதற்கு வழிவகுக்கிறது. இது, உங்களுக்குத் தெரிந்தபடி, தகவலுடன் பணிபுரிய மிகவும் பயனுள்ள வழி அல்ல.

    HTML இல் செயல்படுத்தப்பட்ட யோசனையின் மற்றொரு குறிப்பிடத்தக்க குறைபாடு, அதன் குறிச்சொற்களின் வரையறுக்கப்பட்ட தொகுப்பாகும். HTML க்கான DTD விதிகள் ஒரு நிலையான விளக்கப்படங்களை வரையறுக்கின்றன, எனவே டெவலப்பர் தனது சொந்த, சிறப்பு குறிச்சொற்களை உள்ளிடுவதற்கு வாய்ப்பில்லை. புதிய மொழி நீட்டிப்புகள் அவ்வப்போது தோன்றினாலும் (இன்று HTML இன் சமீபத்திய பதிப்பு HTML 4.0), அவற்றின் தரப்படுத்தலுக்கான நீண்ட பாதை, முக்கிய உலாவி உற்பத்தியாளர்களிடையே நிலையான கருத்து வேறுபாடுகளுடன் சேர்ந்து, மொழியை விரைவாக மாற்றியமைப்பது கிட்டத்தட்ட சாத்தியமற்றது, அதன் பயன்பாடு சிறப்புத் தகவலைக் காண்பிப்பதற்காக (உதாரணமாக, மல்டிமீடியா, கணிதம், இரசாயன சூத்திரங்கள் போன்றவை).

    சொல்லப்பட்ட அனைத்தையும் சுருக்கமாகக் கூறினால், இந்த வகையான மொழிகளுக்கு நவீன டெவலப்பர்களால் விதிக்கப்பட்ட தேவைகளை HTML இன்று முழுமையாக பூர்த்தி செய்யவில்லை என்று வாதிடலாம். அதை மாற்ற, ஒரு புதிய ஹைபர்டெக்ஸ்ட் மார்க்அப் மொழி முன்மொழியப்பட்டது: சக்திவாய்ந்த, நெகிழ்வான மற்றும், அதே நேரத்தில், வசதியான எக்ஸ்எம்எல் மொழி.

    XML (Extensible Markup Language) என்பது XML ஆவணங்கள் எனப்படும் தரவுப் பொருள்களின் முழு வகுப்பையும் விவரிக்கும் மார்க்அப் மொழியாகும். பிற மொழிகளின் இலக்கணத்தை விவரிக்கவும் ஆவணங்களின் சரியான தன்மையைக் கட்டுப்படுத்தவும் இந்த மொழி பயன்படுத்தப்படுகிறது. அந்த. XML இல் எந்த மார்க்அப் குறிச்சொற்களும் இல்லை, அவை உருவாக்கப்படும் வரிசையை அது வரையறுக்கிறது. உதாரணமாக, ஒரு ஆவணத்தில் ரோஜா உறுப்பைப் பிரதிநிதித்துவப்படுத்த ஒரு குறிச்சொல்லைப் பயன்படுத்த வேண்டும் என்று நாம் நினைத்தால், XML ஆனது, நாம் வரையறுக்கும் குறிச்சொல்லை சுதந்திரமாகப் பயன்படுத்த அனுமதிக்கிறது, மேலும் ஆவணத்தில் பின்வருவனவற்றைப் போன்ற துணுக்குகளைச் சேர்க்கலாம்:

    உயர்ந்தது

    குறிச்சொற்களின் தொகுப்பை எளிதாக விரிவாக்கலாம். பூவின் விளக்கம் அது பூக்கும் கிரீன்ஹவுஸின் விளக்கத்திற்குள் அர்த்தமுள்ளதாக இருக்க வேண்டும் என்பதையும் நாங்கள் குறிப்பிட விரும்பினால், நாங்கள் புதிய குறிச்சொற்களை அமைத்து அவை தோன்றும் வரிசையைத் தேர்வு செய்கிறோம்:

    உயர்ந்தது

    நாம் இன்னும் சில பூக்களை அங்கு நட விரும்பினால், பின்வரும் மாற்றங்களைச் செய்ய வேண்டும்:

    உயர்ந்தது

    துலிப்

    கற்றாழை

    நீங்கள் பார்க்க முடியும் என, ஒரு XML ஆவணத்தை உருவாக்கும் செயல்முறை மிகவும் எளிமையானது மற்றும் HTML பற்றிய அடிப்படை அறிவு மற்றும் XML ஐ மார்க்அப் மொழியாகப் பயன்படுத்தி நாம் செய்ய விரும்பும் பணிகளைப் பற்றிய புரிதல் மட்டுமே நமக்கு தேவைப்படுகிறது. இது ஒரு ஆவணத்தில் உள்ள தரவை மிகவும் திறம்பட வரையறுக்க அனுமதிக்கும் தனிப்பயன் கட்டளைகளை வரையறுக்கும் தனித்துவமான திறனை டெவலப்பர்களுக்கு வழங்குகிறது. ஆவணத்தின் ஆசிரியர் அதன் கட்டமைப்பை உருவாக்குகிறார், உறுப்புகளுக்கு இடையே தேவையான இணைப்புகளை உருவாக்குகிறார், அவரது தேவைகளைப் பூர்த்தி செய்யும் கட்டளைகளைப் பயன்படுத்தி, ஆவணத்தைப் பார்ப்பது, தேடுவது மற்றும் பகுப்பாய்வு செய்வது போன்ற செயல்பாடுகளைச் செய்ய வேண்டிய மார்க்அப் வகையை அடைகிறார்.

    XML இன் மற்றொரு வெளிப்படையான நன்மை, தகவல் களஞ்சியங்களுக்கான உலகளாவிய வினவல் மொழியாக அதைப் பயன்படுத்துவதற்கான திறன் ஆகும். இன்று, W3C இன் ஆழத்தில், XML-QL (அல்லது XQL) தரநிலையின் செயல்பாட்டு பதிப்பு பரிசீலிக்கப்படுகிறது, இது எதிர்காலத்தில் SQL க்கு தீவிர போட்டியாளராக மாறக்கூடும். கூடுதலாக, XML ஆவணங்கள் தரவைச் சேமிப்பதற்கான ஒரு தனித்துவமான வழியாகச் செயல்படலாம், இதில் தகவலைப் பாகுபடுத்துதல் மற்றும் கிளையன்ட் பக்கத்தில் வழங்குதல் ஆகிய இரண்டும் அடங்கும். இந்த பகுதியில், நம்பிக்கைக்குரிய பகுதிகளில் ஒன்று ஜாவா மற்றும் எக்ஸ்எம்எல் தொழில்நுட்பங்களின் ஒருங்கிணைப்பு ஆகும், இது தகவல் பரிமாற்றத்திற்கான உலகளாவிய தரவு வடிவமைப்பைப் பயன்படுத்தும் இயந்திர-சுயாதீனமான பயன்பாடுகளை உருவாக்கும்போது இரண்டு தொழில்நுட்பங்களின் சக்தியையும் பயன்படுத்துவதை சாத்தியமாக்குகிறது.

    ஆவணங்களில் சேமிக்கப்பட்ட தரவின் சரியான தன்மையைக் கட்டுப்படுத்தவும், ஆவணத்தில் உள்ள படிநிலை உறவுகளைச் சரிபார்க்கவும், ஆவணங்களின் கட்டமைப்பிற்கான ஒரு ஒருங்கிணைந்த தரநிலையை நிறுவவும் XML உங்களை அனுமதிக்கிறது, அதன் உள்ளடக்கம் பல்வேறு தரவுகளாக இருக்கலாம். சிக்கலான தகவல் அமைப்புகளை உருவாக்கும்போது இது பயன்படுத்தப்படலாம், இதில் ஒரே அமைப்பில் இயங்கும் வெவ்வேறு பயன்பாடுகளுக்கு இடையே தகவல் பரிமாற்றம் மிகவும் முக்கியமானது. ஒரு திட்டப்பணியின் ஆரம்பத்திலேயே தகவல் பரிமாற்ற பொறிமுறைக்கான கட்டமைப்பை உருவாக்குவதன் மூலம், ஒரு மேலாளர் எதிர்காலத்தில் கணினியின் பல்வேறு கூறுகளால் பயன்படுத்தப்படும் தரவு வடிவங்களின் பொருந்தாத தன்மையுடன் தொடர்புடைய பல சிக்கல்களிலிருந்து தன்னைக் காப்பாற்றிக் கொள்ள முடியும்.

    மேலும், XML இன் நன்மைகளில் ஒன்று XML ஆவண செயலாக்க திட்டங்கள் எளிமையானவை, மேலும் இன்று XML ஆவணங்களுடன் வேலை செய்ய வடிவமைக்கப்பட்ட அனைத்து வகையான மென்பொருள் தயாரிப்புகளும் இலவசமாக விநியோகிக்கப்படுகின்றன. பதிப்பு 4.0 இல் தொடங்கி மைக்ரோசாஃப்ட் இன்டர்நெட் எக்ஸ்ப்ளோரர் குடும்பத்தின் அனைத்து உலாவிகளிலும் எக்ஸ்எம்எல் இன்று ஆதரிக்கப்படுகிறது. Netscape Communicator, Oracle DBMS, DB-2 மற்றும் MS-Office பயன்பாடுகளின் அடுத்தடுத்த பதிப்புகளில் இது ஆதரிக்கப்படும் என்று அறிவிக்கப்பட்டது. இவை அனைத்தும், பெரும்பாலும், எதிர்காலத்தில், தகவல் அமைப்புகளுக்கான முக்கிய தகவல் பரிமாற்ற மொழியாக மாறும், இதன் மூலம் HTML ஐ மாற்றும் என்று கருதுவதற்கு இவை அனைத்தும் காரணமாகின்றன. SMIL, CDF, MathML, XSL போன்ற நன்கு அறியப்பட்ட சிறப்பு மார்க்அப் மொழிகள் ஏற்கனவே XML அடிப்படையில் உருவாக்கப்பட்டுள்ளன, மேலும் W3C ஆல் பரிசீலிக்கப்படும் புதிய மொழிகளின் வேலை வரைவுகளின் பட்டியல் தொடர்ந்து வளர்ந்து வருகிறது.

    எக்ஸ்எம்எல் ஆவணம் எப்படி இருக்கும்?

    நீங்கள் HTML உடன் தெரிந்திருந்தால், XML கற்றுக்கொள்வது உங்கள் பங்கில் அதிக முயற்சி எடுக்காது. ஹைப்பர்டெக்ஸ்ட் மார்க்அப் லாங்குவேஜில் இருந்து எக்ஸ்எம்எல் அதன் திறன்களிலும் நோக்கத்திலும் மிகவும் வித்தியாசமாக இருந்தாலும், இரண்டு மொழிகளும் எஸ்ஜிஎம்எல்லின் துணைக்குழுக்கள், எனவே அதன் அடிப்படைக் கொள்கைகளைப் பெறுகின்றன.

    ஆவண அமைப்பு

    ஒரு எளிய XML ஆவணம் உதாரணம் 1 போல் தோன்றலாம்

    முதலில்

    இரண்டாவது துணைப் பத்தி 1

    மூன்றாவது

    கடந்த

    இந்த ஆவணம் வழக்கமான HTML பக்கத்தைப் போலவே உள்ளது என்பதை நினைவில் கொள்ளவும். HTML இல் உள்ளதைப் போலவே, கோண அடைப்புக்குறிக்குள் இணைக்கப்பட்ட வழிமுறைகள் குறிச்சொற்கள் என்று அழைக்கப்படுகின்றன மற்றும் ஆவணத்தின் உடலைக் குறிக்க உதவும். XML இல், திறப்பு, மூடுதல் மற்றும் வெற்று குறிச்சொற்கள் உள்ளன (HTML இல், வெற்று குறிச்சொல்லின் கருத்தும் உள்ளது, ஆனால் சிறப்பு பதவி தேவையில்லை).

    எக்ஸ்எம்எல் ஆவணத்தின் உடல் மார்க்அப் கூறுகள் மற்றும் ஆவணத்தின் உண்மையான உள்ளடக்கம் - தரவு (உள்ளடக்கம்) ஆகியவற்றைக் கொண்டுள்ளது. XML குறிச்சொற்கள் ஆவண கூறுகள், அவற்றின் பண்புக்கூறுகள் மற்றும் பிற மொழி கட்டமைப்புகளை வரையறுக்க வடிவமைக்கப்பட்டுள்ளன. ஆவணங்களில் பயன்படுத்தப்படும் மார்க்அப் வகைகளைப் பற்றி சிறிது நேரம் கழித்து விரிவாகப் பேசுவோம்.

    எந்த எக்ஸ்எம்எல் ஆவணமும் எப்போதும் அறிவுறுத்தலுடன் தொடங்க வேண்டும், அதன் உள்ளே மொழி பதிப்பு எண், குறியீட்டு பக்க எண் மற்றும் ஆவணத்தை அலசுவதற்குத் தேவையான பிற அளவுருக்கள் ஆகியவற்றைக் குறிப்பிடலாம்.

    எக்ஸ்எம்எல் ஆவணத்தை உருவாக்குவதற்கான விதிகள்

    பொதுவாக, XML ஆவணங்கள் பின்வரும் தேவைகளைப் பூர்த்தி செய்ய வேண்டும்:

    ஆவணத்தின் தலைப்பில் XML அறிவிப்பு உள்ளது, இது ஆவணத்தின் மார்க்அப் மொழி, பதிப்பு எண் மற்றும் கூடுதல் தகவலைக் குறிப்பிடுகிறது.

    ஆவணத்தில் சில தரவுப் பகுதியை வரையறுக்கும் ஒவ்வொரு தொடக்கக் குறிச்சொல்லுக்கும் அதன் சொந்த மூடும் “பார்ட்னர்” இருக்க வேண்டும், அதாவது, HTML போலல்லாமல், மூடும் குறிச்சொற்களைத் தவிர்க்க முடியாது.

    எக்ஸ்எம்எல் கேஸ் சென்சிட்டிவ்.

    குறிச்சொல் வரையறைகளில் பயன்படுத்தப்படும் அனைத்து பண்புக்கூறு மதிப்புகளும் மேற்கோள் குறிகளில் இணைக்கப்பட வேண்டும்.

    XML இல் உள்ள குறிச்சொற்களின் கூடு கண்டிப்பாக கட்டுப்படுத்தப்படுகிறது, எனவே குறிச்சொற்களைத் திறக்கும் மற்றும் மூடும் வரிசையை கண்காணிக்க வேண்டியது அவசியம்.

    தொடக்க மற்றும் முடிவு குறிச்சொற்களுக்கு இடையே உள்ள அனைத்து தகவல்களும் XML இல் தரவுகளாகக் கருதப்படுகின்றன, எனவே அனைத்து வடிவமைப்பு எழுத்துகளும் கணக்கில் எடுத்துக்கொள்ளப்படுகின்றன (அதாவது இடைவெளிகள், வரி முறிவுகள், தாவல்கள் HTML இல் உள்ளதைப் போல புறக்கணிக்கப்படாது).

    ஒரு எக்ஸ்எம்எல் ஆவணம் மேலே உள்ள விதிகளை மீறவில்லை என்றால், அது முறையாக சரியானது என்று அழைக்கப்படுகிறது, மேலும் எக்ஸ்எம்எல் ஆவணங்களை அலசுவதற்கு வடிவமைக்கப்பட்ட அனைத்து பகுப்பாய்விகளும் அதனுடன் சரியாக வேலை செய்ய முடியும்.

    இருப்பினும், மொழியின் இலக்கணத்துடன் முறையான இணக்கத்தை சரிபார்ப்பதைத் தவிர, ஆவணத்தில் ஆவணத்தின் உள்ளடக்கத்தின் மீதான கட்டுப்பாட்டு வழிமுறைகள் இருக்கலாம், உறுப்புகளுக்கு இடையே தேவையான உறவுகளை நிர்ணயிக்கும் மற்றும் ஆவணத்தின் கட்டமைப்பை உருவாக்கும் விதிகளுக்கு இணங்கலாம். எடுத்துக்காட்டாக, பின்வரும் உரை, சரியான XML ஆவணமாக இருந்தாலும், முற்றிலும் அர்த்தமற்றதாக இருக்கும்:

    ரஷ்யா நோவோசிபிர்ஸ்க்

    XML ஆவணங்களின் சரியான தன்மை சரிபார்க்கப்படுவதை உறுதிசெய்ய, அத்தகைய சரிபார்ப்பைச் செய்யும் மற்றும் சரிபார்ப்பாளர்கள் என்று அழைக்கப்படும் பகுப்பாய்விகளைப் பயன்படுத்துவது அவசியம்.

    இன்று, எக்ஸ்எம்எல் ஆவணத்தின் சரியான தன்மையைக் கட்டுப்படுத்த இரண்டு முக்கிய வழிகள் உள்ளன: டிடிடி வரையறைகள் (ஆவண வகை வரையறை) மற்றும் தரவுத் திட்டங்கள் (செமான்டிக் ஸ்கீமா). அடுத்த முறை DTDகள் மற்றும் திட்டங்களைப் பயன்படுத்துவது பற்றி மேலும் பேசுவோம். எஸ்ஜிஎம்எல் போலல்லாமல், எக்ஸ்எம்எல்லில் டிடிடி விதிகளை வரையறுப்பது அவசியமில்லை, மேலும் சிக்கலான டிடிடி தொடரியல் மூலம் நம் மூளையை ரேக் செய்யாமல் எந்த எக்ஸ்எம்எல் ஆவணங்களையும் உருவாக்க இந்தச் சூழல் அனுமதிக்கிறது.

    அடிப்படைக் கொள்கை

    ஒரு உறுப்பு என்பது எக்ஸ்எம்எல் ஆவணத்தின் அடிப்படை கட்டமைப்பு அலகு ஆகும். குறிச்சொற்களில் ரோஸ் என்ற வார்த்தையை இணைப்பதன் மூலம், காலியாக இல்லாத உறுப்பை வரையறுக்கிறோம், அதன் உள்ளடக்கம் ரோஸ் ஆகும். பொது வழக்கில், உறுப்புகளின் உள்ளடக்கம் வெறுமனே சில உரை, அல்லது பிற உள்ளமை ஆவண கூறுகள், CDATA பிரிவுகள், செயலாக்க வழிமுறைகள், கருத்துகள், அதாவது. XML ஆவணத்தின் கிட்டத்தட்ட எந்தப் பகுதியும்.

    காலியாக இல்லாத எந்த உறுப்பும் தொடக்கக் குறிச்சொல், இறுதிக் குறிச்சொல் மற்றும் அவற்றுக்கிடையே இணைக்கப்பட்ட தரவு ஆகியவற்றைக் கொண்டிருக்க வேண்டும்.

    ஒரு ஆவணத்தில் உள்ள அனைத்து கூறுகளின் தொகுப்பு அதன் கட்டமைப்பை வரையறுக்கிறது மற்றும் அனைத்து படிநிலை உறவுகளையும் தீர்மானிக்கிறது. தனிமங்களைப் பயன்படுத்தி, ஒரு தட்டையான தரவு மாதிரியானது, தனிமங்களுக்கிடையில் பல சாத்தியமான உறவுகளுடன் சிக்கலான படிநிலை அமைப்பாக மாற்றப்படுகிறது.

    பின்னர் ஒரு ஆவணத்தைத் தேடும் போது, ​​கிளையன்ட் நிரல் அதன் கட்டமைப்பில் உட்பொதிக்கப்பட்ட தகவலை நம்பியிருக்கும் - ஆவணத்தின் கூறுகளைப் பயன்படுத்தி. அந்த. உதாரணமாக, நீங்கள் சரியான நகரத்தில் சரியான பல்கலைக்கழகத்தைக் கண்டுபிடிக்க விரும்பினால், ஒரு குறிப்பிட்ட உறுப்புக்குள் அமைந்துள்ள ஒரு குறிப்பிட்ட தனிமத்தின் உள்ளடக்கங்களை நீங்கள் பார்க்க வேண்டும். இந்த வழக்கில் தேடல், இயற்கையாகவே, முழு ஆவணத்திலும் விரும்பிய வரிசையைக் கண்டுபிடிப்பதை விட மிகவும் பயனுள்ளதாக இருக்கும்.

    ஒரு XML ஆவணத்தில், ஒரு விதியாக, குறைந்தபட்சம் ஒரு உறுப்பு வரையறுக்கப்படுகிறது, இது ரூட் என்று அழைக்கப்படுகிறது, மேலும் பாகுபடுத்திகள் இந்த உறுப்பிலிருந்து ஆவணத்தை ஸ்கேன் செய்யத் தொடங்குகின்றன. மேலே உள்ள எடுத்துக்காட்டில், இந்த உறுப்பு .

    சில சந்தர்ப்பங்களில், குறிச்சொற்கள் ஒரு ஆவணத்தின் சில துண்டுகளின் சொற்பொருளை மாற்றலாம் மற்றும் தெளிவுபடுத்தலாம், அதே தகவலை வெவ்வேறு வழிகளில் வரையறுத்து, அதன் மூலம் இந்த ஆவணத்தை பகுப்பாய்வு செய்யும் பயன்பாட்டை விவரிக்கப்பட்ட தரவைப் பயன்படுத்தும் சூழல் பற்றிய தகவலை வழங்குகிறது. எடுத்துக்காட்டாக, ஹாலிவுட் பகுதியைப் படித்த பிறகு, ஆவணத்தின் இந்த பகுதி ஒரு நகரத்தைப் பற்றியது என்று நாம் யூகிக்க முடியும், ஆனால் ஹாலிவுட் துண்டில் இது ஒரு உணவகத்தைப் பற்றியது.

    முடிவுரை

    வலைப்பக்க வடிவமைப்பு மொழி HTML முதலில் SGML இன் பயன்பாடாக அறிமுகப்படுத்தப்பட்டது. பின்னர், WWW இன் விரைவான வளர்ச்சியுடன், HTML ஆனது தகவல்களின் வெளிப்புற விளக்கக்காட்சியின் மீது ஆசிரியருக்கு கூடுதல் கட்டுப்பாட்டைக் கொடுப்பதற்காக சாத்தியமான எல்லா வழிகளிலும் விரிவாக்கத் தொடங்கியது. அல்லது போன்ற புதிய கூறுகள் மற்றும் பண்புக்கூறுகள் காட்சி வடிவமைப்பில் கவனம் செலுத்துகின்றன. மார்க்அப் மொழியின் ஒரு பகுதியாக இல்லாத கருவிகள் தோன்றி தீவிரமாகப் பயன்படுத்தத் தொடங்கின: பட வரைபடங்கள், ஜாவா மற்றும் ஜாவாஸ்கிரிப்ட், செருகுநிரல்கள் மற்றும் பல. சில உலாவிகளால் மட்டுமே ஆதரிக்கப்படும் அல்லது வெவ்வேறு உலாவிகளில் வித்தியாசமாக வேலை செய்யும் பல HTML கூறுகளும் உள்ளன. எனவே, HTML ஒரு SGML பயன்பாடா இல்லையா என்பதை இப்போது சொல்வது கடினம். HTML விவரக்குறிப்புகள் மற்றும் தொடர்புடைய DTDகளின் படி மிகக் குறைவான பக்கங்களே உருவாக்கப்படுகின்றன.

    இந்தப் பிரச்சனையானது கேஸ்கேடிங் ஸ்டைல்களால் ஓரளவுக்குத் தணிக்கப்பட வேண்டும் என்று நோக்கமாக உள்ளது, இதற்கான தரநிலை W3 கூட்டமைப்பால் ஏற்றுக்கொள்ளப்பட்டது. CSS1 உறுப்புகளின் மார்க்அப்பில் இருந்து உறுப்புகளின் காட்சி தோற்றத்தை வரையறுக்கும் பாணியை பிரிக்கிறது.

    இணையப் பக்கங்களுக்கான மார்க்அப் மொழியாக HTML ஐ மாற்றியமைக்க வேண்டிய XML மொழி மிகவும் ஆர்வமாக உள்ளது. இது SGML இன் மாறுபாடாகும், இது முதன்மையாக WWW இல் பயன்படுத்துவதை நோக்கமாகக் கொண்டது. இதற்கு டிடிடி தேவையில்லை, மேலும் அரிதாகப் பயன்படுத்தப்படும் சிக்கலான கட்டமைப்புகள் காரணமாக மொழியே எளிமைப்படுத்தப்படுகிறது. இது பாகுபடுத்திகளை எளிமையாக்கும், இது உலாவிகளில் எக்ஸ்எம்எல்லை செயலில் பயன்படுத்துவதை சாத்தியமாக்கும். (உலாவி துறையில் உள்ள இரு முக்கிய வீரர்களும் எக்ஸ்எம்எல்லை நோக்கிய ஆதரவைக் கருத்தில் கொண்டு, அதற்கான வாய்ப்பு மிக அதிகம்).


    அச்சிடக்கூடிய பதிப்பு>>
    கட்டுரை வாசிக்கப்பட்டது:ஒருமுறை.

    (தரநிலை பொதுமைப்படுத்தப்பட்ட மார்க்அப் மொழி), ISO 8879 தரநிலையில் வழங்கப்பட்டுள்ளது. இந்த மொழி, ஊடாடும் மின்னணு தொழில்நுட்ப கையேடுகள் உட்பட தொழில்நுட்ப ஆவணங்களை வடிவமைப்பதற்கான முக்கிய மொழியாக ஏற்றுக்கொள்ளப்படுகிறது. CALS தொழில்நுட்பங்களைப் பயன்படுத்தி உருவாக்கப்பட்ட தயாரிப்புகளுக்கு.

    SGML ஆவணங்களின் கட்டமைப்பை தரவு பொருள்களின் வரிசையாக வரையறுக்கிறது. ஒரு ஆவணத்தின் பகுதிகளைக் குறிக்கும் தரவுப் பொருள்கள் வெவ்வேறு கோப்புகளில் சேமிக்கப்படும். SGML தரநிலையானது தகவல்களைப் பிரதிநிதித்துவப்படுத்துவதற்கான குறியீடுகள் மற்றும் விதிகளின் தொகுப்பை நிறுவுகிறது, இது பல்வேறு அமைப்புகளை இந்த தகவலை சரியாக அடையாளம் கண்டு அடையாளம் காண அனுமதிக்கிறது. இந்த தொகுப்புகள் DTD அறிவிப்பு எனப்படும் ஆவணத்தின் தனிப் பகுதியில் விவரிக்கப்பட்டுள்ளன(ஆவண வகை வரையறை), இது முக்கிய SGML ஆவணத்துடன் அனுப்பப்படுகிறது. டிடிடி எழுத்துகள் மற்றும் அவற்றின் குறியீடுகள், பயன்படுத்தப்படும் அடையாளங்காட்டிகளின் அதிகபட்ச நீளம், குறிச்சொற்களுக்கான டிலிமிட்டர்கள் குறிப்பிடப்படும் விதம், பிற சாத்தியமான மரபுகள், டிடிடி தொடரியல் மற்றும் ஆவண வகை மற்றும் பதிப்பு ஆகியவற்றைக் குறிப்பிடுகிறது. எனவே, குறிப்பிட்ட மார்க்அப் மொழிகளின் குடும்பத்திற்கான மெட்டாலாங்குவேஜ் என SGML ஐ அழைக்கலாம். குறிப்பாக, எக்ஸ்எம்எல் மார்க்அப் மொழிகளை SGML இன் துணைக்குழுக்களாகக் கருதலாம்மற்றும் HTML.

    SGML ஆவணத்தின் வடிவில் உள்ள தொழில்நுட்ப விளக்கத்தில் பின்வருவன அடங்கும்:

    • SGML குறிச்சொற்களால் குறிக்கப்பட்ட தொழில்நுட்ப கையேடு கொண்ட முக்கிய கோப்பு;
    • நிறுவனங்களின் விளக்கம், ஆவணம் ஒரு குழுவிற்கு சொந்தமானது, அதில் அதே நிறுவனங்கள் பயன்படுத்தப்பட்டு அவற்றின் அறிவு மறைமுகமாக இருந்தால்;
    • SGML குறிச்சொற்களை விளக்க ஒரு அகராதி;

    இருப்பினும், SGML கற்றுக்கொள்வது மற்றும் பயன்படுத்துவது கடினம். எனவே, WWW க்கு சமர்ப்பிக்கப்பட்ட ஆவணங்களில் மார்க்அப் பரவலான பயன்பாட்டிற்காக-தொழில்நுட்பங்கள், 1991 இல், SGML அடிப்படையில் எளிமைப்படுத்தப்பட்ட HTML மொழி உருவாக்கப்பட்டது.(HyperText Markup Language), மற்றும் 1996 இல் XML மொழி(Extensible Markup Language), இது HTML உடன் இணைந்து, பல்வேறு பயன்பாடுகளில் ஆவணங்களை வழங்குவதற்கான முக்கிய மொழியாகிறது.

    WWW தொழில்நுட்பங்களில் வழங்கப்பட்ட ஆவணங்களில் மார்க்அப்பின் பரவலான பயன்பாட்டிற்காக HTML மொழி உருவாக்கப்பட்டது.

    ஒரு HTML விளக்கத்தில் ASCII உரை மற்றும் கட்டளைகளின் வரிசை (கட்டுப்பாட்டு குறியீடுகள்) அடங்கும், இது விளக்கங்கள் அல்லது குறிச்சொற்கள் என்றும் அழைக்கப்படுகிறது. இந்த உரை ஒரு HTML ஆவணம் அல்லது HTML பக்கம் அல்லது ஒரு வலை சேவையகத்தில் இடுகையிடப்படும் போது, ​​ஒரு வலைப்பக்கம் என அழைக்கப்படுகிறது.. குறிச்சொற்கள் மூல உரையில் சரியான இடங்களில் வைக்கப்பட்டுள்ளன; அவை எழுத்துருக்கள், ஹைபன்கள், கிராபிக்ஸ் தோற்றம், இணைப்புகள் போன்றவற்றை தீர்மானிக்கின்றன. WWW எடிட்டர்களைப் பயன்படுத்தும் போது, ​​பொருத்தமான விசைகளை அழுத்துவதன் மூலம் கட்டளைகள் செருகப்படுகின்றன.

    எக்ஸ்எம்எல், HTML போன்றது, SGML இன் துணைக்குழுவாகக் கருதப்படுகிறது. தற்போது, ​​XML மொழியானது, தகவல் தொழில்நுட்பத்தில் முக்கிய ஆவண விளக்க மொழியாக இருப்பதாகக் கூறுகிறது; இது பல்வேறு பயன்பாடுகளில் தனிப்பட்ட மார்க்அப் மொழிகளை உருவாக்குவதற்கான அடிப்படையாக செயல்படும் ஒரு உலோக மொழியாகக் கருதலாம். அதே நேரத்தில், எஸ்ஜிஎம்எல்லை விட எக்ஸ்எம்எல் மிகவும் வசதியானது, இது எக்ஸ்எம்எல்லில் எஸ்ஜிஎம்எல்லின் சில சிறிய அம்சங்களை நீக்குவதன் மூலம் உறுதி செய்யப்படுகிறது. XML இல் உள்ள விளக்கங்கள் புரிந்துகொள்ள எளிதானவை மற்றும் நவீன உலாவிகளில் பயன்படுத்துவதற்கு ஏற்றவை SGML இன் முக்கிய அம்சங்களை பராமரிக்கும் போது.

    குறிப்பிட்ட பயன்பாடுகளுக்கு, XML இன் சொந்த பதிப்புகள் உருவாக்கப்படுகின்றன, அவை XML அகராதிகள் அல்லது XML பயன்பாடுகள் என்று அழைக்கப்படுகின்றன. எனவே, குறிப்பிட்ட கணிதக் குறியீடுகளைக் கொண்ட உரைகளை விவரிக்க ஒரு XML பயன்பாட்டு OSD (திறந்த மென்பொருள் விளக்கம்) உருவாக்கப்பட்டுள்ளது. CALS க்கு ஆர்வமானது, தரவு பரிமாற்றத்திற்கு அர்ப்பணிக்கப்பட்ட தயாரிப்பு வரையறை eXchange (PDX) விருப்பமாகும். வேதியியல் (CML - Chemical Markup Language), உயிரியல் (BSML - Bioinformatic Sequence Markup Language) போன்றவற்றுக்கான அகராதிகள் உள்ளன.

    எந்த ஆவணமும் மூன்று கூறுகளைக் கொண்டுள்ளது:

    · கட்டமைப்பு;

    உள்ளடக்கம் என்பது ஆவணத்தில் காட்டப்படும் தகவல். காகிதத்தில் உள்ள ஆவணத்தின் உள்ளடக்கம் முற்றிலும் உரை மற்றும் படங்களைக் கொண்டிருக்கும். ஒரு ஆவணம் மின்னணு வடிவத்தில் வழங்கப்பட்டால், அதில் மல்டிமீடியா தரவு மற்றும் பிற ஆவணங்களுக்கான இணைப்புகள் இருக்கலாம். வெவ்வேறு ஆவணங்களின் உள்ளடக்கங்கள் வேறுபட்டாலும், அவற்றை புத்தகம் அல்லது ரயில் டிக்கெட் போன்ற வகைகளாக வகைப்படுத்தலாம்.

    ஒரு குறிப்பிட்ட சாதனத்தில் (உதாரணமாக, அச்சுப்பொறி அல்லது காட்சி) அதன் உள்ளடக்கங்கள் காண்பிக்கப்படும் படிவத்தை ஒரு ஆவணத்தின் பாணி தீர்மானிக்கிறது. பாணியின் கருத்து முழு வெளியீட்டு ஆவணத்தின் எழுத்துருவின் (பெயர், அளவு, நிறம்) பண்புகள் அல்லது அதன் தனிப்பட்ட தொகுதிகள், பக்கத்தின் வரிசை, பக்கங்களில் உள்ள தொகுதிகள் மற்றும் பிற அளவுருக்கள் ஆகியவற்றை உள்ளடக்கியது. ஒரே ஆவணம் வெவ்வேறு ஊடகங்களிலும், அதே ஊடகத்திலும் வெவ்வேறு வடிவங்களில் வெளியீடாக இருக்கலாம்.

    ஆவண மார்க்அப் மொழிகள் ஒரு ஆவணத்தின் கட்டமைப்பு மற்றும் கட்டமைப்பின் பல்வேறு பொருள்களுக்கு இடையிலான உறவுகளை விவரிக்க வடிவமைக்கப்பட்ட செயற்கை மொழிகள். மார்க்அப் தரவு மெட்டாடேட்டா என்றும் அழைக்கப்படுகிறது.

    முதல் மார்க்அப் மொழி GML (பொதுவாக்கப்பட்ட மார்க்அப் மொழி), கடந்த நூற்றாண்டின் 60 களில் ஐபிஎம் ஊழியர்களால் உருவாக்கப்பட்டது. அதன் உடனடி வாரிசு SGML மொழி (தரநிலை பொதுமைப்படுத்தப்பட்ட மார்க்அப் மொழி), இது ஆவண மார்க்அப் கூறுகளை எழுதுவதற்கான விதிகளை வரையறுக்கிறது. ஒரு மொழியின் விதிகளைப் பின்பற்றும் ஆவணம் SGML ஆவணம் எனப்படும்.

    SGML மொழி ISO 8879 தரநிலையில் வரையறுக்கப்பட்டுள்ளது, இது ஆவண மார்க்அப் மொழிக்கான பின்வரும் அடிப்படைத் தேவைகளைக் குறிப்பிடுகிறது:

    · மொழி மனிதர்கள் படிக்கக்கூடியதாக இருக்க வேண்டும்.

    · குறிக்கப்பட்ட ஆவணக் கோப்புகள் ASCII குறியீடு எழுத்துக்களைப் பயன்படுத்தி உரையாகவும் குறியாக்கம் செய்யப்பட்டதாகவும் இருக்க வேண்டும் (தகவல் பரிமாற்றத்திற்கான அமெரிக்க தரநிலை குறியீடு). இருப்பினும், ஆவணத்தின் உள்ளடக்கம் ASCII குறியாக்கம் அல்லது உரையாக இருக்க வேண்டியதில்லை.

    SGML மற்றும் ஒத்த மொழிகள் சிறப்பு ஆவண மார்க்அப் கருவிகளைப் பயன்படுத்துகின்றன:

    · கூறுகள் மற்றும் அதனுடன் கூடிய பண்புக்கூறுகள்;

    · நிறுவனங்கள்;

    · கருத்துகள்.

    SGML ஆவணத்தின் கட்டமைப்பு அலகு உறுப்பு ஆகும். குறிக்கப்பட்ட உரையில், ஒவ்வொரு உறுப்பும் ஒரு குறிப்பிட்ட வழியில் முன்னிலைப்படுத்தப்பட வேண்டும். உறுப்பின் தொடக்கத்தில் (தொடக்க குறிச்சொல்) தொடக்க குறிச்சொல்லை (ஆங்கில வார்த்தை டேக் - லேபிளில் இருந்து) மற்றும் உறுப்பு முடிவில் ஒரு முடிவு குறிச்சொல்லை (எண்ட் டேக்) செருகுவதன் மூலம் தேர்வு செய்யப்படுகிறது. தொடக்க மற்றும் முடிவு குறிச்சொற்கள் ஒரே பெயரைக் கொண்டுள்ளன. குறிச்சொற்களை எளிய உரையிலிருந்து வேறுபடுத்த, அவை குறிச்சொல்லின் தொடக்கத்தைக் குறிக்க ஒரு எழுத்தில் தொடங்கி குறிச்சொல்லின் முடிவைக் குறிக்க ஒரு எழுத்துடன் முடிக்க வேண்டும். கூடுதலாக, இறுதிக் குறிச்சொல்லில் ஒரு சின்னம் குறிப்பிடப்பட்டுள்ளது - இறுதிக் குறிச்சொல்லின் அடையாளம். SGML இல், எந்த எழுத்துகளையும் அத்தகைய அம்சங்களாகக் குறிப்பிடலாம், ஆனால் பொதுவாகப் பயன்படுத்தப்படும் எழுத்து "" (இடது கோண அடைப்புக்குறி) குறிச்சொல்லின் தொடக்கமாகவும், "/" (ஸ்லாஷ்) எழுத்து இறுதி குறிச்சொல் எழுத்தாகவும் இருக்கும். ஒரு SGML ஆவணத்தில் உள்ள கூறுகள் மற்ற உறுப்புகளை இணைக்கலாம், இதன் விளைவாக SGML ஆவணம் ஒரு படிநிலை (மரம்) அமைப்பாக வரைகலை பிரதிநிதித்துவம் செய்யப்படுகிறது.


    எடுத்துக்காட்டு 4.3.1.மாணவர்களின் பரீட்சை அமர்வின் முடிவுகளுடன் பட்டியலைக் குறிப்பிடும் ஒரு SGML ஆவணம் பின்வருமாறு குறிப்பிடப்படலாம்:

    அமர்வில் மாணவர் மதிப்பீடுகளின் பட்டியல்

    இவனோவ் இவான் இவனோவிச்

    TS-61

    பி

    பி

    பி

    பெட்ரோவ் பெட்ர் பெட்ரோவிச்

    TS-62

    சி

    சி

    டி

    சி

    இந்த ஆவணத்தில், முதல் உறுப்பு மாணவர் பட்டியல் உறுப்பு ஆகும். இந்த உறுப்பு ஒரு தலைப்பு உறுப்பு (தலைப்பு) மற்றும் பல மாணவர் கூறுகள் (மாணவர் தரவு) ஆகியவற்றைக் கொண்டுள்ளது. இதையொட்டி, ஒவ்வொரு மாணவர் உறுப்பும் ஒரு முழு-பெயர் உறுப்பு (மாணவரின் கடைசி பெயர், முதல் பெயர் மற்றும் புரவலன்), ஒரு குழு-எண் உறுப்பு (குழு எண்) மற்றும் ஒரு மதிப்பெண் பட்டியல் உறுப்பு (அமர்வில் மாணவர் தரங்களின் பட்டியல்) ஆகியவற்றைக் கொண்டுள்ளது. இறுதியாக, மார்க்-லிஸ்ட் உறுப்பு பல குறி கூறுகளைக் கொண்டுள்ளது (மதிப்பெண்).

    படத்தில் இந்த பட்டியலின் வரைகலை பிரதிநிதித்துவம். 4.3.1 ஒரு மர அமைப்பைக் கொண்டுள்ளது:

    அரிசி. 4.3.1. வரைகலை பிரதிநிதித்துவத்தில் SGML ஆவண அமைப்பு

    SGML கூறுகளை செம்மைப்படுத்த பண்புக்கூறுகள் பயன்படுத்தப்படலாம். தனிமத்தின் தொடக்கக் குறிச்சொல்லில் பண்புக்கூறுகள் பின்வருமாறு எழுதப்பட்டுள்ளன:

    பண்பு-பெயர் = "பண்பு-மதிப்பு".

    ஒரு உறுப்பு பல பண்புக்கூறுகளைக் குறிப்பிடலாம். பண்புக்கூறுகள் ஒன்றுக்கொன்று மற்றும் உறுப்பு பெயர் குறைந்தபட்சம் ஒரு இடைவெளியால் பிரிக்கப்படுகின்றன.

    எடுத்துக்காட்டு 4.3.2.உதாரணம் 4.3.1 இல் உள்ள குறி கூறுகளுக்கு, நீங்கள் பொருள் பண்புக்கூறை அமைக்கலாம், அதன் மதிப்பு தேர்வு எடுக்கப்பட்ட ஒழுக்கத்தின் பெயராகும். பின்னர் முதல் மாணவருக்கு கூறுகள் பின்வரும் படிவத்தை எடுக்கும்:

    பி

    பி

    பி

    SGML போன்ற மொழிகள் தரவுக் குழுக்களுடன் பணிபுரிய நிறுவனங்களைப் பயன்படுத்துகின்றன. ஒரு நிறுவனம் என்பது உரை மற்றும் உரை அல்லாத பெயரிடப்பட்ட தரவு. ஒரு ஆவணத்தைப் பார்க்கும்போது, ​​நிறுவனத்தின் பெயர் அதன் மதிப்புடன் மாற்றப்படும். எனவே, எடுத்துக்காட்டாக, kpi என்ற உரை பொருளின் பெயர் அதன் மதிப்பால் மாற்றப்படும்: கீவ் பாலிடெக்னிக் நிறுவனம், மற்றும் உரை அல்லாத பொருள் image1 ஆனது image1 என்ற பெயரால் மாற்றப்படும்.

    மார்க்அப் மொழிகள்) என்பது குறிச்சொற்கள் எனப்படும் சிறப்பு வழிமுறைகளின் தொகுப்பாகும், இது ஆவணங்களில் ஒரு கட்டமைப்பை உருவாக்க மற்றும் இந்த கட்டமைப்பின் பல்வேறு கூறுகளுக்கு இடையிலான உறவுகளை வரையறுக்க வடிவமைக்கப்பட்டுள்ளது. வேறு வார்த்தைகளில் கூறுவதானால், மார்க்அப் ஆவணத்தின் எந்தப் பகுதி தலைப்பு, இது ஒரு வசனம், ஆசிரியரின் பெயரைக் கருதுவது போன்றவற்றைக் காட்டுகிறது. மார்க்அப் ஸ்டைலிஸ்டிக் மார்க்அப், கட்டமைப்பு மற்றும் சொற்பொருள் என பிரிக்கப்பட்டுள்ளது. ஸ்டைலிஸ்டிக் மார்க்அப்

    ஆவணத்தின் தோற்றத்திற்கு ஸ்டைலிஸ்டிக் மார்க்அப் பொறுப்பு. எடுத்துக்காட்டாக, HTML இல் இந்த வகை மார்க்அப் போன்ற குறிச்சொற்கள் அடங்கும் (சாய்வு), (தடித்தது), (அடிக்கோடு), (உரையின் மூலம் அடிக்கோடு) போன்றவை.

    கட்டமைப்பு குறித்தல்

    கட்டமைப்பு மார்க்அப் ஆவணத்தின் கட்டமைப்பை வரையறுக்கிறது. HTML இல், எடுத்துக்காட்டாக, குறிச்சொற்கள் (பத்தி), (தலைப்பு), (பிரிவு) போன்றவை இந்த வகை மார்க்அப்களுக்கு பொறுப்பாகும்.

    சொற்பொருள் மார்க்அப்

    சொற்பொருள் மார்க்அப் தரவின் உள்ளடக்கத்தை தெரிவிக்கிறது. குறிச்சொற்கள் (ஆவணத்தின் பெயர்), (குறியீடு, குறியீடு பட்டியல்களுக்குப் பயன்படுத்தப்படுகிறது), (மாறி), (ஆசிரியரின் முகவரி) ஆகியவை இந்த வகை மார்க்அப்பின் எடுத்துக்காட்டுகள்.

    எந்த மார்க்அப் மொழியின் அடிப்படைக் கருத்துக்களும் குறிச்சொற்கள், கூறுகள் மற்றும் பண்புக்கூறுகள் ஆகும்.

    குறிச்சொற்கள் மற்றும் கூறுகள்.

    குறிச்சொற்கள் மற்றும் கூறுகளின் அர்த்தங்கள் பெரும்பாலும் குழப்பமடைகின்றன.

    குறிச்சொற்கள் அல்லது கட்டுப்பாட்டு விளக்கங்கள் என்றும் அழைக்கப்படும், குறிச்சொல்லின் உள்ளடக்கங்களை என்ன செய்வது என்பது குறித்த ஆவணத்தின் உள்ளடக்கங்களை கிளையன்ட் பக்கத்தில் காண்பிக்கும் நிரலுக்கான வழிமுறைகளாகச் செயல்படுகின்றன. ஆவணத்தின் முக்கிய உள்ளடக்கத்துடன் தொடர்புடைய குறிச்சொல்லை முன்னிலைப்படுத்த, கோண அடைப்புக்குறிகள் பயன்படுத்தப்படுகின்றன: குறிச்சொல் () குறியீட்டைக் காட்டிலும் குறைவாகத் தொடங்குகிறது, அதன் உள்ளே அறிவுறுத்தல்களின் பெயர் மற்றும் அவற்றின் அளவுருக்கள் வைக்கப்படுகின்றன. எடுத்துக்காட்டாக, HTML இல் குறிச்சொல் பின்வரும் உரை சாய்வாக இருக்க வேண்டும் என்பதைக் குறிக்கிறது.

    ஒரு உறுப்பு என்பது அவற்றின் உள்ளடக்கத்துடன் குறிச்சொற்கள் ஆகும். பின்வரும் கட்டுமானம் ஒரு உறுப்புக்கு ஒரு எடுத்துக்காட்டு:

    இந்த உரை சாய்வு எழுத்துக்களில் உள்ளது .

    உறுப்பு ஒரு தொடக்க குறிச்சொல்லைக் கொண்டுள்ளது (எங்கள் எடுத்துக்காட்டில் இது குறிச்சொல் ), டேக் உள்ளடக்கம் (உதாரணத்தில் இது "இது சாய்வு எழுத்துக்களில் உள்ள உரை") மற்றும் மூடும் குறிச்சொல்(), சில நேரங்களில் HTML இல் இருந்தாலும், மூடும் குறிச்சொல் தவிர்க்கப்படலாம்.

    பண்புக்கூறுகள்

    ஒரு உறுப்பை வரையறுக்கும்போது இந்த உறுப்பின் பண்புகளை தெளிவுபடுத்தும் எந்த அளவுருக்களையும் அமைக்க, பண்புக்கூறுகள் பயன்படுத்தப்படுகின்றன.

    பண்புக்கூறுகள் ஒரு பெயர் = மதிப்பு ஜோடியைக் கொண்டிருக்கும், அவை தொடக்கக் குறிச்சொல்லில் ஒரு உறுப்பை வரையறுக்கும்போது குறிப்பிடலாம். சம சின்னத்தின் இடது மற்றும் வலதுபுறத்தில் இடைவெளிகளை நீங்கள் விடலாம். பண்புக்கூறு மதிப்பு ஒற்றை அல்லது இரட்டை மேற்கோள்களில் இணைக்கப்பட்ட சரமாக குறிப்பிடப்படுகிறது.

    அந்த பண்பு வரையறுக்கப்பட்டால் எந்த குறிச்சொல்லும் ஒரு பண்புக்கூறைக் கொண்டிருக்கலாம்.

    பண்புக்கூறு பயன்படுத்தப்படும்போது, ​​உறுப்பு பின்வரும் வடிவத்தை எடுக்கும்:

    குறிச்சொல் உள்ளடக்கம்

    உரை மையத்தில் சீரமைக்கப்பட்டுள்ளது

    ஒரு தொடக்கக் குறிச்சொல் பல பண்புக்கூறுகளைக் கொண்டிருக்கலாம், எடுத்துக்காட்டாக:

    குறிப்பிட்ட உரை அளவு மற்றும் வண்ணம்

    மார்க்அப் மொழிகளின் வளர்ச்சியின் வரலாறு.

    ஹைபர்டெக்ஸ்ட் என்ற கருத்து 1945 இல் டபிள்யூ. புஷ்ஷால் அறிமுகப்படுத்தப்பட்டது, மேலும் 60 களில் தொடங்கி, ஹைபர்டெக்ஸ்ட் தரவைப் பயன்படுத்தும் முதல் பயன்பாடுகள் தோன்றத் தொடங்கின. இருப்பினும், பல தகவல் வளங்களை இணைப்பதற்கான ஒரு பொறிமுறையின் உண்மையான தேவை எழுந்தபோது, ​​இந்த தொழில்நுட்பம் அதன் முக்கிய வளர்ச்சியைப் பெற்றது, இது நேரியல் அல்லாத உரையை உருவாக்கும் மற்றும் பார்க்கும் திறனை வழங்குகிறது.

    1986 இல், ஐஎஸ்ஓ தரநிலைப்படுத்தப்பட்ட பொதுவான மார்க்அப் மொழிக்கு ஒப்புதல் அளித்தது. இந்த மொழி பிற மார்க்அப் மொழிகளை உருவாக்குவதற்காக வடிவமைக்கப்பட்டுள்ளது; இது செல்லுபடியாகும் குறிச்சொற்கள், அவற்றின் பண்புக்கூறுகள் மற்றும் ஆவணத்தின் உள் அமைப்பு ஆகியவற்றை வரையறுக்கிறது. எனவே, ஆவணத்தின் உள்ளடக்கம் தொடர்பான உங்கள் சொந்த குறிச்சொற்களை உருவாக்க முடியும். ஆவண வகை வரையறையில் (DTD) சேமிக்கப்பட்டுள்ள மார்க்அப் மொழி வரையறை இல்லாமல் அத்தகைய ஆவணங்களை விளக்குவது கடினம் என்பது இப்போது தெளிவாகிறது. SGML தரநிலையில் மொழியின் அனைத்து விதிகளையும் DTD குழுவாக்குகிறது. வேறு வார்த்தைகளில் கூறுவதானால், DTD குறிச்சொற்களின் உறவையும் அவற்றின் பயன்பாட்டிற்கான விதிகளையும் விவரிக்கிறது. மேலும், ஒவ்வொரு வகை ஆவணங்களுக்கும், தொடர்புடைய மார்க்அப் மொழியின் இலக்கணத்தை விவரிக்கும் அதன் சொந்த விதிகள் வரையறுக்கப்பட்டுள்ளன. எனவே, டிடிடியின் உதவியுடன் மட்டுமே குறிச்சொற்களின் சரியான பயன்பாட்டை ஒருவர் சரிபார்க்க முடியும், எனவே, அது SGML ஆவணத்துடன் அனுப்பப்பட வேண்டும் அல்லது ஆவணத்தில் சேர்க்கப்பட வேண்டும்.

    அந்த நேரத்தில், SGML ஐத் தவிர, பல ஒத்த மொழிகள் ஒருவருக்கொருவர் போட்டியிடுகின்றன, ஆனால் புகழ் (HTML, அதன் சந்ததியினரில் ஒன்றாகும்) SGML ஐ அதன் சகாக்களை விட மறுக்க முடியாத நன்மையைக் கொடுத்தது.

    SGML ஐப் பயன்படுத்தி, நீங்கள் கட்டமைக்கப்பட்ட தரவை விவரிக்கலாம், ஆவணங்களில் உள்ள தகவலை ஒழுங்கமைக்கலாம் மற்றும் சில தரப்படுத்தப்பட்ட வடிவத்தில் இந்தத் தகவலை வழங்கலாம். ஆனால் அதன் சிக்கலான தன்மை காரணமாக, மற்ற மொழிகளின் தொடரியல் விவரிக்க SGML பயன்படுத்தப்பட்டது, மேலும் சில பயன்பாடுகள் SGML ஆவணங்களுடன் நேரடியாக வேலை செய்தன. SGML பொதுவாக பெரிய திட்டங்களில் மட்டுமே பயன்படுத்தப்படுகிறது, எடுத்துக்காட்டாக, ஒரு பெரிய நிறுவனத்திற்கான ஒருங்கிணைந்த ஆவண மேலாண்மை அமைப்பை உருவாக்க.

    HTML மார்க்அப் மொழி SGML ஐ விட மிகவும் எளிமையானது மற்றும் மிகவும் வசதியானது, அதன் வழிமுறைகள் முதன்மையாக திரையில் ஆவண உள்ளடக்கத்தைக் காண்பிக்கும் செயல்முறையைக் கட்டுப்படுத்தும் நோக்கம் கொண்டது. HTML தொழில்நுட்ப ஆவணங்களைக் குறிக்கும் ஒரு வழியாக 1991 இல் டிம் பெர்னர்ஸ்-லீ அவர்களால் விஞ்ஞான சமூகத்திற்காக உருவாக்கப்பட்டது. இது முதலில் SGML பயன்பாடுகளில் ஒன்றாகும்.

    ஒரு ஆவணத்தின் பகுதிகளை வகைப்படுத்தி, உலாவியில் அதன் சரியான காட்சியை உறுதி செய்வதே HTML ஆல் செய்யக்கூடிய ஒரே விஷயம் என்றாலும், இது மிகவும் பிரபலமான மார்க்அப் மொழியாகும். ஏனென்றால் HTML கற்றுக்கொள்வது மிகவும் எளிதானது. நீங்கள் செய்ய வேண்டியது HTML கட்டளைகளைக் கற்றுக்கொள்வது மட்டுமே. HTML க்கான DTD உலாவியில் சேமிக்கப்படுகிறது. கூடுதலாக, HTML பல்வேறு தளங்களில் வேலை செய்ய வடிவமைக்கப்பட்டுள்ளது என்பதை கவனத்தில் கொள்ள வேண்டும். ஆனால் இது பல குறிப்பிடத்தக்க வரம்புகளைக் கொண்டுள்ளது:

  • HTML ஆனது நிலையான குறிச்சொற்களை கொண்டுள்ளது, மேலும் இந்த தொகுப்பை விரிவாக்கவோ மாற்றவோ முடியாது;
  • HTML மொழி குறிச்சொற்கள் தரவு எவ்வாறு வழங்கப்பட வேண்டும் என்பதை மட்டுமே காட்டுகின்றன, அதாவது ஆவணத்தின் தோற்றம். குறிச்சொற்களில் உள்ள உள்ளடக்கத்தின் பொருள் அல்லது ஆவணத்தின் அமைப்பு பற்றிய தகவலை HTML கொண்டு செல்லாது.