Matnli hujjatlar uchun maxsus belgilash tili deyiladi. HTML hujjatni belgilash tili. Mantiqiy va vizual belgilash

belgilash tillari) - bu hujjatlarda strukturani shakllantirish va ushbu tuzilmaning turli elementlari o'rtasidagi munosabatlarni aniqlash uchun mo'ljallangan teglar deb ataladigan maxsus ko'rsatmalar to'plami. Boshqacha qilib aytganda, belgilash hujjatning qaysi qismi sarlavha ekanligini, qaysi subtitr ekanligini, muallifning nomini nima deb hisoblash kerakligini va hokazolarni ko'rsatadi. Belgilash uslubiy belgilash, strukturaviy va semantik belgilarga bo'linadi. Stilistik belgilash

Stilistik belgilar hujjatning ko'rinishi uchun javobgardir. Misol uchun, HTMLda bu turdagi belgilash teglarni o'z ichiga oladi, masalan (kursiv), (qalin), (pastga chizilgan), (chizilgan matn) va boshqalar.

Strukturaviy markalash

Strukturaviy belgi hujjatning tuzilishini belgilaydi. Masalan, HTMLda teglar (paragraf), (sarlavha), (bo'lim) va hokazolar ushbu turdagi belgilash uchun javobgardir.

Semantik belgilash

Semantik belgilash ma'lumotlarning mazmuni haqida ma'lumot beradi. Ushbu turdagi belgilarga misollar teglar (hujjat nomi), (kod, kodlar ro'yxati uchun ishlatiladi), (o'zgaruvchi), (muallifning manzili).

Har qanday belgilash tilining asosiy tushunchalari teglar, elementlar va atributlardir.

Teglar va elementlar.

Teglar va elementlarning ma'nolari ko'pincha chalkashib ketadi.

Teglar yoki boshqaruv identifikatorlari ham deyiladi, teg mazmuni bilan nima qilish kerakligi haqida mijoz tomonida hujjat mazmunini ko'rsatadigan dastur uchun ko'rsatmalar bo'lib xizmat qiladi. Hujjatning asosiy mazmuniga nisbatan tegni ajratib ko'rsatish uchun burchakli qavslar qo'llaniladi: teg kichikroq () belgisi bilan boshlanadi, uning ichida ko'rsatmalar nomi va ularning parametrlari joylashtirilgan. Masalan, HTMLda teg keyingi matn kursiv bilan yozilishi kerakligini bildiradi.

Element - bu ularning mazmuni bilan birga teglar. Quyidagi konstruktsiya elementga misoldir:

Ushbu matn kursiv bilan yozilgan .

Element ochilish tegidan iborat (bizning misolimizda bu teg ), teg mazmuni (misolda bu "Bu kursivdagi matn" matni) va yopish tegi(), ba'zan HTML-da, yopilish tegini o'tkazib yuborish mumkin.

Atributlar

Elementni belgilashda ushbu elementning xususiyatlarini aniqlaydigan har qanday parametrlarni o'rnatish uchun atributlar qo'llaniladi.

Atributlar boshlang'ich tegdagi elementni belgilashda ko'rsatilishi mumkin bo'lgan nom = qiymat juftligidan iborat. Tenglik belgisining chap va o'ng tomonida bo'sh joy qoldirishingiz mumkin. Atribut qiymati bitta yoki ikkita tirnoq ichiga olingan qator sifatida ko'rsatilgan.

Har qanday teg, agar bu atribut aniqlangan bo'lsa, atributga ega bo'lishi mumkin.

Atribut ishlatilganda element quyidagi shaklni oladi:

kontentni belgilang

Matn markazga tekislangan

Bitta ochilish tegi bir nechta atributlarni o'z ichiga olishi mumkin, masalan:

Belgilangan matn hajmi va rangi

Belgilash tillarining rivojlanish tarixi.

Gipermatn tushunchasi 1945-yilda V.Bush tomonidan kiritilgan boʻlib, 60-yillardan boshlab gipermatnli maʼlumotlardan foydalanadigan birinchi ilovalar paydo boʻla boshladi. Biroq, bu texnologiya o'zining asosiy rivojlanishini chiziqli bo'lmagan matnni yaratish va ko'rish qobiliyatini ta'minlaydigan bir nechta axborot resurslarini birlashtirish mexanizmiga haqiqiy ehtiyoj paydo bo'lganda oldi.

1986 yilda ISO standartlashtirilgan umumlashtirilgan belgilash tilini tasdiqladi. Ushbu til boshqa belgilash tillarini yaratish uchun mo'ljallangan; u tegishli teglar to'plamini, ularning atributlarini va hujjatning ichki tuzilishini belgilaydi. Shunday qilib, hujjat mazmuni bilan bog'liq o'zingizning teglaringizni yaratishingiz mumkin. Endi bunday hujjatlarni Document Type Definition (DTD) da saqlanadigan belgilash tili ta'rifisiz talqin qilish qiyinligi ayon bo'ldi. DTD SGML standartida tilning barcha qoidalarini guruhlaydi. Boshqacha qilib aytganda, DTD teglarning bir-biri bilan aloqasini va ulardan foydalanish qoidalarini tavsiflaydi. Bundan tashqari, hujjatlarning har bir sinfi uchun tegishli belgilash tilining grammatikasini tavsiflovchi o'ziga xos qoidalar to'plami aniqlanadi. Shunday qilib, faqat DTD yordamida teglardan to'g'ri foydalanishni tekshirish mumkin va shuning uchun uni SGML hujjati bilan birga yuborish yoki hujjatga kiritish kerak.

O'sha paytda, SGML-dan tashqari, bir-biri bilan raqobatlashadigan boshqa shunga o'xshash tillar ham bor edi, ammo mashhurlik (HTML, uning avlodlaridan biri) SGML-ga o'z hamkasblariga nisbatan shubhasiz ustunlik berdi.

SGML-dan foydalanib, siz tuzilgan ma'lumotlarni tavsiflashingiz, hujjatlardagi ma'lumotlarni tartibga solishingiz va ushbu ma'lumotlarni qandaydir standartlashtirilgan formatda taqdim etishingiz mumkin. Ammo uning murakkabligi tufayli SGML asosan boshqa tillarning sintaksisini tavsiflash uchun ishlatilgan va bir nechta ilovalar bevosita SGML hujjatlari bilan ishlagan. SGML odatda faqat yirik loyihalarda, masalan, yirik kompaniya uchun yagona hujjat boshqaruv tizimini yaratishda qo'llaniladi.

HTML belgilash tili SGML ga qaraganda ancha sodda va qulayroq, uning ko'rsatmalari birinchi navbatda hujjat mazmunini ekranda ko'rsatish jarayonini boshqarish uchun mo'ljallangan. HTML texnik hujjatlarni belgilash usuli sifatida 1991 yilda Tim Berners-Li tomonidan ilmiy hamjamiyat uchun maxsus yaratilgan. Bu dastlab SGML ilovalaridan biri edi.

HTML qila oladigan yagona narsa hujjat qismlarini tasniflash va uning brauzerda to'g'ri ko'rsatilishini ta'minlash bo'lishiga qaramay, bu eng mashhur belgilash tilidir. Buning sababi, HTMLni o'rganish juda oson. Buning uchun HTML buyruqlarini o‘rganish kifoya. HTML uchun DTD brauzerda saqlanadi. Bundan tashqari, shuni ta'kidlash kerakki, HTML turli xil platformalarda ishlash uchun mo'ljallangan. Ammo u bir qator muhim cheklovlarga ega:

  • HTMLda belgilangan teglar to'plami mavjud va bu to'plamni kengaytirish yoki o'zgartirish mumkin emas;
  • HTML tili teglari faqat ma'lumotlar qanday taqdim etilishi kerakligini, ya'ni hujjatning ko'rinishini ko'rsatadi. HTML teglardagi tarkibning ma'nosi yoki hujjat tuzilishi haqida ma'lumot bermaydi.
  • 1998 yil fevral oyi boshida W3C xalqaro tashkiloti XML standarti asosida Internet orqali ma'lumot uzatish uchun ko'plab yangi belgilash tillarini ishlab chiqishning boshlanishini belgilovchi Kengaytiriladigan Markup Language (XML) 1.0 spetsifikatsiyasini tasdiqladi. Mohiyatan, bu gipermatnni belgilash tillarini rivojlantirishda yangi qadam degani edi. XML o'zining to'rt yillik faoliyati davomida nafaqat oddiy foydalanuvchilarning, ham ko'plab veb-dizaynerlarning katta e'tiborini tortdi, balki Internetning ajralmas qismiga aylandi. Bugungi kunda u yoki bu darajada HTML analogi sifatida ushbu texnologiyadan foydalanmaydigan serverlar deyarli yo'q. Biroq, XML endi global tarmoq orqali gipermatnni uzatishning asosiy usuliga aylanib borayotganini aytishga hali erta. Tilning o'zi hali juda yosh va uning ba'zi elementlari hali ham ishlab chiqilmoqda. Hozircha, kelajakda HTML o'rnini bosadigan narsa uchun umumiy asos yaratilgan, ammo u qanday aniq shaklda bo'lishini hozircha aytish mumkin emas.

    Boshidan

    1990-yil noyabr oyida Internet foydalanuvchilari yangi texnologiya haqida birinchi marta eshitganlarida, uning nomi atigi uchta harfdan iborat bo'lishi mumkin edi, deyarli hech kim juda oz vaqt o'tishini va bu texnologiya ma'lumotlarni uzatishning yagona usuliga aylanishini deyarli hech kim tasavvur qila olmadi. global tarmoq. Bugungi kunda ko'plab tajribasiz foydalanuvchilar uchun Internet so'zi WWW bilan qattiq bog'langan, garchi aslida bu narsalar, albatta, bir-biri bilan bog'liq bo'lsa-da, lekin baribir biroz farq qiladi.

    Umuman olganda, bu World Wide Web va uning ajralmas qismi HTMLning ajoyib mashhurligi, shubhasiz, hujjatlarning gipermatnli belgilari tuzilmalariga juda ko'p e'tibor berilishiga sabab bo'ldi.

    Gipermatn tushunchasi birinchi marta 1945 yilda V. Bush tomonidan kiritilgan. Biroq, bunday ma'lumotlar tuzilmalaridan foydalanadigan haqiqiy ilovalar faqat 60-yillardan boshlab qo'llanila boshlandi va ushbu texnologiya atrofidagi faoliyatning chinakam g'ayrioddiy o'sishi faqat bir nechta axborot resurslarini birlashtirish mexanizmiga haqiqiy ehtiyoj paydo bo'lganda boshlandi, yaratish va yaratish qobiliyatini ta'minlaydi. chiziqli bo'lmagan matnni ko'rish. Va bu mexanizmni amalga oshirish misoli xuddi shu WWW edi.

    Hujjatlarni belgilash tilining o'zi teglar (ba'zi tarjima qilingan nashrlarda teglar yorliqlar deb ataladi) deb ataladigan maxsus ko'rsatmalar to'plami bo'lib, hujjatlarda strukturani yaratish va mos ravishda ushbu tuzilmaning turli elementlari o'rtasidagi munosabatlarni aniqlash uchun mo'ljallangan. Belgilash tili teglari yoki ba'zan deyilganidek, boshqaruv identifikatorlari bunday hujjatlarda juda o'ziga xos tarzda kodlangan bo'lib, hujjatning asosiy mazmuniga nisbatan ajratiladi va so'ngra matn mazmunini sharhlovchi va ko'rsatadigan dastur uchun ko'rsatmalar sifatida xizmat qiladi. hujjat, aslida, u ko'riladigan odamga, agar siz Internet bilan o'xshashlikni topishga harakat qilsangiz, demak, bu mijoz mijoz, tarjimon dasturi esa eng keng tarqalgan holatda brauzerdir). Birinchi tizimlarda allaqachon ushbu buyruqlarni belgilash uchun "" belgilaridan foydalanishga qaror qilindi, ular ichida ko'rsatmalar nomlari va ularning parametrlari joylashtirilgan. Bugungi kunda teglarni nomlashning bu usuli umumiy qabul qilingan standart hisoblanadi.

    Zamonaviy axborot tizimlarida matn hujjatining gipermatnli bo'linishidan foydalanish ko'p jihatdan gipermatn ma'lumotni chiziqli bo'lmagan ko'rish mexanizmini yaratishga imkon berishi bilan bog'liq. Bu shuni anglatadiki, tizimlarda ma'lumotlar matn tuzilmalarining uzluksiz oqimi sifatida emas, balki giperhavolalar yordamida navigatsiya qilinadigan o'zaro bog'langan komponentlar to'plami sifatida taqdim etiladi.

    Hozirgi kunda eng ommabop va mashhur gipermatn belgilash tili HTML, Internetda joylashgan axborotni strukturalash va uzatish uchun maxsus yaratilgan va shubhasiz WWW texnologiyasining asosiy komponenti hisoblanadi. Gipermatnli hujjat modelidan foydalanish bilan tarmoqdagi turli axborot resurslarini taqdim etish tartibi yanada tartibli bo‘lib, foydalanuvchilar kerakli ma’lumotlarni qidirish va ko‘rishning qulay mexanizmiga ega bo‘lishdi. Biroq, bu masalada birinchi belgi hali ham ancha eski til - SGML hisoblanadi.

    SGML (Standard Generalized Markup Language) 1986 yilda matnli ma'lumotlarni elektron shaklda taqdim etishning kiritish/chiqarish qurilmasi va atrof-muhitga bog'liq bo'lmagan usullarini tavsiflash uchun xalqaro standart (ISO 8879:1986) sifatida rasman qabul qilingan. Uni yaratish uchun asos IBM tomonidan birinchi shaxsiy kompyuterlar paydo bo'lgan davrda ishlab chiqilgan GML (Generalized Markup Language) ancha eski belgilash tili bo'lgan. Aniqroq qilib aytadigan bo'lsak, SGML boshqa belgilash tillarini tavsiflash uchun mo'ljallangan metall tildir.

    Dastlab, belgilash so'zi odatda hujjat muallifiga yoki ba'zida "tartib dizayneri" deb ataladigan bo'lsak, ma'lum bir parcha qanday yozilishi kerakligi haqida ko'rsatma berish uchun mo'ljallangan matn ichidagi izohlar yoki boshqa belgilarni tasvirlash uchun ishlatilgan. Bunday usullar kursivni ko'rsatish uchun qiyshayib tagiga chizish, ayrim iboralarni o'tkazib yuborish yoki ularni ma'lum bir shriftda chop etish uchun ba'zi maxsus piktogrammalar va hokazolarni o'z ichiga olishi mumkin. Vaqt o'tishi bilan formatlash va chop etish avtomatlashtirilganligi sababli, bu atama formatlash, chop etish yoki boshqa ishlov berishni boshqarish uchun elektron matnli hujjatlarga kiritilgan barcha turdagi maxsus belgilash kodlarini o'z ichiga oldi.

    Shunday qilib, belgilash tili matn bloklarini kodlash uchun ishlatiladigan formatlash qoidalari to'plamini anglatadi. Belgilash tili ma'lum bir hujjatda qanday belgi qo'yish mumkinligi, qanday belgilash talab qilinishi, uning elementlarini oddiy matndan qanday ajratish va belgilash nimani anglatishini aniq ko'rsatishi kerak. SGML dastlabki uchta muammoni hal qila oldi, oxirgi muammoni hal qilish norasmiy tavsifning mavjudligini talab qildi.

    SGML, uning asosida yaratilgan boshqa barcha belgilash tillaridan farqli o'laroq, protsessual belgilash o'rniga tavsiflovchi belgilash printsipidan foydalanadi. Bunday tizim hujjatning alohida qismlarini ma'lum toifalarga belgilash uchun oddiygina nomlar beradigan belgilash elementlaridan foydalanadi. Boshqacha qilib aytadigan bo'lsak, Yoki \end(ro'yxat) kabi teglar shunchaki hujjatning bir qismini aniqlaydi va "bu qism paragraf" yoki "bu qism boshlangan ro'yxatning oxiri" va hokazolarni bildiradi. Protsessual belgilarni ishlatadigan tizim (bu matn protsessorlarini o'z ichiga oladi, masalan, Microsoft Word) matnli hujjatning ma'lum bir nuqtasida qanday ishlov berishni aniqlaydi: "bu joyda 5 parametrlari bilan falon va shunga o'xshash protsedurani chaqiring, e va z" yoki "hujjat chegarasini istalgan elementga nisbatan 7 mm o'ngga siljiting, bitta qatorni o'tkazib yuboring, keyingisini qizil chiziqdan boshlang va hokazo. SGMLda hujjatni ma'lum bir maqsadda qayta ishlash uchun zarur bo'lgan ko'rsatmalar (masalan, formatlash) hujjat ichida sodir bo'ladigan tavsif belgilaridan aniq ajratilgan. Ular odatda hujjatdan tashqari alohida protseduralar yoki dasturlarda to'planadi.

    Protsessual belgilarni emas, balki tavsiflovchi belgilarni qo'llash orqali bir xil hujjat turli dasturlar tomonidan qayta ishlanishi mumkin, ularning har biri muhim deb hisoblagan qismlariga o'z qayta ishlash ko'rsatmalarini qo'llashi mumkin. Masalan, kontentni tahlil qilish dasturi izohlarni butunlay e'tiborsiz qoldirishi mumkin, formatlash dasturi esa ularni har bir qism oxirida chop etish uchun ajratib olishi va yig'ishi mumkin. Har xil turdagi ishlov berish ko'rsatmalari faylning bir xil qismi bilan bog'lanishi mumkin. Misol uchun, bir dastur indeks yoki ma'lumotlar bazasini yaratish uchun hujjatdan odamlarning ismlari va joy nomlarini ajratib olishi mumkin, bir xil matnni qayta ishlaydigan boshqa dastur esa nomlarni boshqa shriftda chop etishi mumkin.

    SGML shuningdek, hujjat turi tushunchasini va shunga mos ravishda uni aniqlash usullarini (hujjat turini aniqlash, DTD) kiritadi. Hujjatlar xuddi kompyuterda qayta ishlanadigan boshqa ob'ektlar kabi terilgan hisoblanadi. Hujjatning turi rasmiy ravishda uning tarkibiy qismlari va ularning tuzilishi bilan belgilanadi. Misol uchun, hujjat turini shunday belgilash mumkinki, u sarlavha va ehtimol muallif nomidan, keyin esa referat va bir yoki bir nechta paragraflar ketma-ketligidan iborat bo'ladi. Ushbu rasmiy ta'rifga ko'ra, sarlavhaga ega bo'lmagan har qanday hujjat inson nuqtai nazaridan qanchalik hisobotga o'xshash bo'lishidan qat'i nazar, hisobot bo'lmaydi, undan keyin abstraktdan keyingi paragraflar ketma-ketligidan ko'proq narsa hisobot bo'lmaydi. o'quvchi..

    Hujjatlar ma'lum turdagi bo'lgani uchun siz ma'lum bir turdagi hujjatni qayta ishlash va ushbu hujjat turi uchun zarur bo'lgan barcha elementlarning mavjudligi va topilganligini tekshirish uchun parser deb nomlangan maxsus dasturdan foydalanishingiz mumkin. tuzilgan. Eng muhimi, bir xil turdagi turli hujjatlar bir xilda qayta ishlanishi mumkin. Hujjatning axborot tuzilmasida mavjud bo'lgan bilimlardan foydalanadigan dasturlarni yozish mumkin, shuning uchun ular yanada aqlli bo'lishi mumkin.

    SGML, metatil sifatida, ma'lum ilovalarga mo'ljallangan maxsus tillarni (ko'pincha "SGML ilovalari" deb ataladi) aniqlash imkonini beradi. Bunga misol qilib WWW da keng qo'llaniladigan HTML tilini keltirish mumkin. Har bir bunday til elementlar va ularning atributlarini belgilaydigan DTD shaklida tasvirlangan. Bunday DTD berilgandan so'ng, SGML dasturi ushbu DTD bo'yicha yozilgan hujjatlarni to'g'ri qayta ishlay oladi.

    Hatto loyihada ham ushbu til bizda mavjud bo'lgan global tarmoqqa axborot uzatish modelini amalga oshirish uchun maxsus ishlab chiqilgan. Boshqacha qilib aytganda, HTML Internet mahsulotidir. Garchi, aslida, HTML o'tgan asrning 80-yillarida standart sifatida ISO tomonidan tasdiqlangan standart umumlashtirilgan belgilash tili - SGML (Standard Generalized Markup Language) ning soddalashtirilgan versiyasidir. SGTML sof shakldagi til emas, balki boshqa tillarni yaratish uchun ba'zi qoidalar va tavsiflar to'plamidir; u tegishli teglar to'plamini, ularning atributlarini va hujjatning ichki tuzilishini belgilaydi. Deskriptorlardan to'g'ri foydalanishni nazorat qilish DTD tavsiflari deb nomlangan maxsus qoidalar to'plami yordamida amalga oshiriladi, ular hujjatni tahlil qilishda mijoz tarjimon dasturi tomonidan qo'llaniladi. Hujjatlarning har bir sinfi uchun tegishli belgilash tilining grammatikasini tavsiflovchi o'ziga xos qoidalar to'plami aniqlanadi. SGML-dan foydalanib, siz hujjatlardagi ma'lumotlarni tartibga solishingiz, tuzilgan ma'lumotlarni tavsiflashingiz va keyinchalik foydalanish uchun ushbu ma'lumotni qandaydir standartlashtirilgan formatda taqdim etishingiz mumkin. Biroq, ba'zi bir murakkabligi sababli, SGML asosan boshqa tillarning sintaksisini tavsiflash uchun ishlatilgan (ulardan eng mashhuri HTML) va bir nechta ilovalar to'g'ridan-to'g'ri SGML hujjatlari bilan ishlagan.

    HTML SGML ga qaraganda ancha qulay va foydalanishga qulay tildir. Uning asosida qo'shimcha tillarni aniqlashga ruxsat bermaydi. HTML-dan foydalanish hujjatni standart bo'yicha belgilashni o'z ichiga oladi, bu juda cheklangan ko'rsatmalar yoki teglar to'plami bilan belgilanadi. Bunday ko'rsatmalar, birinchi navbatda, mijoz dasturi ekranida hujjat mazmunini ko'rsatish jarayonini boshqarish va shu bilan hujjatni taqdim etish usulini aniqlash uchun mo'ljallangan, lekin uning umumiy tuzilishi. Ko'pgina hollarda HTML ma'lumotlari http protokoli yordamida tarmoq orqali osongina uzatilishi mumkin bo'lgan oddiy matnli faylda taqdim etiladi.

    Biroq, vaqt o'tishi bilan va ommabop texnologiyalarga tobora qattiqroq talablar qo'yilayotgani sababli, zamonaviy ilovalar nafaqat mijoz ekranida ma'lumotlarni taqdim etish tiliga, balki hujjatning tuzilishini aniqlash va uning tarkibidagi elementlarni tavsiflash imkonini beradigan mexanizmga ham muhtojdir. . HTML oddiy buyruqlar to'plamiga ega va matnli ma'lumotlarni tavsiflash va uni ko'rish dasturi - brauzer ekranida ko'rsatish vazifasini juda muvaffaqiyatli bajaradi. Biroq, ko'rsatilgan ma'lumotlarning o'zi formatlash uchun ishlatiladigan teglarga hech qanday aloqasi yo'q, shuning uchun tahlil qilish dasturlari bizga kerak bo'lgan hujjat parchalarini topish uchun HTML teglaridan foydalanish imkoniyatiga ega emas. Bular. masalan, bunday tavsifga duch kelgan

    atirgul

    Tomoshabin teglar ichidagi matnni qanday rangda ko'rsatishni bilib oladi va, ehtimol, uni to'g'ri ko'rsatishi mumkin, lekin bu teg hujjatning qayerida joylashganligi, joriy fragmentning boshqa qanday teglar bilan o'ralganligi, yo'qmi, mutlaqo befarq. unda ob'ektlar orasidagi munosabatlar to'g'ri tuzilganmi yoki yo'qmi, unda parchalar mavjud. Hujjatning tuzilishiga bunday "befarqlik" uning ichidagi ma'lumotlarni qidirish yoki tahlil qilish elementlarga bo'linmagan doimiy matn fayli bilan ishlashdan farq qilmasligiga olib keladi. Va bu, siz bilganingizdek, axborot bilan ishlashning eng samarali usuli emas.

    HTML-da amalga oshirilgan g'oyaning yana bir muhim kamchiligi bu teglarning cheklangan to'plamidir. HTML uchun DTD qoidalari qat'iy tavsiflovchilar to'plamini belgilaydi va shuning uchun ishlab chiquvchi o'zining maxsus teglarini kiritish imkoniyatiga ega emas. Vaqti-vaqti bilan yangi til kengaytmalari paydo bo'lishiga qaramasdan (bugungi kunda HTMLning so'nggi versiyasi HTML 4.0), ularni standartlashtirishga olib boradigan uzoq yo'l, asosiy brauzer ishlab chiqaruvchilari o'rtasidagi doimiy kelishmovchiliklar bilan birga, tilni tezda moslashtirishni deyarli imkonsiz qiladi, undan foydalanish. maxsus ma'lumotlarni ko'rsatish uchun (masalan, multimedia, matematik, kimyoviy formulalar va boshqalar).

    Aytilganlarni umumlashtirish uchun shuni aytish mumkinki, HTML bugungi kunda ushbu turdagi tillar uchun zamonaviy ishlab chiquvchilar tomonidan qo'yilgan talablarni to'liq qondirmaydi. Va uni almashtirish uchun yangi gipermatn belgilash tili taklif qilindi: kuchli, moslashuvchan va shu bilan birga qulay XML tili.

    XML (Extensible Markup Language) - XML ​​hujjatlari deb ataladigan ma'lumotlar ob'ektlarining butun sinfini tavsiflovchi belgilash tili. Ushbu til boshqa tillarning grammatikasini tavsiflash va hujjatlarning to'g'riligini nazorat qilish uchun vosita sifatida ishlatiladi. Bular. XML-ning o'zi belgilash uchun mo'ljallangan teglarni o'z ichiga olmaydi, u shunchaki ularni yaratish tartibini belgilaydi. Shunday qilib, masalan, hujjatdagi atirgul elementini ko'rsatish uchun tegdan foydalanishimiz kerak deb hisoblasak, XML biz belgilagan tegdan erkin foydalanishga imkon beradi va biz hujjatga quyidagi kabi parchalarni kiritishimiz mumkin:

    atirgul

    Teglar to'plami osongina kengaytirilishi mumkin. Agar biz gulning tavsifi u gullaydigan issiqxonaning tavsifiga mazmunli kirishi kerakligini aytmoqchi bo'lsak, biz shunchaki yangi teglar o'rnatamiz va ular paydo bo'lish tartibini tanlaymiz:

    atirgul

    Agar biz u erga yana bir nechta gul ekmoqchi bo'lsak, quyidagi o'zgarishlarni amalga oshirishimiz kerak:

    atirgul

    lola

    kaktus

    Ko'rib turganingizdek, XML hujjatini yaratish jarayoni juda oddiy va bizdan faqat HTML bo'yicha asosiy bilimga ega bo'lishni va XMLni belgilash tili sifatida ishlatmoqchi bo'lgan vazifalarni tushunishimizni talab qiladi. Bu ishlab chiquvchilarga hujjatdagi ma'lumotlarni eng samarali aniqlash imkonini beruvchi maxsus buyruqlarni aniqlashning noyob qobiliyatini beradi. Hujjat muallifi uning tuzilishini yaratadi, uning talablariga javob beradigan buyruqlar yordamida elementlar o'rtasida zarur aloqalarni o'rnatadi va hujjatni ko'rish, qidirish va tahlil qilish operatsiyalarini bajarish uchun zarur bo'lgan belgilash turiga erishadi.

    XML ning yana bir yaqqol ustunligi uni axborot omborlari uchun universal so'rovlar tili sifatida ishlatish qobiliyatidir. Bugungi kunda W3C tubida XML-QL (yoki XQL) standartining ishchi versiyasi ko'rib chiqilmoqda, bu kelajakda SQL uchun jiddiy raqobatchiga aylanishi mumkin. Bundan tashqari, XML hujjatlari ma'lumotlarni tahlil qilish va uni mijoz tomonida taqdim etish vositalarini o'z ichiga olgan ma'lumotlarni saqlashning o'ziga xos usuli sifatida harakat qilishi mumkin. Ushbu sohada istiqbolli yo'nalishlardan biri Java va XML texnologiyalarining integratsiyasi bo'lib, bu ma'lumotlar almashinuvi uchun universal ma'lumotlar formatidan ham foydalanadigan mashinadan mustaqil ilovalarni yaratishda ikkala texnologiyaning kuchidan foydalanish imkonini beradi.

    XML shuningdek, hujjatlarda saqlanadigan ma'lumotlarning to'g'riligini nazorat qilish, hujjat ichidagi ierarxik munosabatlarni tekshirish va mazmuni turli xil ma'lumotlar bo'lishi mumkin bo'lgan hujjatlar tuzilishi uchun yagona standartni o'rnatish imkonini beradi. Bu shuni anglatadiki, undan murakkab axborot tizimlarini qurishda foydalanish mumkin, bunda bir tizimda ishlaydigan turli ilovalar o'rtasida axborot almashish masalasi juda muhimdir. Loyiha ustida ishlashning boshida ma'lumot almashish mexanizmi tuzilmasini yaratish orqali menejer kelajakda tizimning turli komponentlari tomonidan qo'llaniladigan ma'lumotlar formatlarining mos kelmasligi bilan bog'liq ko'plab muammolardan xalos bo'lishi mumkin.

    Shuningdek, XML ning afzalliklaridan biri shundaki, XML xujjatlarni qayta ishlash dasturlari oddiy bo'lib, bugungi kunda XML hujjatlari bilan ishlashga mo'ljallangan barcha turdagi dasturiy mahsulotlar erkin tarqatiladi. XML bugungi kunda Microsoft Internet Explorer oilasining 4.0 versiyasidan boshlab barcha brauzerlarida qo'llab-quvvatlanadi. U Netscape Communicator, Oracle DBMS, DB-2 va MS-Office ilovalarining keyingi versiyalarida qo'llab-quvvatlanishi e'lon qilindi. Bularning barchasi, ehtimol, yaqin kelajakda XML axborot tizimlari uchun asosiy axborot almashish tiliga aylanadi va shu bilan HTML o'rnini bosadi, deb taxmin qilish uchun asos bo'ladi. XML asosida SMIL, CDF, MathML, XSL kabi taniqli ixtisoslashtirilgan belgilash tillari allaqachon yaratilgan va W3C tomonidan ko'rib chiqilayotgan yangi tillarning ishchi loyihalari ro'yxati doimiy ravishda o'sib bormoqda.

    XML hujjati qanday ko'rinishga ega?

    Agar siz HTML bilan tanish bo'lsangiz, XMLni o'rganish sizdan ko'p kuch sarflamaydi. XML o'z imkoniyatlari va maqsadi bo'yicha HyperText Markup Language-dan juda farq qilsa-da, ikkala til ham SGML-ning quyi to'plamidir va shuning uchun uning asosiy tamoyillarini meros qilib oladi.

    Hujjat tuzilishi

    Oddiy XML hujjati 1-misol kabi ko'rinishi mumkin

    Birinchidan

    Ikkinchi band 1

    Uchinchi

    Oxirgi

    E'tibor bering, ushbu hujjat oddiy HTML sahifasiga juda o'xshaydi. Xuddi HTMLda bo'lgani kabi, burchakli qavslar ichiga olingan ko'rsatmalar teglar deb ataladi va hujjatning asosiy qismini belgilash uchun xizmat qiladi. XMLda ochish, yopish va bo'sh teglar mavjud (HTMLda bo'sh teg tushunchasi ham mavjud, lekin maxsus belgilash talab qilinmaydi).

    XML hujjatining tanasi belgilash elementlari va hujjatning haqiqiy mazmuni - ma'lumotlardan (kontentdan) iborat. XML teglari hujjat elementlarini, ularning atributlarini va boshqa til konstruksiyalarini aniqlash uchun moʻljallangan. Hujjatlarda qo'llaniladigan belgilash turlari haqida birozdan keyin batafsilroq gaplashamiz.

    Har qanday XML hujjati har doim ko'rsatma bilan boshlanishi kerak, uning ichida siz til versiyasi raqamini, kod sahifasi raqamini va hujjatni tahlil qilish uchun tahlil qilish dasturi uchun zarur bo'lgan boshqa parametrlarni ham belgilashingiz mumkin.

    XML hujjatini yaratish qoidalari

    Umuman olganda, XML hujjatlari quyidagi talablarga javob berishi kerak:

    Hujjat sarlavhasi hujjatning belgilash tilini, versiya raqamini va qo'shimcha ma'lumotlarni ko'rsatadigan XML deklaratsiyasini o'z ichiga oladi.

    Hujjatdagi ba'zi ma'lumotlar maydonini belgilaydigan har bir ochilish tegi o'zining yopish "sherigi" bo'lishi kerak, ya'ni HTMLdan farqli o'laroq, yopish teglarini o'tkazib yuborish mumkin emas.

    XML katta-kichik harflarga sezgir.

    Teg ta'riflarida ishlatiladigan barcha atribut qiymatlari qo'shtirnoq ichiga olinishi kerak.

    XML-da teglarni joylashtirish qat'iy nazorat qilinadi, shuning uchun teglarni ochish va yopish tartibini kuzatish kerak.

    Boshlanish va tugatish teglari orasidagi barcha ma'lumotlar XMLda ma'lumotlar sifatida ko'rib chiqiladi va shuning uchun barcha formatlash belgilari hisobga olinadi (ya'ni bo'shliqlar, qatorlar, yorliqlar HTMLdagi kabi e'tibordan chetda qolmaydi).

    Agar XML hujjati yuqoridagi qoidalarni buzmasa, u rasmiy ravishda to'g'ri deb ataladi va XML hujjatlarini tahlil qilish uchun mo'ljallangan barcha analizatorlar u bilan to'g'ri ishlay oladi.

    Shu bilan birga, hujjat til grammatikasiga rasmiy muvofiqligini tekshirishdan tashqari, hujjat mazmunini, elementlar o'rtasidagi zarur munosabatlarni belgilovchi va hujjat tuzilishini tashkil etuvchi qoidalarga rioya qilishni nazorat qilish vositalarini o'z ichiga olishi mumkin. Misol uchun, quyidagi matn, garchi to'liq haqiqiy XML hujjati bo'lsa ham, mutlaqo ma'nosiz bo'ladi:

    Rossiya Novosibirsk

    XML hujjatlarining to'g'riligini tekshirish uchun bunday tekshirishni amalga oshiradigan va verifiers deb ataladigan analizatorlardan foydalanish kerak.

    Bugungi kunda XML hujjatining to'g'riligini nazorat qilishning ikkita asosiy usuli mavjud: DTD ta'riflari (Hujjat turini aniqlash) va ma'lumotlar sxemalari (Semantik sxema). Keyingi safar DTD va sxemalardan foydalanish haqida ko'proq gaplashamiz. SGML-dan farqli o'laroq, XML-da DTD qoidalarini aniqlash shart emas va bu holat bizga juda murakkab DTD sintaksisi ustidan miyamizni chalg'itmasdan har qanday XML hujjatlarini yaratishga imkon beradi.

    Asosiy printsip

    Element XML hujjatining asosiy tarkibiy birligidir. Teglarga atirgul so'zini qo'shish orqali biz bo'sh bo'lmagan elementni aniqlaymiz, uning mazmuni atirgul. Umumiy holda, elementlarning mazmuni oddiygina matn yoki boshqa ichki hujjat elementlari, CDATA bo'limlari, ishlov berish ko'rsatmalari, sharhlar, ya'ni. XML hujjatining deyarli har qanday qismi.

    Har qanday bo'sh bo'lmagan element boshlang'ich teg, tugatish tegi va ular orasiga kiritilgan ma'lumotlardan iborat bo'lishi kerak.

    Hujjatdagi barcha elementlar to'plami uning tuzilishini belgilaydi va barcha ierarxik munosabatlarni belgilaydi. Elementlardan foydalangan holda, tekis ma'lumotlar modeli elementlar orasidagi ko'plab mumkin bo'lgan munosabatlarga ega bo'lgan murakkab ierarxik tizimga aylantiriladi.

    Hujjatni keyinchalik qidirishda mijoz dasturi uning tuzilishiga kiritilgan ma'lumotlarga - hujjat elementlaridan foydalangan holda tayanadi. Bular. agar siz, masalan, to'g'ri shaharda to'g'ri universitetni topmoqchi bo'lsangiz, unda ma'lum bir element ichida joylashgan ma'lum bir elementning mazmunini ko'rishingiz kerak bo'ladi. Bu holda qidiruv, tabiiyki, butun hujjat bo'ylab kerakli ketma-ketlikni topishdan ko'ra samaraliroq bo'ladi.

    XML hujjatida, qoida tariqasida, ildiz deb ataladigan kamida bitta element aniqlanadi va tahlilchilar ushbu elementdan hujjatni skanerlashni boshlaydilar. Yuqoridagi misolda bu element .

    Ba'zi hollarda teglar hujjatning ma'lum qismlarining semantikasini o'zgartirishi va aniqlashtirishi mumkin, bir xil ma'lumotlarni turli yo'llar bilan aniqlaydi va shu bilan ushbu hujjatni tahlil qiluvchi dasturni tavsiflangan ma'lumotlardan foydalanish konteksti haqida ma'lumot bilan ta'minlaydi. Misol uchun, Hollivud fragmentini o'qib chiqqandan so'ng, hujjatning ushbu qismi shahar haqida ekanligini taxmin qilishimiz mumkin, ammo Hollivud fragmentida bu ovqatxona haqida.

    Xulosa

    Veb-sahifani formatlash tili HTML dastlab SGML ilovasi sifatida kiritilgan. Keyinchalik, WWW ning jadal rivojlanishi bilan, muallifga ma'lumotlarning tashqi ko'rinishini ko'proq nazorat qilish uchun HTML har tomonlama kengayishni boshladi. Yangi elementlar va atributlar, masalan, yoki , vizual formatlashga qaratilgan. Belgilash tilining bir qismi bo'lmagan vositalar paydo bo'ldi va faol foydalanila boshlandi: tasvir xaritalari, Java va JavaScript, plaginlar va boshqalar. Bundan tashqari, faqat ma'lum brauzerlar tomonidan qo'llab-quvvatlanadigan yoki turli brauzerlarda boshqacha ishlaydigan ko'plab HTML elementlari mavjud. Shuning uchun, HTML SGML ilovasi yoki yo'qligini aytish qiyin. HTML spetsifikatsiyalari va tegishli DTD larga muvofiq juda kam sahifalar yaratilgan.

    Ushbu muammo qisman standart W3 konsorsiumi tomonidan qabul qilingan kaskadli uslublar bilan engillashtiriladi. CSS1 elementlarning vizual ko'rinishini belgilovchi uslubni element belgilaridan ajratib turadi.

    Veb-sahifalar uchun belgilash tili sifatida HTML o'rnini bosishi kerak bo'lgan XML tili katta qiziqish uyg'otadi. Bu SGML ning birinchi navbatda WWW da foydalanishga qaratilgan variantidir. Bu DTD ni talab qilmaydi va kamdan-kam ishlatiladigan murakkab tuzilmalar tufayli tilning o'zi soddalashtirilgan. Bu tahlilchilarni soddalashtiradi, bu esa brauzerlarda XML-dan faol foydalanish imkonini beradi. (Brauzer sohasidagi ikkala asosiy o'yinchining XML tomon bosh irg'ishlarini hisobga olsak, buning ehtimoli ancha yuqori).


    Chop etish mumkin boʻlgan VERSIYA>>
    Maqola o'qildi:bir marta.

    (Standard Generalized Markup Language), ISO 8879 standartida taqdim etilgan.Ushbu til texnik hujjatlarni, jumladan, interaktiv elektron texnik qoʻllanmalarni loyihalashda asosiy til sifatida qabul qilingan. CALS texnologiyalaridan foydalangan holda yaratilgan mahsulotlar uchun.

    SGML hujjatlar tuzilishini ma'lumotlar ob'ektlarining ketma-ketligi sifatida belgilaydi. Hujjat qismlarini ifodalovchi ma'lumotlar ob'ektlari turli fayllarda saqlanishi mumkin. SGML standarti turli xil tizimlarga ushbu ma'lumotni to'g'ri tanib olish va identifikatsiya qilish imkonini beradigan ma'lumotlarni ifodalash uchun belgilar va qoidalar to'plamini o'rnatadi. Ushbu to'plamlar DTD deklaratsiyasi deb nomlangan hujjatning alohida qismida tasvirlangan(Hujjat turini aniqlash), bu asosiy SGML hujjati bilan birga uzatiladi. DTD belgilar va ularning kodlari muvofiqligini, ishlatiladigan identifikatorlarning maksimal uzunligini, teglar uchun ajratuvchilarni ifodalash usulini, boshqa mumkin bo'lgan konventsiyalarni, DTD sintaksisini, hujjat turi va versiyasini belgilaydi. Shuning uchun SGML ni o'ziga xos belgilash tillari oilasi uchun metatil deb atash mumkin. Xususan, XML belgilash tillarini SGML ning quyi to'plamlari deb hisoblash mumkin va HTML.

    SGML hujjati ko'rinishidagi texnik tavsif quyidagilarni o'z ichiga oladi:

    • SGML teglari bilan belgilangan texnik qo'llanma bilan asosiy fayl;
    • ob'ektlar tavsifi, agar hujjat bir xil sub'ektlar qo'llaniladigan va ularning bilimlari nazarda tutilgan guruhga tegishli bo'lsa;
    • SGML teglarini tushuntirish uchun lug'at;

    Biroq, SGMLni o'rganish va ishlatish qiyin. Shuning uchun WWWga taqdim etilgan hujjatlarda markirovkadan keng foydalanish uchun-technologies, 1991 yilda SGML asosida soddalashtirilgan HTML tili ishlab chiqildi(HyperText Markup Language), 1996 yilda esa XML tili(eXtensible Markup Language), bu HTML bilan birgalikda turli xil ilovalarda hujjatlarni taqdim etish uchun asosiy tilga aylanadi.

    HTML tili WWW texnologiyalarida taqdim etilgan hujjatlarda belgilarni keng qo'llash uchun ishlab chiqilgan.

    HTML tavsifi ASCII matnidan va unga kiritilgan buyruqlar (boshqaruv kodlari) ketma-ketligidan iborat bo'lib, ular tavsiflovchilar yoki teglar deb ham ataladi. Bu matn HTML hujjati yoki HTML sahifasi yoki Web serverga joylashtirilganda Web sahifa deb ataladi.. Teglar manba matnning kerakli joylariga joylashtiriladi, ular shriftlarni, defislarni, grafiklarning ko'rinishini, havolalarni va boshqalarni aniqlaydi. WWW muharrirlaridan foydalanganda buyruqlar faqat tegishli tugmalarni bosish orqali kiritiladi.

    XML, xuddi HTML kabi, SGML ning quyi to'plami hisoblanadi. Hozirgi vaqtda XML tili axborot texnologiyalarida hujjatlarni taqdim etishning asosiy tili bo'lib, uni turli xil ilovalarda xususiy belgilash tillarini yaratish uchun asos bo'lib xizmat qiladigan metall til sifatida ko'rib chiqish mumkin. Shu bilan birga, XML SGML ga qaraganda qulayroqdir, bu XMLda SGML ning ba'zi kichik xususiyatlarini yo'q qilish bilan ta'minlanadi. XMLdagi tavsiflarni tushunish osonroq va zamonaviy brauzerlarda foydalanish uchun moslashtirilgan SGML ning asosiy xususiyatlarini saqlab qolgan holda.

    Muayyan ilovalar uchun XML lug'atlari yoki XML ilovalari deb ataladigan XMLning o'z versiyalari yaratiladi. Shunday qilib, maxsus matematik belgilar bilan matnlarni tasvirlash uchun XML ilovasi OSD (Ochiq dasturiy ta'minot tavsifi) ishlab chiqilgan. CALS uchun ma'lumotlar almashinuviga bag'ishlangan mahsulot ta'rifi eXchange (PDX) opsiyasi qiziqish uyg'otadi. Kimyo (CML - Chemical Markup Language), biologiya (BSML - Bioinformatic Sequence Markup Language) va boshqalar uchun mashhur lug'atlar mavjud.

    Har qanday hujjat uchta komponentdan iborat:

    · tuzilishi;

    Tarkib - bu hujjatda ko'rsatiladigan ma'lumotlar. Qog'ozdagi hujjatning mazmuni sof matnli bo'lishi mumkin va shuningdek, tasvirlarni o'z ichiga olishi mumkin. Agar hujjat elektron shaklda taqdim etilsa, unda multimedia ma'lumotlari, shuningdek, boshqa hujjatlarga havolalar bo'lishi mumkin. Turli xil hujjatlarning mazmuni turlicha bo'lsa-da, ularni kitob yoki poezd chiptasi kabi turlarga ajratish mumkin.

    Hujjatning uslubi uning mazmuni ma'lum bir qurilmada (masalan, printer yoki displeyda) ko'rsatiladigan shaklni belgilaydi. Uslub tushunchasi butun chiqish hujjati yoki uning alohida bloklari shrifti (nomi, hajmi, rangi), sahifalash tartibi, sahifalardagi bloklarning joylashuvi va boshqa parametrlarni o'z ichiga oladi. Xuddi shu hujjat turli xil tashuvchilarda ham, bir xil tashuvchilarda ham turli uslublarda chiqarilishi mumkin.

    Hujjatlarni belgilash tillari - bu hujjat tuzilishini va strukturaning turli ob'ektlari o'rtasidagi munosabatlarni tavsiflash uchun mo'ljallangan sun'iy tillar. Belgilash ma'lumotlari metadata deb ham ataladi.

    Birinchi belgilash tili bu o'tgan asrning 60-yillarida IBM xodimlari tomonidan ishlab chiqilgan GML (Generalized Markup Language) hisoblanadi. Uning bevosita vorisi SGML tili (Standard Generalized Markup Language) bo'lib, u hujjat belgilash elementlarini qayd etish qoidalarini belgilaydi. Til qoidalariga amal qiladigan hujjat SGML hujjati deyiladi.

    SGML tili ISO 8879 standartida aniqlangan boʻlib, hujjatni belgilash tiliga qoʻyiladigan asosiy talablarni belgilaydi:

    · Til inson o'qishi mumkin bo'lishi kerak.

    · Belgilangan hujjat fayllari matn bo'lishi va ASCII kod belgilaridan foydalangan holda kodlangan bo'lishi kerak (Axborot almashinuvi uchun Amerika standart kodi). Biroq, hujjat mazmuni ASCII kodlangan yoki matn bo'lishi shart emas.

    SGML va shunga o'xshash tillar maxsus hujjatlarni belgilash vositalaridan foydalanadi:

    · elementlar va ularga hamroh bo'lgan atributlar;

    · sub'ektlar;

    · Izohlar.

    SGML hujjatining tarkibiy birligi element hisoblanadi. Belgilangan matnda har bir element ma'lum bir tarzda ta'kidlanishi kerak. Tanlash elementning boshiga (boshlang'ich teg) boshlang'ich tegni (inglizcha teg - label so'zidan) va elementning oxiriga tugatish tegini (tugash tegi) qo'yish orqali amalga oshiriladi. Boshlanish va tugatish teglari bir xil nomga ega. Teglarni oddiy matndan farqlash uchun ular tegning boshlanishini bildiruvchi belgi bilan boshlanishi va tegning oxirini bildiruvchi belgi bilan tugashi kerak. Bundan tashqari, yakuniy tegda belgi ko'rsatilgan - yakuniy tegning belgisi. SGMLda bunday xususiyatlar sifatida har qanday belgilar belgilanishi mumkin, lekin eng keng tarqalgan belgi tegning boshi sifatida "" (chap burchakli qavs) belgisi va yakuniy teg belgisi sifatida "/" (qiyshiq chiziq) belgisi ishlatiladi. SGML hujjatidagi elementlar boshqa elementlarni qamrab olishi mumkin, natijada SGML hujjatining ierarxik (daraxt) strukturasi sifatida grafik tasviri paydo bo‘ladi.


    4.3.1-misol. Imtihon sessiyasi natijalari bilan talabalar ro'yxatini ko'rsatadigan SGML hujjati quyidagicha ko'rsatilishi mumkin:

    Sessiyada talabalarning baholashlari ro'yxati

    Ivanov Ivan Ivanovich

    TS-61

    A

    B

    B

    B

    Petrov Petr Petrovich

    TS-62

    C

    C

    D

    C

    Ushbu hujjatda birinchi element talabalar ro'yxati elementidir. Ushbu element bitta sarlavha elementi (sarlavha) va bir nechta talaba elementlarini (talaba ma'lumotlari) o'z ichiga oladi. O'z navbatida, har bir talaba elementida bitta to'liq ism elementi (talabaning familiyasi, ismi va otasining ismi), bitta guruh-raqam elementi (guruh raqami) va bitta belgi-list elementi (sessiyadagi talabalar baholari ro'yxati) mavjud. Va nihoyat, mark-list elementi bir nechta belgi elementlarini (ball) o'z ichiga oladi.

    Ushbu ro'yxatning grafik tasviri rasmda. 4.3.1 daraxt tuzilishiga ega:

    Guruch. 4.3.1. Grafik tasvirlashda SGML hujjat tuzilishi

    Atributlar SGML elementlarini takomillashtirish uchun ishlatilishi mumkin. Atributlar elementning boshlang'ich tegida quyidagicha yoziladi:

    atribut-name="atribut-qiymat".

    Element bir nechta atributlarga ega bo'lishi mumkin. Atributlar bir-biridan va element nomidan kamida bitta bo'sh joy bilan ajratiladi.

    4.3.2-misol. 4.3.1-misoldagi belgi elementlari uchun siz mavzu atributini belgilashingiz mumkin, uning qiymati imtihon topshirilgan fan nomidir. Keyin birinchi talaba uchun elementlar quyidagi shaklni oladi:

    A

    B

    B

    B

    SGML kabi tillar ma'lumotlar guruhlari bilan ishlash uchun ob'ektlardan foydalanadi. Ob'ekt - bu matn va matn bo'lmagan har qanday nomlangan ma'lumotlar. Hujjatni ko'rishda ob'ekt nomi uning qiymati bilan almashtiriladi. Shunday qilib, masalan, kpi matn ob'ektining nomi uning qiymati bilan almashtiriladi: Kiev Politexnika Instituti va matn bo'lmagan ob'ekt tasviri1 image1 nomli rasm bilan almashtiriladi.

    belgilash tillari) - bu hujjatlarda strukturani shakllantirish va ushbu tuzilmaning turli elementlari o'rtasidagi munosabatlarni aniqlash uchun mo'ljallangan teglar deb ataladigan maxsus ko'rsatmalar to'plami. Boshqacha qilib aytganda, belgilash hujjatning qaysi qismi sarlavha ekanligini, qaysi subtitr ekanligini, muallifning nomini nima deb hisoblash kerakligini va hokazolarni ko'rsatadi. Belgilash uslubiy belgilash, strukturaviy va semantik belgilarga bo'linadi. Stilistik belgilash

    Stilistik belgilar hujjatning ko'rinishi uchun javobgardir. Misol uchun, HTMLda bu turdagi belgilash teglarni o'z ichiga oladi, masalan (kursiv), (qalin), (pastga chizilgan), (chizilgan matn) va boshqalar.

    Strukturaviy markalash

    Strukturaviy belgi hujjatning tuzilishini belgilaydi. Masalan, HTMLda teglar (paragraf), (sarlavha), (bo'lim) va hokazolar ushbu turdagi belgilash uchun javobgardir.

    Semantik belgilash

    Semantik belgilash ma'lumotlarning mazmuni haqida ma'lumot beradi. Ushbu turdagi belgilarga misollar teglar (hujjat nomi), (kod, kodlar ro'yxati uchun ishlatiladi), (o'zgaruvchi), (muallifning manzili).

    Har qanday belgilash tilining asosiy tushunchalari teglar, elementlar va atributlardir.

    Teglar va elementlar.

    Teglar va elementlarning ma'nolari ko'pincha chalkashib ketadi.

    Teglar yoki boshqaruv identifikatorlari ham deyiladi, teg mazmuni bilan nima qilish kerakligi haqida mijoz tomonida hujjat mazmunini ko'rsatadigan dastur uchun ko'rsatmalar bo'lib xizmat qiladi. Hujjatning asosiy mazmuniga nisbatan tegni ajratib ko'rsatish uchun burchakli qavslar qo'llaniladi: teg kichikroq () belgisi bilan boshlanadi, uning ichida ko'rsatmalar nomi va ularning parametrlari joylashtirilgan. Masalan, HTMLda teg keyingi matn kursiv bilan yozilishi kerakligini bildiradi.

    Element - bu ularning mazmuni bilan birga teglar. Quyidagi konstruktsiya elementga misoldir:

    Ushbu matn kursiv bilan yozilgan .

    Element ochilish tegidan iborat (bizning misolimizda bu teg ), teg mazmuni (misolda bu "Bu kursivdagi matn" matni) va yopish tegi(), ba'zan HTML-da, yopilish tegini o'tkazib yuborish mumkin.

    Atributlar

    Elementni belgilashda ushbu elementning xususiyatlarini aniqlaydigan har qanday parametrlarni o'rnatish uchun atributlar qo'llaniladi.

    Atributlar boshlang'ich tegdagi elementni belgilashda ko'rsatilishi mumkin bo'lgan nom = qiymat juftligidan iborat. Tenglik belgisining chap va o'ng tomonida bo'sh joy qoldirishingiz mumkin. Atribut qiymati bitta yoki ikkita tirnoq ichiga olingan qator sifatida ko'rsatilgan.

    Har qanday teg, agar bu atribut aniqlangan bo'lsa, atributga ega bo'lishi mumkin.

    Atribut ishlatilganda element quyidagi shaklni oladi:

    kontentni belgilang

    Matn markazga tekislangan

    Bitta ochilish tegi bir nechta atributlarni o'z ichiga olishi mumkin, masalan:

    Belgilangan matn hajmi va rangi

    Belgilash tillarining rivojlanish tarixi.

    Gipermatn tushunchasi 1945-yilda V.Bush tomonidan kiritilgan boʻlib, 60-yillardan boshlab gipermatnli maʼlumotlardan foydalanadigan birinchi ilovalar paydo boʻla boshladi. Biroq, bu texnologiya o'zining asosiy rivojlanishini chiziqli bo'lmagan matnni yaratish va ko'rish qobiliyatini ta'minlaydigan bir nechta axborot resurslarini birlashtirish mexanizmiga haqiqiy ehtiyoj paydo bo'lganda oldi.

    1986 yilda ISO standartlashtirilgan umumlashtirilgan belgilash tilini tasdiqladi. Ushbu til boshqa belgilash tillarini yaratish uchun mo'ljallangan; u tegishli teglar to'plamini, ularning atributlarini va hujjatning ichki tuzilishini belgilaydi. Shunday qilib, hujjat mazmuni bilan bog'liq o'zingizning teglaringizni yaratishingiz mumkin. Endi bunday hujjatlarni Document Type Definition (DTD) da saqlanadigan belgilash tili ta'rifisiz talqin qilish qiyinligi ayon bo'ldi. DTD SGML standartida tilning barcha qoidalarini guruhlaydi. Boshqacha qilib aytganda, DTD teglarning bir-biri bilan aloqasini va ulardan foydalanish qoidalarini tavsiflaydi. Bundan tashqari, hujjatlarning har bir sinfi uchun tegishli belgilash tilining grammatikasini tavsiflovchi o'ziga xos qoidalar to'plami aniqlanadi. Shunday qilib, faqat DTD yordamida teglardan to'g'ri foydalanishni tekshirish mumkin va shuning uchun uni SGML hujjati bilan birga yuborish yoki hujjatga kiritish kerak.

    O'sha paytda, SGML-dan tashqari, bir-biri bilan raqobatlashadigan boshqa shunga o'xshash tillar ham bor edi, ammo mashhurlik (HTML, uning avlodlaridan biri) SGML-ga o'z hamkasblariga nisbatan shubhasiz ustunlik berdi.

    SGML-dan foydalanib, siz tuzilgan ma'lumotlarni tavsiflashingiz, hujjatlardagi ma'lumotlarni tartibga solishingiz va ushbu ma'lumotlarni qandaydir standartlashtirilgan formatda taqdim etishingiz mumkin. Ammo uning murakkabligi tufayli SGML asosan boshqa tillarning sintaksisini tavsiflash uchun ishlatilgan va bir nechta ilovalar bevosita SGML hujjatlari bilan ishlagan. SGML odatda faqat yirik loyihalarda, masalan, yirik kompaniya uchun yagona hujjat boshqaruv tizimini yaratishda qo'llaniladi.

    HTML belgilash tili SGML ga qaraganda ancha sodda va qulayroq, uning ko'rsatmalari birinchi navbatda hujjat mazmunini ekranda ko'rsatish jarayonini boshqarish uchun mo'ljallangan. HTML texnik hujjatlarni belgilash usuli sifatida 1991 yilda Tim Berners-Li tomonidan ilmiy hamjamiyat uchun maxsus yaratilgan. Bu dastlab SGML ilovalaridan biri edi.

    HTML qila oladigan yagona narsa hujjat qismlarini tasniflash va uning brauzerda to'g'ri ko'rsatilishini ta'minlash bo'lishiga qaramay, bu eng mashhur belgilash tilidir. Buning sababi, HTMLni o'rganish juda oson. Buning uchun HTML buyruqlarini o‘rganish kifoya. HTML uchun DTD brauzerda saqlanadi. Bundan tashqari, shuni ta'kidlash kerakki, HTML turli xil platformalarda ishlash uchun mo'ljallangan. Ammo u bir qator muhim cheklovlarga ega:

  • HTMLda belgilangan teglar to'plami mavjud va bu to'plamni kengaytirish yoki o'zgartirish mumkin emas;
  • HTML tili teglari faqat ma'lumotlar qanday taqdim etilishi kerakligini, ya'ni hujjatning ko'rinishini ko'rsatadi. HTML teglardagi tarkibning ma'nosi yoki hujjat tuzilishi haqida ma'lumot bermaydi.