텍스트 문서를 위한 특별한 마크업 언어가 호출됩니다. HTML 문서 마크업 언어. 논리적 및 시각적 마크업

마크업 언어)는 문서의 구조를 형성하고 이 구조의 다양한 요소 간의 관계를 정의하도록 설계된 태그라고 하는 특수 명령 세트입니다. 즉, 마크업은 문서의 어느 부분이 제목인지, 어떤 부분이 부제인지, 저자의 이름은 무엇으로 간주해야 하는지 등을 알려줍니다. 마크업은 스타일적 마크업, 구조적 마크업, 의미적 마크업으로 나누어집니다. 스타일 마크업

스타일 마크업은 문서의 모양을 담당합니다. 예를 들어 HTML에서 이러한 유형의 마크업에는 다음과 같은 태그가 포함됩니다. (이탤릭체), (굵은체), (밑줄), (취소선 텍스트) 등

구조적 표시

구조적 마크업은 문서의 구조를 정의합니다. 예를 들어 HTML에서는 태그(단락), (제목), (섹션) 등이 이러한 유형의 마크업을 담당합니다.

의미적 마크업

의미론적 마크업은 데이터의 내용을 알려줍니다. 이러한 유형의 마크업의 예로는 태그(문서 이름), (코드, 코드 목록에 사용됨), (변수), (저자 주소)가 있습니다.

모든 마크업 언어의 기본 개념은 태그, 요소 및 속성입니다.

태그 및 요소.

태그와 요소의 의미는 종종 혼동됩니다.

태그 또는 컨트롤 설명자는 태그 내용으로 수행할 작업에 대한 클라이언트측 문서 내용을 표시하는 프로그램에 대한 지침 역할을 합니다. 문서의 주요 내용과 관련하여 태그를 강조 표시하기 위해 꺾쇠 괄호가 사용됩니다. 태그는 미만 기호()로 시작하며 그 안에 지침 이름과 해당 매개변수가 배치됩니다. 예를 들어 HTML에서는 태그가 뒤에 오는 텍스트가 기울임꼴로 표시되어야 함을 나타냅니다.

요소는 콘텐츠와 함께 태그입니다. 다음 구성은 요소의 예입니다.

이 텍스트는 이탤릭체로 되어 있습니다. .

요소는 여는 태그로 구성됩니다(이 예에서는 태그입니다). ), 태그 콘텐츠(예에서는 "이탤릭체로 표시된 텍스트입니다.") 및 닫는 태그(), HTML에서는 때때로 닫는 태그를 생략할 수 있습니다.

속성

요소를 정의할 때 이 요소의 특성을 명확하게 하는 매개변수를 설정하기 위해 속성이 사용됩니다.

속성은 시작 태그에서 요소를 정의할 때 지정할 수 있는 이름 = 값 쌍으로 구성됩니다. 등호 기호의 왼쪽과 오른쪽에 공백을 둘 수 있습니다. 속성 값은 작은따옴표나 큰따옴표로 묶인 문자열로 지정됩니다.

해당 속성이 정의된 경우 모든 태그는 해당 속성을 가질 수 있습니다.

속성이 사용되면 요소는 다음 형식을 취합니다.

태그 내용

텍스트가 중앙에 정렬됩니다.

하나의 여는 태그에는 여러 속성이 포함될 수 있습니다. 예를 들면 다음과 같습니다.

지정된 텍스트 크기 및 색상

마크업 언어 개발의 역사

하이퍼텍스트의 개념은 1945년 W. Bush에 의해 도입되었으며, 60년대부터 하이퍼텍스트 데이터를 활용한 최초의 응용이 등장하기 시작했습니다. 그러나 이 기술은 여러 정보 리소스를 결합하여 비선형 텍스트를 생성하고 볼 수 있는 기능을 제공하는 메커니즘이 실제로 필요했을 때 주요 개발되었습니다.

1986년에 ISO는 표준화된 일반화 마크업 언어를 승인했습니다. 이 언어는 다른 마크업 언어를 생성하기 위한 것이며 유효한 태그 세트, 해당 속성 및 문서의 내부 구조를 정의합니다. 따라서 문서의 내용과 관련된 자신만의 태그를 생성하는 것이 가능합니다. 이제 이러한 문서는 DTD(문서 유형 정의)에 저장된 마크업 언어 정의 없이 해석하기 어렵다는 것이 분명해졌습니다. DTD는 SGML 표준의 모든 언어 규칙을 그룹화합니다. 즉, DTD는 태그 간의 관계와 태그 사용 규칙을 설명합니다. 또한 각 문서 클래스에 대해 해당 마크업 언어의 문법을 설명하는 자체 규칙 세트가 정의됩니다. 따라서 DTD의 도움을 통해서만 태그의 올바른 사용을 확인할 수 있으므로 태그를 SGML 문서와 함께 보내거나 문서에 포함해야 합니다.

당시에는 SGML 외에도 여러 유사한 언어가 서로 경쟁하고 있었지만 인기(그 후손 중 하나인 HTML)로 인해 SGML은 부인할 수 없는 우위를 점하게 되었습니다.

SGML을 사용하면 구조화된 데이터를 설명하고, 문서에 포함된 정보를 구성하고, 이 정보를 표준화된 형식으로 표시할 수 있습니다. 그러나 복잡성으로 인해 SGML은 주로 다른 언어의 구문을 설명하는 데 사용되었으며 SGML 문서를 직접 사용하는 응용 프로그램은 거의 없었습니다. SGML은 일반적으로 대규모 프로젝트에서만 사용됩니다(예: 대기업을 위한 통합 문서 관리 시스템 생성).

HTML 마크업 언어는 SGML보다 훨씬 간단하고 편리합니다. HTML 마크업 언어의 지침은 주로 화면에 문서 내용을 표시하는 프로세스를 제어하기 위한 것입니다. 기술 문서를 마크업하는 방법인 HTML은 1991년 Tim Berners-Lee가 특별히 과학계를 위해 만들었습니다. 원래는 SGML 애플리케이션 중 하나였습니다.

HTML이 할 수 있는 유일한 일은 문서의 일부를 분류하고 브라우저에 올바르게 표시되도록 하는 것이라는 사실에도 불구하고 HTML은 가장 널리 사용되는 마크업 언어입니다. HTML은 배우기가 매우 쉽기 때문입니다. 당신이 해야 할 일은 HTML 명령을 배우는 것 뿐입니다. HTML용 DTD는 브라우저에 저장됩니다. 또한 HTML은 다양한 플랫폼에서 작동하도록 설계되었습니다. 그러나 여기에는 여러 가지 중요한 제한 사항이 있습니다.

  • HTML에는 고정된 태그 세트가 있으며 이 세트는 확장하거나 변경할 수 없습니다.
  • HTML 언어 태그는 데이터가 표시되는 방식, 즉 문서의 모양만 표시합니다. HTML은 태그에 포함된 내용의 의미나 문서 구조에 대한 정보를 전달하지 않습니다.
  • 1998년 2월 초, 국제기구 W3C는 XML 표준을 기반으로 인터넷을 통해 정보를 전송하기 위한 많은 새로운 마크업 언어 개발의 시작을 알리는 XML(Extensible Markup Language) 1.0 사양을 승인했습니다. 본질적으로 이는 하이퍼텍스트 마크업 언어 개발의 새로운 단계를 의미했습니다. 4년 동안 XML은 일반 사용자와 많은 웹 디자이너 모두로부터 많은 관심을 받았을 뿐만 아니라 인터넷의 필수적인 부분이 되었습니다. 오늘날 이 기술을 어느 정도 HTML과 유사하게 사용하지 않는 서버는 거의 없습니다. 그러나 이제 XML이 글로벌 네트워크를 통해 하이퍼텍스트를 전송하는 주요 방법이 되었다고 말하기는 아직 이르다. 언어 자체는 아직 초기 단계이고 일부 요소는 아직 개발 중입니다. 지금까지는 미래에 HTML을 대체할 일반적인 프레임워크만 만들어졌지만 어떤 구체적인 형식이 될지는 아직 말할 수 없습니다.

    처음부터

    1990년 11월, 인터넷 사용자들이 세 글자만으로 이름을 쉽게 표현할 수 있는 새로운 기술에 대해 처음 들었을 때, 시간이 거의 지나지 않을 것이며 이 기술이 사실상 정보를 전송하는 유일한 방법이 될 것이라고는 거의 누구도 상상할 수 없었습니다. 글로벌 네트워크. 오늘날 경험이 부족한 많은 사용자에게 인터넷이라는 단어는 WWW와 밀접하게 연관되어 있지만 실제로 이러한 것들은 서로 관련되어 있지만 여전히 약간 다릅니다.

    전반적으로 문서의 하이퍼텍스트 마크업 구조에 대한 관심이 극도로 높아진 이유는 World Wide Web과 그 핵심 부분인 HTML의 놀라운 인기 때문이었습니다.

    하이퍼텍스트의 개념은 1945년 V. Bush에 의해 처음 소개되었습니다. 그러나 이러한 데이터 구조를 사용하는 실제 응용 프로그램은 60년대부터 사용되기 시작했으며 이 기술을 중심으로 한 활동의 ​​놀라운 급증은 여러 정보 리소스를 결합하여 생성 및 생성 기능을 제공하는 메커니즘이 실제로 필요했을 때만 시작되었습니다. 비선형 텍스트를 봅니다. 그리고 이 메커니즘의 구현 예는 바로 동일한 WWW였습니다.

    문서 마크업 언어 자체는 문서에 구조를 생성하고 이 구조의 다양한 요소 간의 관계를 각각 정의하도록 설계된 태그(일부 번역된 출판물에서는 태그를 바로가기라고 함)라고 하는 특수 명령 집합입니다. 마크업 언어 태그 또는 컨트롤 설명자는 매우 특정한 방식으로 해당 문서에서 인코딩되어 문서의 주요 내용을 기준으로 할당된 다음 내용을 해석하고 표시하는 프로그램에 대한 지침 역할을 합니다. 실제로 문서를 보는 사람에게 인터넷으로 비유를 찾으려고 하면 이 사람이 클라이언트이고 가장 일반적인 경우 통역사 프로그램은 브라우저입니다. 이미 최초의 시스템에서는 "" 기호를 사용하여 이러한 명령을 지정하기로 결정했으며 그 안에 명령 이름과 해당 매개 변수가 배치되었습니다. 오늘날 이러한 태그 이름 지정 방법은 일반적으로 허용되는 표준입니다.

    현대 정보 시스템에서 텍스트 문서의 하이퍼텍스트 분석을 사용하는 것은 하이퍼텍스트를 통해 소위 비선형 정보 보기 메커니즘을 만들 수 있다는 사실에 크게 기인합니다. 이는 시스템에서 데이터가 텍스트 구조의 연속적인 스트림으로 표시되는 것이 아니라 하이퍼링크를 사용하여 탐색되는 상호 연결된 구성 요소 집합으로 표시됨을 의미합니다.

    오늘날 가장 인기 있고 잘 알려진 하이퍼텍스트 마크업 언어인 HTML은 인터넷에 있는 정보를 구조화하고 전송하기 위해 특별히 만들어졌으며 의심할 여지 없이 WWW 기술의 핵심 구성 요소입니다. 하이퍼텍스트 문서 모델을 사용함으로써 네트워크상의 다양한 정보 자원을 표시하는 방식이 더욱 질서정연해졌으며 사용자는 필요한 정보를 검색하고 볼 수 있는 편리한 메커니즘을 갖게 되었습니다. 그러나 이 문제의 첫 번째 기호는 여전히 훨씬 오래된 언어인 SGML로 간주됩니다.

    SGML(Standard Generalized Markup Language)은 텍스트 정보를 전자 형식으로 표현하기 위한 입출력 장치 및 환경 독립적인 방법을 설명하기 위한 국제 표준(ISO 8879:1986)으로 1986년에 공식적으로 채택되었습니다. 생성의 기초는 최초의 개인용 컴퓨터 시대에 IBM이 개발한 다소 오래된 마크업 언어 GML(Generalized Markup Language)이었습니다. 정확히 말하면 SGML은 다른 마크업 언어를 설명하기 위해 설계된 메타언어입니다.

    원래 마크업이라는 단어는 일반적으로 문서 작성자 또는 "레이아웃 디자이너"라고도 불리는 특정 구절을 정확히 어떻게 입력해야 하는지를 지시하기 위한 텍스트 내의 주석이나 기타 표시를 설명하는 데 사용되었습니다. 이러한 방법에는 기울임꼴을 표시하기 위한 구불구불한 밑줄, 특정 문구를 건너뛰거나 특정 글꼴로 인쇄하기 위한 일부 특수 아이콘 등이 포함될 수 있습니다. 시간이 지나면서 서식 지정 및 인쇄가 자동화되면서 이 용어에는 서식, 인쇄 또는 기타 처리를 제어하기 위해 전자 텍스트 문서에 삽입된 모든 종류의 특수 마크업 코드가 포함되었습니다.

    따라서 마크업 언어는 텍스트 블록을 인코딩하는 데 사용되는 형식 지정 규칙 집합을 나타냅니다. 마크업 언어는 특정 문서에서 어떤 마크업이 허용되는지, 어떤 마크업이 필요한지, 해당 요소를 일반 텍스트와 구별하는 방법, 마크업의 의미를 명확하게 나타내야 합니다. SGML은 처음 세 가지 문제를 해결할 수 있었고, 마지막 문제에 대한 해결책에는 비공식적인 설명이 필요했습니다.

    SGML은 이를 기반으로 만들어진 다른 모든 마크업 언어와 달리 절차적 마크업 대신 소위 설명적 마크업 원칙을 사용합니다. 이러한 시스템은 문서의 개별 부분을 특정 범주에 할당하기 위해 단순히 이름을 제공하는 마크업 요소를 사용합니다. 즉, Or \end(list)와 같은 태그는 단순히 문서의 일부를 식별하고 "이 부분은 단락입니다" 또는 "이 부분은 시작된 목록의 끝입니다" 등을 명시합니다. 절차적 마크업을 사용하는 시스템(예: Microsoft Word와 같은 워드 프로세서 포함)은 텍스트 문서의 특정 지점에서 어떤 종류의 처리가 수행될지 결정합니다. e 및 z” 또는 “문서의 테두리를 요소를 기준으로 오른쪽으로 7mm 이동하고, 한 줄을 건너뛰고, 빨간색 선에서 다음 줄을 시작하는 등의 작업을 수행합니다. SGML에서는 특정 목적(예: 서식 지정)을 위해 문서를 처리하는 데 필요한 지침이 문서 내에서 발생하는 설명 마크업과 명확하게 구분됩니다. 일반적으로 별도의 절차나 프로그램을 통해 문서 외부에서 수집됩니다.

    절차적 마크업이 아닌 설명적 마크업을 사용하면 동일한 문서를 다른 프로그램에서 처리할 수 있으며, 각 프로그램은 중요하다고 간주되는 부분에 자체 처리 지침을 적용할 수 있습니다. 예를 들어, 콘텐츠 구문 분석 프로그램은 각주를 완전히 무시할 수 있지만 서식 지정 프로그램은 각 부분의 끝 부분에 인쇄하기 위해 각주를 추출하고 조합할 수 있습니다. 다양한 종류의 처리 명령이 파일의 동일한 부분과 연관될 수 있습니다. 예를 들어, 한 프로그램은 문서에서 사람의 이름과 장소 이름을 추출하여 색인이나 데이터베이스를 만드는 반면, 동일한 텍스트를 처리하는 다른 프로그램은 이름을 다른 글꼴로 인쇄할 수 있습니다.

    SGML은 또한 문서 유형의 개념과 이를 정의하는 방법(문서 유형 정의, DTD)을 도입합니다. 문서는 다른 컴퓨터 처리 개체와 마찬가지로 입력된 것으로 간주됩니다. 문서의 유형은 구성 부분과 구조에 따라 공식적으로 결정됩니다. 예를 들어, 제목과 저자 이름, 그 뒤에 초록과 하나 이상의 단락 순서로 구성되도록 문서 유형을 정의할 수 있습니다. 이 공식적인 정의에 따르면 제목이 없는 문서는 보고서가 아닙니다. 문서가 인간의 관점에서 아무리 보고서와 유사하더라도 초록이 뒤따르는 일련의 단락과 마찬가지로 보고서가 아닙니다. 독자. .

    문서는 알려진 유형이므로 파서라는 특수 프로그램을 사용하여 특정 유형이라고 주장하는 문서를 처리하고 해당 문서 유형에 필요한 모든 요소가 올바른 순서로 정확하게 존재하고 발견되었는지 확인할 수 있습니다. 구조화. 더 중요한 점은 동일한 유형의 다양한 문서를 동일한 방식으로 처리할 수 있다는 것입니다. 문서의 정보 구조에 포함된 지식을 사용하는 프로그램을 작성하는 것이 가능하므로 더욱 지능적일 수 있습니다.

    SGML은 메타언어로서 특정 애플리케이션을 대상으로 하는 특정 언어(흔히 "SGML 애플리케이션"이라고 함) 정의를 허용합니다. 이에 대한 예는 WWW에서 널리 사용되는 HTML 언어입니다. 이러한 각 언어는 요소와 해당 속성을 정의하는 DTD 형식으로 설명됩니다. 이러한 DTD가 제공되면 SGML 소프트웨어는 해당 DTD에 따라 작성된 문서를 올바르게 처리할 수 있습니다.

    프로젝트에서도 이 언어는 현재 우리가 가지고 있는 글로벌 네트워크로의 정보 전송 모델을 구현하기 위해 특별히 고안되었습니다. 즉, HTML은 인터넷의 산물입니다. 실제로 HTML은 지난 세기 80년대에 ISO에서 표준으로 승인된 Standard Generalized Markup Language(Standard Generalized Markup Language)인 SGML(Standard Generalized Markup Language)의 단순화된 버전입니다. SGTML은 순수한 형태의 언어가 아니라 다른 언어를 생성하기 위한 몇 가지 규칙과 설명의 집합입니다. 이는 유효한 태그 집합, 해당 속성 및 문서의 내부 구조를 정의합니다. 설명자의 올바른 사용에 대한 제어는 문서를 구문 분석할 때 클라이언트 해석기 프로그램에서 사용하는 DTD 설명이라는 특수 규칙 세트를 사용하여 수행됩니다. 각 문서 클래스에 대해 해당 마크업 언어의 문법을 설명하는 자체 규칙 세트가 정의됩니다. SGML을 사용하면 문서에 포함된 정보를 구성하고, 구조화된 데이터를 설명하고, 나중에 사용할 수 있도록 이 정보를 표준화된 형식으로 표시할 수 있습니다. 그러나 일부 복잡성으로 인해 SGML은 주로 다른 언어(가장 유명한 것은 HTML)의 구문을 설명하는 데 사용되었으며 SGML 문서를 직접 작업하는 응용 프로그램은 거의 없습니다.

    HTML은 SGML보다 훨씬 편리하고 사용하기 쉬운 언어입니다. 이를 기반으로 추가 언어를 정의하는 것은 허용되지 않습니다. HTML을 사용하려면 상당히 제한된 지침이나 태그 세트로 정의된 표준에 따라 문서를 마크업해야 합니다. 이러한 명령은 우선 클라이언트 프로그램 화면에 문서의 내용을 표시하는 프로세스를 제어하여 문서 표시 방법을 결정하지만 전체 구조는 결정하지 않습니다. 대부분의 경우 HTML 데이터는 http 프로토콜을 사용하여 네트워크를 통해 쉽게 전송할 수 있는 일반 텍스트 파일로 표시됩니다.

    그러나 시간이 지남에 따라 대중적인 기술에 대한 요구가 점점 더 엄격해짐에 따라 최신 응용 프로그램에는 클라이언트 화면에 데이터를 표시하기 위한 언어뿐만 아니라 문서의 구조를 결정하고 포함된 요소를 설명할 수 있는 메커니즘도 필요합니다. . HTML에는 간단한 명령 세트가 있으며 텍스트 정보를 설명하고 이를 보기 프로그램(브라우저)의 화면에 표시하는 작업에 매우 성공적으로 대처합니다. 그러나 표시된 데이터 자체는 서식 지정에 사용되는 태그와 전혀 관련이 없으므로 구문 분석 프로그램에는 HTML 태그를 사용하여 필요한 문서 조각을 찾는 기능이 없습니다. 저것들. 예를 들어 다음과 같은 설명을 접한 경우

    장미

    뷰어는 태그 내에 포함된 텍스트를 어떤 색상으로 표시할지 알 수 있으며 정확하게 표시할 가능성이 높습니다. 그러나 문서에서 이 태그가 발견된 위치, 현재 조각이 포함된 다른 태그가 무엇인지, 여부와는 완전히 무관합니다. 객체 간의 관계가 올바르게 구성되었는지 여부에 따라 조각이 중첩되어 있습니다. 문서 구조에 대한 이러한 "무관심"은 내부 정보를 검색하거나 분석하는 것이 요소로 나누어지지 않은 연속 텍스트 파일로 작업하는 것과 다르지 않다는 사실로 이어집니다. 아시다시피 이것은 정보를 다루는 가장 효과적인 방법이 아닙니다.

    HTML로 구현된 아이디어 자체의 또 다른 중요한 단점은 제한된 태그 세트입니다. HTML에 대한 DTD 규칙은 고정된 설명자 세트를 정의하므로 개발자는 자신의 특수 태그를 입력할 기회가 없습니다. 새로운 언어 확장이 때때로 등장하지만(현재 HTML의 최신 버전은 HTML 4.0임) 표준화를 향한 긴 여정과 주요 브라우저 제조업체 간의 끊임없는 불일치로 인해 언어를 신속하게 적용하는 것이 거의 불가능합니다. 특수한 정보(예: 멀티미디어, 수학, 화학식 등)를 표시합니다.

    지금까지 말한 모든 내용을 요약하면 오늘날 HTML은 이러한 종류의 언어에 대해 현대 개발자가 부과한 요구 사항을 완전히 충족하지 못한다고 주장할 수 있습니다. 그리고 이를 대체하기 위해 강력하고 유연하며 동시에 편리한 XML 언어인 새로운 하이퍼텍스트 마크업 언어가 제안되었습니다.

    XML(Extensible Markup Language)은 XML 문서라고 불리는 데이터 개체의 전체 클래스를 설명하는 마크업 언어입니다. 이 언어는 다른 언어의 문법을 설명하고 문서의 정확성을 제어하는 ​​수단으로 사용됩니다. 저것들. XML 자체에는 마크업용 태그가 포함되어 있지 않으며 단순히 태그가 생성되는 순서만 정의합니다. 따라서 예를 들어 문서에서 장미 요소를 나타내기 위해 태그를 사용해야 한다고 생각하는 경우 XML을 사용하면 정의한 태그를 자유롭게 사용할 수 있으며 문서에 다음과 같은 조각을 포함할 수 있습니다.

    장미

    태그 세트는 쉽게 확장될 수 있습니다. 예를 들어, 꽃에 대한 설명이 꽃이 피는 온실 설명 안에 의미 있게 들어가야 한다는 점을 나타내려면 새 태그를 설정하고 표시되는 순서를 선택하기만 하면 됩니다.

    장미

    여기에 꽃을 몇 개 더 심고 싶다면 다음과 같이 변경해야 합니다.

    장미

    튤립

    선인장

    보시다시피, XML 문서를 생성하는 과정은 매우 간단하며 HTML에 대한 기본 지식과 XML을 마크업 언어로 사용하여 수행하려는 작업에 대한 이해만 있으면 됩니다. 이를 통해 개발자는 문서에 포함된 데이터를 가장 효과적으로 정의할 수 있는 사용자 정의 명령을 정의할 수 있는 고유한 기능을 얻을 수 있습니다. 문서 작성자는 구조를 만들고, 요구 사항을 충족하는 명령을 사용하여 요소 간에 필요한 연결을 구축하고, 문서 보기, 검색 및 분석 작업을 수행하는 데 필요한 마크업 유형을 달성합니다.

    XML의 또 다른 확실한 이점은 XML을 정보 저장소에 대한 범용 쿼리 언어로 사용할 수 있다는 것입니다. 현재 W3C의 심층에서는 XML-QL(또는 XQL) 표준의 작업 버전이 고려되고 있으며, 이는 향후 SQL의 심각한 경쟁자가 될 수 있습니다. 또한 XML 문서는 정보를 구문 분석하고 이를 클라이언트 측에 표시하는 수단을 모두 포함하는 데이터를 저장하는 고유한 방법으로 작동할 수 있습니다. 이 분야에서 유망한 분야 중 하나는 Java와 XML 기술의 통합으로, 정보 교환을 위해 범용 데이터 형식을 사용하는 시스템 독립적인 애플리케이션을 구축할 때 두 기술의 강력한 기능을 모두 사용할 수 있게 해줍니다.

    또한 XML을 사용하면 문서에 저장된 데이터의 정확성을 제어하고, 문서 내 계층적 관계를 확인하고, 다양한 데이터 내용이 포함될 수 있는 문서 구조에 대한 통일된 표준을 설정할 수 있습니다. 이는 동일한 시스템에서 실행되는 서로 다른 애플리케이션 간의 정보 교환 문제가 매우 중요한 복잡한 정보 시스템을 구축할 때 사용할 수 있음을 의미합니다. 관리자는 프로젝트 작업 초기에 정보 교환 메커니즘을 위한 구조를 생성함으로써 향후 시스템의 다양한 구성 요소에서 사용되는 데이터 형식의 비호환성과 관련된 많은 문제로부터 자신을 구할 수 있습니다.

    또한 XML의 장점 중 하나는 XML 문서 처리 프로그램이 간단하다는 점이며, 오늘날에는 XML 문서와 함께 작동하도록 설계된 모든 종류의 소프트웨어 제품이 자유롭게 배포됩니다. XML은 현재 버전 4.0부터 Microsoft Internet Explorer 제품군의 모든 브라우저에서 지원됩니다. Netscape Communicator, Oracle DBMS, DB-2 및 MS-Office 애플리케이션의 후속 버전에서 지원될 것이라고 발표되었습니다. 이 모든 것은 가까운 미래에 XML이 정보 시스템의 주요 정보 교환 언어가 되어 HTML을 대체할 것이라고 가정할 이유를 제공합니다. SMIL, CDF, MathML, XSL과 같은 잘 알려진 전문 마크업 언어는 이미 XML을 기반으로 작성되었으며 W3C에서 고려 중인 새로운 언어의 작업 초안 목록은 지속적으로 늘어나고 있습니다.

    XML 문서는 어떤 모습인가요?

    HTML에 익숙하다면 XML을 배우는 데 많은 노력이 필요하지 않습니다. XML은 확실히 기능과 의도가 HyperText Markup Language와 매우 다르지만 두 언어 모두 SGML의 하위 집합이므로 기본 원칙을 상속합니다.

    문서 구조

    간단한 XML 문서는 예제 1과 같습니다.

    첫 번째

    두 번째 호 1

    제삼

    마지막

    이 문서는 일반 HTML 페이지와 매우 유사합니다. HTML과 마찬가지로 꺾쇠 괄호로 묶인 명령을 태그라고 하며 문서 본문을 마크업하는 역할을 합니다. XML에는 여는 태그, 닫는 태그, 빈 태그가 있습니다(HTML에도 빈 태그의 개념이 있지만 특별한 지정이 필요하지 않습니다).

    XML 문서의 본문은 마크업 요소와 문서의 실제 콘텐츠인 데이터(콘텐츠)로 구성됩니다. XML 태그는 문서 요소, 해당 속성 및 기타 언어 구성을 정의하도록 설계되었습니다. 문서에 사용되는 마크업 유형에 대해서는 나중에 자세히 설명하겠습니다.

    모든 XML 문서는 항상 명령어로 시작해야 하며, 그 안에는 언어 버전 번호, 코드 페이지 번호 및 파서 프로그램이 문서를 구문 분석하는 데 필요한 기타 매개 변수를 지정할 수도 있습니다.

    XML 문서 작성 규칙

    일반적으로 XML 문서는 다음 요구 사항을 충족해야 합니다.

    문서 헤더에는 문서의 마크업 언어, 버전 번호 및 추가 정보를 지정하는 XML 선언이 포함되어 있습니다.

    문서의 일부 데이터 영역을 정의하는 각 여는 태그에는 자체 닫는 "파트너"가 있어야 합니다. 즉, HTML과 달리 닫는 태그를 생략할 수 없습니다.

    XML은 대소문자를 구분합니다.

    태그 정의에 사용되는 모든 속성 값은 따옴표로 묶어야 합니다.

    XML에서 태그 중첩은 엄격하게 제어되므로 태그 열기 및 닫기 순서를 모니터링해야 합니다.

    시작 태그와 끝 태그 사이의 모든 정보는 XML의 데이터로 처리되므로 모든 서식 지정 문자가 고려됩니다(즉, 공백, 줄 바꿈, 탭은 HTML에서처럼 무시되지 않습니다).

    XML 문서가 위의 규칙을 위반하지 않으면 형식적으로 올바른 문서라고 하며 XML 문서를 구문 분석하도록 설계된 모든 분석기는 해당 문서를 올바르게 사용할 수 있습니다.

    그러나 문서에는 언어 문법의 공식적인 준수 여부를 확인하는 것 외에도 문서 내용, 요소 간의 필수 관계를 결정하고 문서 구조를 형성하는 규칙 준수에 대한 제어 수단이 포함될 수 있습니다. 예를 들어, 다음 텍스트는 완벽하게 유효한 XML 문서이기는 하지만 전혀 의미가 없습니다.

    러시아 노보시비르스크

    XML 문서의 정확성을 확인하려면 이러한 확인을 수행하는 검증자라고 불리는 분석기를 사용해야 합니다.

    오늘날 XML 문서의 정확성을 제어하는 ​​두 가지 주요 방법은 DTD 정의(문서 유형 정의)와 데이터 스키마(의미 체계)입니다. 다음 시간에는 DTD와 스키마 사용에 대해 자세히 설명하겠습니다. SGML과 달리 XML에서 DTD 규칙을 정의할 필요가 없으며 이러한 상황을 통해 다소 복잡한 DTD 구문에 대해 고민하지 않고도 XML 문서를 만들 수 있습니다.

    기본 원리

    요소는 XML 문서의 기본 구조 단위입니다. 태그에 rose라는 단어를 포함함으로써 내용이 rose인 비어 있지 않은 요소인 을 정의합니다. 일반적인 경우 요소의 내용은 단순히 일부 텍스트이거나 기타 중첩된 문서 요소, CDATA 섹션, 처리 지침, 주석일 수 있습니다. XML 문서의 거의 모든 부분.

    비어 있지 않은 요소는 시작 태그, 종료 태그, 그리고 그 사이에 포함된 데이터로 구성되어야 합니다.

    문서에 포함된 모든 요소 집합은 문서의 구조를 정의하고 모든 계층 관계를 결정합니다. 요소를 사용하면 플랫 데이터 모델이 요소 간에 가능한 많은 관계가 있는 복잡한 계층적 시스템으로 변환됩니다.

    나중에 문서를 검색할 때 클라이언트 프로그램은 문서의 요소를 사용하여 해당 구조에 포함된 정보에 의존합니다. 저것들. 예를 들어, 올바른 도시에서 올바른 대학을 찾으려면 특정 요소 내부에 있는 특정 요소의 콘텐츠를 확인해야 합니다. 이 경우 검색은 당연히 전체 문서에서 원하는 순서를 찾는 것보다 훨씬 더 효과적입니다.

    XML 문서에서는 일반적으로 루트라고 하는 하나 이상의 요소가 정의되고 파서는 이 요소에서 문서 검색을 시작합니다. 위의 예에서 이 요소는 입니다.

    어떤 경우에는 태그가 문서의 특정 부분의 의미를 변경하고 명확하게 하여 동일한 정보를 다양한 방식으로 정의함으로써 이 문서를 분석하는 애플리케이션에 설명된 데이터의 사용 컨텍스트에 대한 정보를 제공할 수 있습니다. 예를 들어, Holliwood 단편을 읽은 후 문서의 이 부분이 도시에 관한 것이라고 추측할 수 있지만 Holliwood 단편에서는 식당에 관한 것입니다.

    결론

    웹 페이지 형식 지정 언어 HTML은 원래 SGML의 응용 프로그램으로 도입되었습니다. 나중에 WWW의 급속한 발전과 함께 HTML은 작성자가 정보의 외부 표현을 더 잘 제어할 수 있도록 하기 위해 가능한 모든 방법으로 확장되기 시작했습니다. 또는 등의 새로운 요소와 속성은 시각적 형식에 중점을 둡니다. 마크업 언어 자체에 속하지 않는 도구(이미지맵, Java 및 JavaScript, 플러그인 등)가 등장하여 적극적으로 사용되기 시작했습니다. 특정 브라우저에서만 지원되거나 브라우저마다 다르게 작동하는 HTML 요소도 많이 있습니다. 따라서 이제 HTML이 SGML 애플리케이션인지 여부를 말하기가 어렵습니다. HTML 사양과 해당 DTD에 따라 생성되는 페이지는 거의 없습니다.

    이 문제는 부분적으로 W3 컨소시엄에서 채택한 표준인 계단식 스타일을 통해 완화하기 위한 것입니다. CSS1은 요소의 마크업에서 요소의 시각적 모양을 정의하는 스타일을 분리합니다.

    가장 큰 관심을 끄는 것은 웹 페이지의 마크업 언어로서 HTML을 대체할 것으로 예상되는 XML 언어입니다. 이것은 주로 WWW에서의 사용을 목표로 하는 SGML의 변형입니다. DTD가 필요하지 않으며, 복잡한 구조를 거의 사용하지 않기 때문에 언어 자체가 단순화됩니다. 이렇게 하면 파서를 단순하게 만들어 브라우저에서 XML을 적극적으로 사용할 수 있게 됩니다. (브라우저 분야의 두 주요 플레이어가 XML에 대해 고개를 끄덕이는 점을 고려하면 그럴 가능성은 상당히 높습니다.)


    인쇄 가능한 버전>>
    기사 읽기:한 번.

    (Standard Generalized Markup Language), ISO 8879 표준에 제시됨 이 언어는 대화형 전자 기술 매뉴얼을 포함한 기술 문서 설계의 주요 언어로 채택됩니다. CALS 기술을 사용하여 제작된 제품의 경우.

    SGML은 문서의 구조를 일련의 데이터 객체로 정의합니다. 문서의 일부를 나타내는 데이터 개체는 다른 파일에 저장될 수 있습니다. SGML 표준은 다양한 시스템이 정보를 올바르게 인식하고 식별할 수 있도록 정보를 표시하기 위한 일련의 기호 및 규칙을 설정합니다. 이러한 세트는 DTD 선언이라는 문서의 별도 부분에 설명되어 있습니다.(문서 유형 정의), 이는 기본 SGML 문서와 함께 전송됩니다. DTD는 문자와 해당 코드의 대응, 사용된 식별자의 최대 길이, 태그 구분 기호가 표시되는 방식, 기타 가능한 규칙, DTD 구문, 문서 유형 및 버전을 지정합니다. 따라서 SGML은 특정 마크업 언어 계열에 대한 메타언어라고 할 수 있습니다. 특히 XML 마크업 언어는 SGML의 하위 집합으로 간주될 수 있습니다.그리고 HTML.

    SGML 문서 형식의 기술 설명에는 다음이 포함됩니다.

    • SGML 태그가 표시된 기술 매뉴얼이 포함된 기본 파일;
    • 엔터티 설명, 문서가 동일한 개체가 사용되고 해당 지식이 암시되는 그룹에 속하는 경우;
    • SGML 태그를 설명하는 사전;

    그러나 SGML은 배우고 사용하기가 어렵습니다. 따라서 WWW에 제출된 문서에 마크업을 널리 사용하기 위해- 기술, 1991년 SGML을 기반으로 단순화된 HTML 언어가 개발되었습니다.(HyperText Markup Language) 및 1996년에는 XML 언어(eXtensible Markup Language)은 HTML과 결합하여 다양한 애플리케이션에서 문서를 표현하는 주요 언어가 됩니다.

    HTML 언어는 WWW 기술로 제공되는 문서에서 마크업을 널리 사용하기 위해 개발되었습니다.

    HTML 설명은 ASCII 텍스트와 여기에 포함된 설명자 또는 태그라고도 하는 일련의 명령(제어 코드)으로 구성됩니다. 이 텍스트를 HTML 문서 또는 HTML 페이지라고 부르며, 웹 서버에 게시된 경우에는 웹 페이지라고 합니다.. 태그는 소스 텍스트의 올바른 위치에 배치되며 글꼴, 하이픈, 그래픽 모양, 링크 등을 결정합니다. WWW 편집기를 사용할 때 해당 키를 누르기만 하면 명령이 삽입됩니다.

    HTML과 마찬가지로 XML은 SGML의 하위 집합으로 간주됩니다. 현재 XML 언어는 정보기술 분야의 주요 문서 표현 언어를 자처하고 있으며, 다양한 애플리케이션에서 전용 마크업 언어를 생성하기 위한 기반이 되는 메타언어라고 볼 수 있다. 동시에 XML은 SGML보다 더 편리합니다. 이는 XML에서 SGML의 일부 사소한 기능을 제거함으로써 보장됩니다. XML의 설명은 이해하기 쉽고 최신 브라우저에서 사용하도록 조정되었습니다. SGML의 핵심 기능을 유지하면서.

    특정 애플리케이션의 경우 XML 사전 또는 XML 애플리케이션이라는 자체 버전의 XML이 생성됩니다. 따라서 특정 수학 기호를 사용하여 텍스트를 설명하기 위해 XML 애플리케이션 OSD(Open Software Description)가 개발되었습니다. CALS가 관심을 갖는 부분은 데이터 교환 전용 PDX(Product Definition eXchange) 옵션입니다. 화학(CML - Chemical Markup Language), 생물학(BSML - Bioinformatic Sequence Markup Language) 등에 대한 잘 알려진 사전이 있습니다.

    모든 문서에는 세 가지 구성 요소가 있습니다.

    · 구조;

    내용은 문서에 표시되는 정보입니다. 종이 문서의 내용은 순전히 텍스트일 수도 있고 이미지를 포함할 수도 있습니다. 문서가 전자 형식으로 제공되는 경우 멀티미디어 데이터와 다른 문서에 대한 링크가 포함될 수 있습니다. 문서의 내용은 다양하지만 책, 기차표 등 유형으로 분류할 수 있습니다.

    문서의 스타일은 해당 내용이 특정 장치(예: 프린터 또는 디스플레이)에 표시되는 형식을 결정합니다. 스타일 개념에는 전체 출력 문서 또는 개별 블록의 글꼴 특성(이름, 크기, 색상), 페이지 매김 순서, 페이지의 블록 위치 및 기타 매개변수가 포함됩니다. 동일한 문서를 다른 미디어와 동일한 미디어에서 다른 스타일로 출력할 수 있습니다.

    문서 마크업 언어는 문서의 구조와 그 구조의 다양한 개체 간의 관계를 설명하도록 설계된 인공 언어입니다. 마크업 데이터는 메타데이터라고도 합니다.

    첫 번째 마크업 언어는 지난 세기 60년대 IBM 직원이 개발한 GML(Generalized Markup Language)입니다. 바로 후속 언어는 문서 마크업 요소 기록 규칙을 정의하는 SGML(Standard Generalized Markup Language) 언어였습니다. 언어의 규칙을 따르는 문서를 SGML 문서라고 합니다.

    SGML 언어는 문서 마크업 언어에 대한 다음과 같은 기본 요구 사항을 지정하는 ISO 8879 표준에 정의되어 있습니다.

    · 언어는 사람이 읽을 수 있어야 합니다.

    · 마크업된 문서 파일은 텍스트여야 하며 ASCII 코드 문자(정보 교환을 위한 미국 표준 코드)를 사용하여 인코딩되어야 합니다. 그러나 문서의 내용이 ASCII로 인코딩되거나 텍스트일 필요는 없습니다.

    SGML 및 유사한 언어는 특수 문서 마크업 도구를 사용합니다.

    · 요소 및 그에 수반되는 속성;

    · 엔터티;

    · 코멘트.

    SGML 문서의 구조 단위는 요소입니다. 마크업된 텍스트에서 각 요소는 특정 방식으로 강조 표시되어야 합니다. 요소의 시작(시작 태그)에 시작 태그(영문 태그 - label)를 삽입하고 요소의 끝 부분에 종료 태그(종료 태그)를 삽입하여 선택합니다. 시작 태그와 끝 태그의 이름이 동일합니다. 태그를 일반 텍스트와 구별하려면 태그의 시작을 나타내는 문자로 시작하고 태그의 끝을 나타내는 문자로 끝나야 합니다. 또한 종료 태그에는 종료 태그의 기호인 기호가 지정됩니다. SGML에서는 모든 문자를 이러한 기능으로 지정할 수 있지만 가장 일반적으로 사용되는 문자는 태그 시작 문자인 ""(왼쪽 꺾쇠괄호) 문자와 종료 태그 문자인 "/"(슬래시) 문자입니다. SGML 문서의 요소는 다른 요소를 포함할 수 있으므로 SGML 문서가 계층적(트리) 구조로 그래픽으로 표현됩니다.


    예제 4.3.1.시험 세션 결과와 함께 학생 목록을 지정하는 SGML 문서는 다음과 같이 지정될 수 있습니다.

    세션의 학생 평가 목록

    이바노프 이반 이바노비치

    TS-61

    페트로프 페트르 페트로비치

    TS-62

    이 문서에서 첫 번째 요소는 학생 ​​목록 요소입니다. 이 요소에는 하나의 제목 요소(제목)와 여러 학생 요소(학생 데이터)가 포함됩니다. 차례로 각 학생 요소에는 전체 이름 요소(학생의 성, 이름 및 부칭) 하나, 그룹 번호 요소(그룹 번호) 하나, 표시 목록 요소(세션의 학생 성적 목록) 하나가 포함됩니다. 그리고 마지막으로 mark-list 요소에는 여러 개의 마크 요소(점수)가 포함되어 있습니다.

    이 목록의 그래픽 표현은 그림 1에 나와 있습니다. 4.3.1은 트리 구조를 가지고 있습니다:

    쌀. 4.3.1. 그래픽 표현의 SGML 문서 구조

    속성은 SGML 요소를 구체화하는 데 사용될 수 있습니다. 속성은 다음과 같이 요소의 시작 태그에 기록됩니다.

    속성 이름="속성 값".

    요소에는 여러 속성이 지정될 수 있습니다. 속성은 서로 분리되고 요소 이름은 하나 이상의 공백으로 구분됩니다.

    예제 4.3.2.예제 4.3.1의 마크 요소의 경우 주제 속성을 설정할 수 있으며, 그 값은 시험을 치르는 분야의 이름입니다. 그러면 첫 번째 학생의 경우 요소는 다음과 같은 형식을 취합니다.

    SGML과 같은 언어는 엔터티를 사용하여 데이터 그룹으로 작업합니다. 엔터티는 텍스트와 텍스트가 아닌 모든 명명된 데이터입니다. 문서를 볼 때 엔터티 이름이 해당 값으로 대체됩니다. 예를 들어, 텍스트 엔터티 kpi의 이름은 해당 값인 Kiev Polytechnic Institute로 대체되고, 텍스트가 아닌 엔터티 image1은 image1이라는 이미지로 대체됩니다.

    마크업 언어)는 문서의 구조를 형성하고 이 구조의 다양한 요소 간의 관계를 정의하도록 설계된 태그라고 하는 특수 명령 세트입니다. 즉, 마크업은 문서의 어느 부분이 제목인지, 어떤 부분이 부제인지, 저자의 이름은 무엇으로 간주해야 하는지 등을 알려줍니다. 마크업은 스타일적 마크업, 구조적 마크업, 의미적 마크업으로 나누어집니다. 스타일 마크업

    스타일 마크업은 문서의 모양을 담당합니다. 예를 들어 HTML에서 이러한 유형의 마크업에는 다음과 같은 태그가 포함됩니다. (이탤릭체), (굵은체), (밑줄), (취소선 텍스트) 등

    구조적 표시

    구조적 마크업은 문서의 구조를 정의합니다. 예를 들어 HTML에서는 태그(단락), (제목), (섹션) 등이 이러한 유형의 마크업을 담당합니다.

    의미적 마크업

    의미론적 마크업은 데이터의 내용을 알려줍니다. 이러한 유형의 마크업의 예로는 태그(문서 이름), (코드, 코드 목록에 사용됨), (변수), (저자 주소)가 있습니다.

    모든 마크업 언어의 기본 개념은 태그, 요소 및 속성입니다.

    태그 및 요소.

    태그와 요소의 의미는 종종 혼동됩니다.

    태그 또는 컨트롤 설명자는 태그 내용으로 수행할 작업에 대한 클라이언트측 문서 내용을 표시하는 프로그램에 대한 지침 역할을 합니다. 문서의 주요 내용과 관련하여 태그를 강조 표시하기 위해 꺾쇠 괄호가 사용됩니다. 태그는 미만 기호()로 시작하며 그 안에 지침 이름과 해당 매개변수가 배치됩니다. 예를 들어 HTML에서는 태그가 뒤에 오는 텍스트가 기울임꼴로 표시되어야 함을 나타냅니다.

    요소는 콘텐츠와 함께 태그입니다. 다음 구성은 요소의 예입니다.

    이 텍스트는 이탤릭체로 되어 있습니다. .

    요소는 여는 태그로 구성됩니다(이 예에서는 태그입니다). ), 태그 콘텐츠(예에서는 "이탤릭체로 표시된 텍스트입니다.") 및 닫는 태그(), HTML에서는 때때로 닫는 태그를 생략할 수 있습니다.

    속성

    요소를 정의할 때 이 요소의 특성을 명확하게 하는 매개변수를 설정하기 위해 속성이 사용됩니다.

    속성은 시작 태그에서 요소를 정의할 때 지정할 수 있는 이름 = 값 쌍으로 구성됩니다. 등호 기호의 왼쪽과 오른쪽에 공백을 둘 수 있습니다. 속성 값은 작은따옴표나 큰따옴표로 묶인 문자열로 지정됩니다.

    해당 속성이 정의된 경우 모든 태그는 해당 속성을 가질 수 있습니다.

    속성이 사용되면 요소는 다음 형식을 취합니다.

    태그 내용

    텍스트가 중앙에 정렬됩니다.

    하나의 여는 태그에는 여러 속성이 포함될 수 있습니다. 예를 들면 다음과 같습니다.

    지정된 텍스트 크기 및 색상

    마크업 언어 개발의 역사

    하이퍼텍스트의 개념은 1945년 W. Bush에 의해 도입되었으며, 60년대부터 하이퍼텍스트 데이터를 활용한 최초의 응용이 등장하기 시작했습니다. 그러나 이 기술은 여러 정보 리소스를 결합하여 비선형 텍스트를 생성하고 볼 수 있는 기능을 제공하는 메커니즘이 실제로 필요했을 때 주요 개발되었습니다.

    1986년에 ISO는 표준화된 일반화 마크업 언어를 승인했습니다. 이 언어는 다른 마크업 언어를 생성하기 위한 것이며 유효한 태그 세트, 해당 속성 및 문서의 내부 구조를 정의합니다. 따라서 문서의 내용과 관련된 자신만의 태그를 생성하는 것이 가능합니다. 이제 이러한 문서는 DTD(문서 유형 정의)에 저장된 마크업 언어 정의 없이 해석하기 어렵다는 것이 분명해졌습니다. DTD는 SGML 표준의 모든 언어 규칙을 그룹화합니다. 즉, DTD는 태그 간의 관계와 태그 사용 규칙을 설명합니다. 또한 각 문서 클래스에 대해 해당 마크업 언어의 문법을 설명하는 자체 규칙 세트가 정의됩니다. 따라서 DTD의 도움을 통해서만 태그의 올바른 사용을 확인할 수 있으므로 태그를 SGML 문서와 함께 보내거나 문서에 포함해야 합니다.

    당시에는 SGML 외에도 여러 유사한 언어가 서로 경쟁하고 있었지만 인기(그 후손 중 하나인 HTML)로 인해 SGML은 부인할 수 없는 우위를 점하게 되었습니다.

    SGML을 사용하면 구조화된 데이터를 설명하고, 문서에 포함된 정보를 구성하고, 이 정보를 표준화된 형식으로 표시할 수 있습니다. 그러나 복잡성으로 인해 SGML은 주로 다른 언어의 구문을 설명하는 데 사용되었으며 SGML 문서를 직접 사용하는 응용 프로그램은 거의 없었습니다. SGML은 일반적으로 대규모 프로젝트에서만 사용됩니다(예: 대기업을 위한 통합 문서 관리 시스템 생성).

    HTML 마크업 언어는 SGML보다 훨씬 간단하고 편리합니다. HTML 마크업 언어의 지침은 주로 화면에 문서 내용을 표시하는 프로세스를 제어하기 위한 것입니다. 기술 문서를 마크업하는 방법인 HTML은 1991년 Tim Berners-Lee가 특별히 과학계를 위해 만들었습니다. 원래는 SGML 애플리케이션 중 하나였습니다.

    HTML이 할 수 있는 유일한 일은 문서의 일부를 분류하고 브라우저에 올바르게 표시되도록 하는 것이라는 사실에도 불구하고 HTML은 가장 널리 사용되는 마크업 언어입니다. HTML은 배우기가 매우 쉽기 때문입니다. 당신이 해야 할 일은 HTML 명령을 배우는 것 뿐입니다. HTML용 DTD는 브라우저에 저장됩니다. 또한 HTML은 다양한 플랫폼에서 작동하도록 설계되었습니다. 그러나 여기에는 여러 가지 중요한 제한 사항이 있습니다.

  • HTML에는 고정된 태그 세트가 있으며 이 세트는 확장하거나 변경할 수 없습니다.
  • HTML 언어 태그는 데이터가 표시되는 방식, 즉 문서의 모양만 표시합니다. HTML은 태그에 포함된 내용의 의미나 문서 구조에 대한 정보를 전달하지 않습니다.