html хаягуудыг устгана уу. html хаягуудаас текстийг арилгах. HTML цэвэрлэгч хэрхэн ажилладаг вэ?

Сайн уу?

Өөрийнхөө WYSIWYG засварлагчийг бичих үед би Word-оос текст хуулахад асуудалтай тулгарсан. Үнэндээ гурван асуудал байна:

  • Word нь цэвэрлэх шаардлагатай олон html кодыг оруулдаг
  • Зарим шалтгааны улмаас Word жагсаалт гаргахдаа UL болон LI шошгоны оронд догол мөрүүдийг ашигладаг
  • Үнэн хэрэгтээ, оруулсан текстийг Word програмаас оруулсан эсэхийг хэрхэн тодорхойлох вэ.
Ерөнхийдөө эдгээр асуудлыг шийдэхийн тулд jQuery залгаасыг бичсэн, бүрэн гүйцэд эх сурвалжҮүнийг нийтлэлийн төгсгөлд авах боломжтой. Хэрэглээний жишээ:

$('#редактор'). msword_html_filter();
Plugin нь үйл явдал дээр өлгөөтэй байна товчлуурредактор доторх эх кодыг Word-оос буулгасан эсэхийг шалгадаг бөгөөд хэрэв тийм бол цэвэрлэх функцийг ажиллуулна. Үүссэн html-д боломжтой бүх зүйлийг оруулсан болно - тасрахгүй зай, шинж чанарууд хэв маягТэгээд тэгшлэх, шошго зай, Бүгд Мсо-анги, хоосон догол мөр.

Зүссэн доор хэрэгжүүлэх дэлгэрэнгүй мэдээлэл.

Ашигласан ердийн хэрэглээний ихэнхийг TinyMCE-ээс авсан.

Word програмаас оруулсан html кодыг агуулсан мөрийг хэрхэн тодорхойлох вэ:

Хэрэв (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w:WordDocument/i.test(content)) ( ... )

Код цэвэрлэх функц (функц руу шилжсэн jQuery объектредактор):

Функц word_filter(editor)( var content = editor.html(); // Нөхцөлт тайлбар гэх мэт үгийн тайлбар контент = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|мета|холбоос|загвар|\w:\w+)(?=[\s\/>]))[^>]* >>gi, ""); // Хөрвүүлэх руу <(\/?)s>/gi,"<$1strike> ___ ([\s\u00a0]*)<\/span>/gi, функц(str, хоосон зай) ( буцах (зай. урт > "; хэрэв (/^\s*\w+\./.test(txt))) ( var таарч байна = /()\./.exec(txt). ); if (тохирох) ( var start = parseInt(тохирох, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level> " + $(энэ).html() + "") $(энэ).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", засварлагч).removeAttr("хэв маяг"); $("", засварлагч).removeAttr( "align"); $("span", editor).replaceWith(function() (буцах $(энэ).contents();)); $("span:empty", засварлагч).remove(); $( "", засварлагч).removeAttr("анги"); $("p:хоосон", засварлагч).remove(); )

Plugin-ийн бүрэн эх текст нь спойлерын доор байгаа тул файлд хадгална уу jquery.msword_html_filter.js

залгаасын эх текст

(функц($) ( $.fn.msword_html_filter = функц(сонголтууд) ( var settings = $.extend((), сонголтууд); функц word_filter(editor)( var content = editor.html(); // Word гэх мэт сэтгэгдэл нөхцөлт тайлбар гэх мэт агуулга = content.replace(//gi, ""); // Сэтгэгдэл, скрипт (жишээ нь, msoShowComment), XML шошго, VML контент, // MS Office нэрийн зайтай хаягууд болон бусад цөөн хэдэн шошгоуудыг устгана уу content = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|мета|холбоос|загвар|\w:\w+)(?=[\s\/>]))[^>]* >>gi, ""); // Хөрвүүлэх руу мөртэй агуулгын хувьд = content.replace(/<(\/?)s>/gi,"<$1strike>"); // nbsp entits-ийг char болгон солино уу, учир нь үүнийг зохицуулахад хялбар //content = content.replace(/ /gi, "\u00a0"); контент = контент.орлуулах(/ /gi, " "); // Хөрвүүлэх ___солигдох // ижил урттай агуулгын тасрах/тасрахгүй зайн стринг = content.replace(/ ([\s\u00a0]*)<\/span>/gi, функц(str, хоосон зай) ( буцах (зай.урт > 0) ? зай.орлуулах(/./, " ").зүсмэл(Математик.давхар(зай.урт/2)).split("") .join("\u00a0") : ""; )); editor.html(агуулга); // Жагсаалтын доголын түвшинг $("p", editor).each(function())( var str = $(this).attr("style"); var matches = /mso-list:\w+ \ w+(+)/.exec(str); if (тохирох) ($(энэ).data("_listLevel", parseInt(тохирох, 10)); ) )); // Жагсаалтуудыг задлах var last_level=0; var pnt = null; $("p", editor).each(функц())( var cur_level = $(this).data("_listLevel"); if(cur_level != undefined)( var txt = $(энэ).text() ; var list_tag = ""; if (/^\s*\w+\./.test(txt))) ( var matches = /()\./.exec(txt); if (тохирох) ( var start = parseInt ( таарч байна, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level> last_level)( if(last_level==0)( $(энэ).өмнө( list_tag ); pnt = $(энэ).prev(); )else(pnt = $(жагсаалтын_таг).appendTo(pnt); ) ) if(cur_level) " + $(энэ).html() + "") $(энэ).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", засварлагч).removeAttr("хэв маяг"); $("", засварлагч).removeAttr( "align"); $("span", editor).replaceWith(function() (буцах $(энэ).contents();)); $("span:empty", засварлагч).remove(); $( "", засварлагч).removeAttr("анги"); $("p:хоосон", засварлагч).remove(); ) this.each(function() ( $(энэ).on("keyup", функц) буцаана. ()( var content = $(this).html(); if (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w :WordDocument/i.test(контент)) ( word_filter($(энэ)); ))) )); ); ))(jQuery)


Гүйцэтгэлийг зөвхөн хамгийн сүүлийн үеийн Firefox-д туршиж үзсэн.

Excel/Word to HTML нь WordPress нийтлэлийн эх код эсвэл бусад агуулгын удирдлагын системд суулгасан хөгжмийн зохиолч нь бидэнд шаардлагатай бүх функцийг хангаагүй тохиолдолд тэдгээрийг засварлахад тохиромжтой хэрэгсэл юм. Синтакс тодотгох болон бусад текст засварлах функцуудыг зохицуулах өргөтгөл, залгаас суулгахгүйгээр хөтчийн цонхон дээр шууд контент бичээрэй.

Яаж хэрэглэх вэ?

Word засварлагч руу хөрвүүлэхийг хүссэн баримтаа буулгаад, хуудасны дээд хэсэгт байрлах том табуудыг ашиглан HTML харагч руу очиж код үүсгэнэ үү.

Жагсаалт дахь идэвхтэй (шалгасан) сонголтуудыг гүйцэтгэдэг том товчлуураар бохир тэмдэглэгээг цэвэрлэ. Та мөн CLEAN дүрсийг ашиглан эдгээр функцийг нэг нэгээр нь ашиглаж болно.

Манай онлайн HTML хөрвүүлэгчээр амархан шийдэгддэг хөрвүүлэлтийн асуудлууд

Microsoft Word-тэй хамт үгийг html болгон хөрвүүлэх асуудал үргэлж байсаар ирсэн байх. mso-spacerun:yes, MsoNormal зэрэг ангиуд зэрэг текстэнд хуваарилагдсан асар олон тооны хэв маяг, мөн бүх төрлийн span style="font-size:10.0pt" эмх замбараагүй байдал нь кодыг маш ихээр эмх замбараагүй болгодог. Мөн тэд ихэвчлэн сайтад заасан төрөлхийн хэв маягийг тасалдуулдаг. Хэрэв та засварлагчийн "Зөвхөн текст оруулах" товчлуураар текст оруулах замаар энгийн тексттэй ажиллах боломжтой хэвээр байвал энэ арга нь хүснэгтэд ажиллахгүй. Манай хөрвүүлэгч нь зүгээр л товчлуур дээр дарснаар ирээдүйн html файлаас шаардлагагүй тайлбар, хэв маягийг хялбархан цэвэрлэх боломжтой.


Шаардлагагүй CSS загвараас HTML-г онлайнаар цэвэрлэх
  • Бүх текст эсвэл сонгосон фрагментээс шаардлагагүй хэв маягийг устгана уу
  • Бид шаардлагагүй догол код, тэмдэг болон бусад Юникод кодыг устгана
  • Кодоо нэмэлт зай болон давхардсан шошгооос цэвэрлэ
  • Шаардлагатай бол HTML тэмдэглэгээг бүрэн устгана уу.

Word, Excel, TxT файлуудыг цэвэр HTML эх код болгон хөрвүүлэх. Шаардлагагүй хэв маяг, тайлбаргүйгээр сайтын хуудсанд шууд, зөв ​​оруулах.

Онлайн хөрвүүлэлтийн дэмжигдсэн форматууд:

  • 97–2004 болон түүнээс хойшхи DOC-аас HTML рүү, DOCX-ээс HTML рүү;
  • XLS-с HTML, XLSX-ээс HTML;
  • PPT to HTML, PPTX to HTML;
  • TXT-аас HTML болон бусад олон форматууд.

Үйлчилгээний өөр нэг ашигтай хэрэглээ бол HTML дээр хүснэгт хийхэд олон цаг зарцуулахын оронд Excel эсвэл Word дээр 15 минутын дотор хийж, сайтад оруулах цэвэрхэн, үзэсгэлэнтэй HTML код болгон хувиргах боломжтой.

Өдрийн мэнд, эрхэм уншигчид! Та нар бидэн шиг сайн ажиллаж байгаа гэж найдаж байна - нар гэрэлтэж, шувууд дуулж, дулаахан, зун ирлээ! Би диссертаци дээрээ ажиллаж байгаа тул сүүлийн сар хагасын турш долоо хоногт нэг л удаа бичдэг байсан тул надад цаг зав гардаггүй. Гэхдээ гунигтай зүйл ярихгүй, ажилдаа орцгооё!

Хэзээ нэгэн цагт би HTML кодыг хог хаягдлаас цэвэрлэх скриптийг хайж олохын тулд интернет ухаж байсан бөгөөд энэ нь ялангуяа Microsoft Word-ыг бид бүгдийг "хайртай" болгодог. Өмнө нь би хэрэглэж байсан Adobe Dreamweaver ашиглан код цэвэрлэхгэхдээ түүнд байсан хоёр сул тал:

    Заримдаа энэ нь бидний хүссэн бүх зүйлийг цэвэрлэж чаддаггүй.

    Хэрэв маш их хэмжээний код байгаа бол цэвэрлэх скрипт нь алдаа гаргадаг.

Хоёрдахь зүйл бол миний хувьд маш чухал зүйл болсон, учир нь би нэг сайтаас холдох боломжгүй том html хүснэгтүүдтэй ажиллах шаардлагатай болсон бөгөөд тэд Word дээр бүх мэдээллийг өгсөн.

Тиймээс, интернетээр удаан хугацаанд тэнүүчлүүлсний дараа би энэ бүх менежментийг тэсрэлтээр даван туулах, нэгэн зэрэг өөрчлөх боломжтой скриптийг олсон.

Үнэгүй онлайн HTML Cleaner ашиглан бохир тэмдэглэгээгээ арилга. Энэхүү онлайн хэрэгслээр вэб кодыг зохиох, засах, форматлах, багасгахад маш хялбар байдаг. Word баримтуудыг HTML болон Excel, PDF, Google Docs гэх мэт визуал баримт бичгийг эмх цэгцтэй болгохын тулд хөрвүүлнэ. Таны үйлдэлд шууд хариу өгөх хоёр хавсаргасан визуал болон эх сурвалж засварлагчтай ажиллах нь маш энгийн бөгөөд үр дүнтэй юм.

HTML Cleaner нь HTML цэвэрлэх, засварлах ажлыг аль болох хялбар болгох олон ашигтай функцээр тоноглогдсон. Текстийн талбарт кодоо буулгаж, цэвэрлэх тохиргоог тохируулаад товчийг дарна уу Цэвэр HTMLтовч. Энэ нь Microsoft Excel, PowerPoint, Google doc эсвэл бусад хөгжмийн зохиолчоор үүсгэсэн аливаа баримт бичгийг боловсруулах боломжтой. Энэ нь Microsoft Word эсвэл бусад WYSIWYG редакторуудын нэмсэн бүх шугамын хэв маяг, шаардлагагүй кодуудаас амархан салахад тусална. Энэхүү HTML засварлагч хэрэгсэл нь агуулгыг нэг вэб сайтаас нөгөө рүү шилжүүлэхэд хэрэгтэй бөгөөд эх сайтад хамаарах бүх харь гарагийн анги, ID-г цэвэрлэхийг хүсч байна. Өөрийн захиалгат тушаалууддаа олох, солих хэрэгслийг ашиглана уу. Утгагүй текст үүсгэгч нь засварлагч дээр хуурамч текстийг хялбархан нэмэх боломжийг танд олгоно.

Хуудасны дээд талд та визуал засварлагч болон эх код засварлагчийг бие биенийхээ хажууд харж болно. Та өөрчилсөн аль ч өөрчлөлт нь бодит цаг хугацаанд нөгөө талдаа тусгагдах болно. Visual HTML засварлагч нь эхлэгчдэд бусад текст процессорын програм ашиглахтай адил контентоо хялбархан зохиох боломжийг олгодог бол баруун талд нь тодруулсан кодын тэмдэглэгээ бүхий эх редактор нь ахисан түвшний хэрэглэгчдэд кодыг тохируулахад тусалдаг. Энэ нь энэхүү онлайн програмыг HTML кодчилолд суралцах сайхан хэрэгсэл болгодог.

HTML-г цэвэрлэхийн тулд Word баримт бичгийг хөрвүүлэх

Онлайн PDF, Microsoft Word, Excel, PowerPoint эсвэл өөр өөр үг засварлагч программуудаар бүрдсэн бусад баримт бичгүүдийг нийтлэх эсвэл өөр вэбсайтаас хуулсан контентыг хуулахын тулд форматтай контентыг визуал засварлагч дээр буулгана уу. Баримт бичгийн HTML эх сурвалж нь эх засварлагч дээр нэн даруй харагдах болно. WYSIWYG засварлагч дээрх хяналтын самбар нь энэ талбарыг удирддаг бол бусад бүх эх сурвалжийг цэвэрлэх тохиргоо нь эх кодыг засварлахад зориулагдсан байдаг. дээр дарна уу Цэвэр HTMLцэвэрлэх тохиргоог тохируулсны дараа товчийг дарна уу. Цэвэрлэсэн кодыг хуулж, вэбсайт дээрээ нийтлээрэй.

Хөтөлбөр нь таны кодын бүх алдааг таны хүссэнээр засна гэсэн баталгаа байхгүй тул синтаксийн хувьд хүчинтэй HTML оруулахыг оролдоно уу.

Харгалзах хайрцгийг идэвхжүүлж HTML хүснэгтүүдийг бүтэцлэгдсэн div элементүүд рүү хөрвүүлнэ үү.

Microsoft Word хаягуудаас HTML кодыг цэвэрлэх (2000-2007)?

Өмнө нь вэб дизайнерууд хуудасны байршлыг зохион байгуулахдаа хүснэгтүүдийг ашиглан вэбсайтаа бүтээдэг байсан бол responsive вэб дизайны эрин үед хүснэгтүүд хуучирч, DIV-ууд байр сууриа эзэлж байна. Энэхүү онлайн хэрэгсэл нь хэдхэн товшилтоор хүснэгтээ бүтэцлэгдсэн div элементүүд рүү шилжүүлэхэд тусална.

Та табын шатлалыг мод хэлбэрээр зохион байгуулснаар эх кодоо илүү унших боломжтой болгож чадна.

Гишүүн болох

Энэ вэб сайт нь HTML кодыг цэвэрлэх, бичих бүрэн ажиллагаатай хэрэгсэл боловч танд HTML G гишүүнчлэл худалдаж авах, илүү мэргэжлийн функцүүдэд хандах боломжтой. HTML Cleaner-ийн үнэгүй хувилбарыг ашигласнаар та засварласан баримт бичигт холбоос оруулахыг зөвшөөрч байна. Энэхүү цэвэрлэх хэрэгсэл нь цэвэрлэсэн баримт бичгийн төгсгөлд сурталчилгааны гуравдагч талын холбоосыг нэмж болох бөгөөд та үнэгүй хувилбарыг ашиглаж байгаа бол энэ кодыг өөрчлөхгүй байх шаардлагатай.

Цэвэрлэгч нь хуудсыг програмын форматаар хадгалсны дараа баримт бичигт үлдэх хаягуудыг "хог хаягдлаас" цэвэрлэх үйлчилгээ юм.

Удаан хугацааны өмнө би үүнтэй төстэй залгаасыг бичиж байсан, гэхдээ энэ нь яаран хийгдсэн, одоо механизмыг бүрэн дахин бичсэн.

Кодыг цэвэрлэх нь "цэвэр" гэсэн шинийг агуулсан оруулсан мөрийг хайж олох замаар хийгддэг. Plugin нь шошгуудаас бүх зүйлийг устгадаг, үүнд . Хослогдоогүй шошгонд / (налуу зураас) тэмдгийг оруулсан болно. Хоосон шошго устгагдсан, жишээ нь бүтэц нь юу ч агуулаагүй тул устгагдах болно.

HTML цэвэрлэгч хэрхэн ажилладаг вэ?

Хоёр арга бий:

  1. MS Word дээр устгахыг хүссэн мэдээллээ сонгоод бүгдийг нь сонгохын тулд Ctrl + A товчийг дарна уу. Хуулсан текстийг доорх талбарт буулгана уу ("MS Office Data Paste" табыг сонгосон байх ёстой), "Finish" товчийг дарна уу.
  2. Кодыг оновчтой болгохын өмнө Word програмын "Хадгалах ..." гэснийг сонгоод "Шүүлтүүртэй вэб хуудас" гэсэн файлын төрлийг сонгоод, хадгалсан файлыг текст засварлагч дээр нээж, кодыг хуулж аваад доорх талбарт буулгана уу. "HTML оруулах" табыг сонгосон байх ёстой "), "Дууссан" товчийг дарна уу.

Үүний үр дүнд та цэвэр html код хүлээн авах болно.
Дараах шинж чанарууд нь хөндөгдөөгүй хэвээр байна.

"colspan", "rowspan", "href", "src", "төрөл", "утга", "lang", "tabindex", "title", "code", "alt", "target", "dir" ","span", "үйлдэл", "арга"