Razčlenjevalnik blogov z izvozom v WordPress. Moj vtičnik WP Uniparser je univerzalni razčlenjevalnik za samodejno izpolnjevanje blogov!!! Množično objavljanje v WordPressu

Razčlenjevalnik za WordPress je nastavitev Datacol, namenjena zbiranju vsebin (novic, člankov, ocen itd.) z nadaljnjim izvozom v WordPress CMS.

V tem primeru je nastala vsebina izvožena v . Rezultati za vsako objavo so shranjeni v ločena datoteka, katerega naslov se ustvari na podlagi naslova objave, vsebina pa na podlagi razčlenjenih informacij. Nastavite lahko tudi neposreden izvoz v svoj blog WordPress. Kako to storiti, je prikazano v videu.

Razčlenjevalnik za WordPress lahko brezplačno preizkusite v demo različici programa.
Glavne prednosti razčlenjevalnika za WordPress, ki temelji na Datacolu, so:

  • Možnost prilagajanja razčlenjevanja za WordPress tako, da ustreza vašim potrebam (vi ali sami).
  • Možnost nadaljnje obdelave zbranih podatkov s pomočjo vtičnikov in njihovega nalaganja v .
  • Možnost cikličnega lansiranja kampanj. Ko bodo rezultati prve naloge razčlenjevanja vhod v drugo nalogo zbiranja podatkov. Preberi več.

Kako se razčlenjevalnik uporablja za WordPress?

Če ste ustvarili blog, vam čez nekaj časa postane jasno, da je za njegovo promocijo nenehno potrebna nova edinstvena vsebina. In postanete preleni, da bi sami pisali članke in ročno izpolnjevali spletno mesto. Toda kje lahko dobite novo vsebino? Prej ali slej pride čas, ko se želite zateči k samodejnemu bloganju. Preprosto povedano, uporabite razčlenjevalnik, ki bo sam objavil informacije, ki jih potrebujemo. S to nalogo nam bo pomagal razčlenjevalec vsebine za WordPress.

Vse spletne strani so bile v nekem trenutku ustvarjene iz nič. Če pa je namen vaše strani posredovanje informacij, bo zanimiva šele, ko bo količina informacij presegla določeno količino. Razčlenjevalnik spletnega dnevnika WordPress je odlična rešitev za takšno nalogo. Z njegovo pomočjo lahko v kratkem času dohitite svoje konkurente in znatno razširite katalog informacij spletnega mesta. Razčlenjevalnik WordPress je mogoče implementirati kot grabber za WordPress z določenega mesta.

Razčlenjevalnik za WordPress blog lahko pomaga pri reševanju številnih težav, tukaj je nekaj izmed njih:
— začetno polnjenje vira (razčlenjevalnik spletnega mesta za WordPress vam bo omogočil, da v najkrajšem možnem času napolnite svoj blog z informacijami od začetka do zahtevane količine);
— ustvarjanje samodejno izpolnjenega spletnega dnevnika (razčlenjevalnik WordPress bo lahko zagotovil redno samodejno posodabljanje vsebine spletnega mesta)
— objavljanje vsebine »po urniku« (lahko načrtujete čas za dodajanje objav na vaše spletno mesto)

Množično objavljanje v WordPressu

Razčlenjevalnik za WordPress, predstavljen v Datacolu, je jasen primer uporabe razčlenjevalnika za množično objavljanje. Omogoča vam samodejno prejemanje vsebine in objavo na svojem blogu. Postopek strganja WordPress lahko razdelimo na več stopenj:

1) Postopek zbiranja vsebine. Razčlenjevalnik WordPress zbira potrebne informacije za vsako objavo v spletnem dnevniku: naslov, vsebino (preneseno s slikami, ki se shranijo na vaš računalnik za nadaljnji prenos prek FTP na vaš strežnik), kategorijo, avtorja in povezavo, s katere so bili podatki zbrani (URL).

2) Shranjevanje informacij, ki jih zbere razčlenjevalnik za WordPress. Po razčlenjevanju se zbrani podatki shranijo v datoteke TXT (vsaka objava je shranjena v ločeni besedilni datoteki), katerih imena se generirajo v skladu z naslovom objave.

3) Izvozite WordPress. Možno je tudi neposredno izvoziti razčlenjene informacije v vaš blog WordPress. Zaradi tega je proces polnjenja zelo hiter in izključena možnost človeških napak. Možnost izvoza v WordPress je vključena v osnovno funkcionalnost programa. V nastavitvah programa morate določiti parametre za povezavo z vašim blogom in določiti podatke za izvoz (naslov, vsebina, kategorija itd.)

4) Obdelava informacij. Po želji se lahko informacije, zbrane med postopkom razčlenjevanja WordPressa, obdelajo (na primer izpostavijo samodejnemu prevodu ali sinonimizaciji). Te funkcije so implementirane z uporabo vtičnikov.

Kako razčleniti spletno mesto WordPress?

V WordPressu ne morete le objaviti razčlenjenih informacij, ampak jih lahko iz njega tudi postrgate. Naloga uporabe WordPress blogov drugih ljudi kot vira vsebine za vaše bloge se pojavi precej pogosto. Za rešitev te težave vam bo pomagal razčlenjevalec spletnega mesta WordPress. Algoritem za delo z razčlenjevalnikom spletnega mesta WordPress je podoben zgoraj opisanemu.

Prednosti razčlenjevalnika spletnih mest WordPress

Verjetno ste že prepričani, da vam bo razčlenjevalnik blogov WordPress pomagal, da ne boste porabili veliko časa in truda za ročno polnjenje bloga. Zahvaljujoč temu ne morete samo avtomatizirati svojega dela, temveč tudi povečati njegovo učinkovitost. Razčlenjevalnik za WordPress, implementiran v Datacol, lahko prenesete na

Testiranje razčlenjevalnika spletnega dnevnika

Če želite preizkusiti razčlenjevalnik spletnega dnevnika:

2. korak. Drevo akcije vsebuje akcijo content-parsers/kolchaka-net.par. Izberite ga in kliknite gumb Predvajaj. Preden začnete, lahko uredite Vhodne podatke. Na ta način lahko nastavite povezavo do bloga ali strani bloga, iz katerih boste razčlenili vsebino.

3. korak. Počakajte, da se prikažejo rezultati razčlenjevalnika spletnega dnevnika. Ko se prikažejo rezultati, lahko prisilno ustavite razčlenjevanje (s klikom na gumb Stop).

kliknite na sliko za povečavo

4. korak. Po končani/prisilni zaustavitvi razčlenjevalnika v mapi Moji dokumenti najdete besedilne datoteke(vsaka objava je shranjena v ločeni datoteki), katerih imena se generirajo na podlagi naslovov prispevkov:

kliknite na sliko za povečavo

Predstavljam vam univerzalno WordPress grabber WP UniParser. Ta vtičnik je univerzalni prilagodljiv razčlenjevalec. Pri ustvarjanju objav lahko vtičnik prevede vsebino prek Googlova storitev Prevedite z uporabo poljubnih jezikovnih parov.

Mnenja strank

Moderatorji so temo na strežniku, kjer je bilo okoli 6-7 ocen, izbrisali (češ da izdelek ne ustreza pravilom foruma). Kljub temu je mogoče prebrati eno oceno na forumu Mulnet in Armada. Obstajajo tudi ocene blogerjev: tukaj in tukaj. Pred kratkim sem po naključju naletel na pregled.

Osnovna funkcionalnost

Vtičnik WP UniParser, ki sem ga ustvaril, lahko naredi naslednje:
potegnite vsebino iz strani na vseh motorjih(razčlenjevalnik je konfiguriran z uporabo regularni izrazi in nizi omejitev, nastavitev je zelo preprosta, vse bom razložil in pokazal, poleg tega obstaja );
izrezujte skripte, komentarje, povezave, obrazce, slike, razpone, predmete, pa tudi vse fragmente, ki jih določite iz vsebine.
objava načrta delovna mesta;
razčlenjene materiale postavite v kategorijo, ki jo določite (ali jih naključno razdelite v kategorije);
spoznati samodejno prevajanje(v katero koli smer) v vseh podprtih jezikih Google prevajalnik.

Več o naboru funkcij vtičnika lahko izveste na posnetku zaslona njegove skrbniške plošče:

Prav tako je vredno razumeti delovanje univerzalnega grabežnika v celoti.

Včasih nima smisla porabiti časa za pisanje besedila za spletno mesto WordPress. Ta primer ne velja za bloge in informacijska spletna mesta, saj njihov dohodek nastane prav zaradi objavljenih objav.

In govorimo o spletnih trgovinah, spletnih mestih podjetij in novičarski portali, ni namenjen organskemu prometu. Za takšne vire edinstveni materiali niso tako pomembni kot njihovo nenehno posodabljanje.

Če želite ustvariti spletno mesto s samodejnim izpolnjevanjem, boste morali za svoj projekt nastaviti razčlenjevalnik novic. Najprej morate najti primerna mesta, s katerih boste strgali. Morajo ustrezati temi vašega projekta, sicer nima smisla podvajati informacij iz njih. Če je temu tako, potem morate nadaljevati z drugim delom rešitve težave z razčlenjevanjem - tako boste klonirali besedilo z drugega mesta. Najbolj primitivna in neprijetna metoda je ročno kopiranje. Vendar je veliko pametneje uporabiti enega od vtičnikov, navedenih v tem članku, da aktivirate uspešen razčlenjevalec novic in vsebine.

WP-O-Matic

Zelo priljubljen modul za WordPress, ki vam bo omogočil nastavitev funkcionalnega razčlenjevalnika novic z drugih spletnih mest. Orodje namesti na preprost način: z nalaganjem neposredno v mapo na gostovanju ali prek zavihka »Plugins«.

Nato morate konfigurirati vtičnik, če želite zagotoviti razčlenjevanje vsebine. Če želite to narediti, štirikrat kliknite »Naprej« in na koncu »Pošlji«. S tem potrjujete, da se strinjate s pogoji uporabe teh podatkov WordPress modul. Zlasti se strinjate, da ste sami odgovorni za krajo gradiva drugih ljudi, vsebine z drugih spletnih mest itd.

Če vas poleg besedilne komponente zanimajo tudi slike, potem morate v mapi z dodatkom ustvariti imenik z imenom Cache. Nastavite posebne pravice dostopa do te mape. Nato se boste morali vrniti v skrbniško območje WordPress. Pojdite v nastavitve vtičnika in natančno poglejte, ali je poleg elementa cron Unix kljukica. Potrdite polje Cache Image, tako da razčlenjevalnik novic kopira tudi slike v vaš vir.

Modul WP-O-Matic je dober, ker deluje na kateri koli strani spletnega mesta. Dodate lahko ločeno kategorijo, če želite, da se tam prikaže seznam novic in vsebin, ki jih ponuja razčlenjevalnik. Če želite to narediti, najprej ustvarite potrebno kategorijo. Nato v skrbniku WordPress v nastavitvah orodja WP-O-Matic kliknite Dodaj oglaševalsko akcijo. V vrstici Kategorije označite posebno kategorijo, ki ste jo ustvarili. In v obrazec Feeds vnesite vir RSS, ki ga boste razčlenili. Vnesete lahko več URL-jev za vire hkrati, tako da razčlenjevalnik besedila zbira informacije iz treh ali celo štirih virov hkrati.

In še en velik plus v smeri vtičnika WP-O-Matic je avtomatska objava gradiva. Ni se vam treba vsako uro prijavljati v svojega skrbnika za WordPress, da spremenite status svojih objav v »Objavljeno«. Modul bo to naredil sam. In če želite, lahko unikatizira besedilo s posebnim mehanizmom sinonimizacije. To je ključna razlika to orodje od svojega konkurenta – vtičnika FeedWordPress.

Datacol

To je funkcionalen grabež, ki ni primeren le za Motor WordPress. To ni samo razčlenjevalnik besedila za spletne strani - je pametna aplikacija, ki vam omogoča filtriranje kopiranega gradiva. Na primer, objavljali boste lahko samo članke, ki vsebujejo določene ključne besede. Novice lahko podvojite neposredno iz Yandex. Klonirani materiali bodo izvoženi v enem od 15 razpoložljivih formatov. Storitev ne bo zbirala le besedila, temveč tudi naslove, fotografije, datum objave, povezave in druge pomembne podatke.

Toda Datacol se distribuira na plačani osnovi. Je pa veliko ceneje, kot če bi gradivo na stran naročili prek menjalnic. Aplikacija stane manj kot 500 rubljev in se lahko uporablja za skoraj vsak motor. Obstaja demo različica.

FDE Grabber

Še en plačan razčlenjevalec z velikim številom funkcij. Ta že spada v kategorijo dragih graberjev, saj bo stal okoli 90$. Možno pa ga bo uporabljati na 10 strežnikih hkrati, torej teoretično lahko različni spletni mojstri odštejejo 9 dolarjev in tako pocenijo nakup.

FDE Grabber ni ravno vtičnik za WordPress. Razvijalci svojo stvaritev imenujejo avtonomni sistem, ki deluje ne glede na vrsto CMS, nameščenega na spletnem mestu. Glavne značilnosti tega sistema za razčlenjevanje:

  • prenos celotne novice ali posameznih fragmentov;
  • lahko načrtujete objave;
  • če želite unikatizirati podvojeno gradivo, je vgrajena funkcija sinonimizacije;
  • lahko delate prek proxy strežnikov;
  • razčlenjevanje lahko zaobide preusmeritve, kar je lahko težava za druge vtičnike;
  • lahko samodejno prenesete vso vsebino s spletnega mesta in jo premaknete na svoje spletno mesto (če gre za portale, ki niso novice);

Razčlenjevanje lahko popolnoma nastavite po lastni presoji, saj ima program možnost izvajanja mikroprogramov za popravljanje dela. Tako lahko na primer konfigurirate poravnavo in oblikovne značilnosti kopiranega materiala. Prav tako lahko dodate parametre noindex in nofollow za vse povezave, ki bodo v besedilu strani. Razčlenjevalnik omogoča celo kopiranje in samodejno prevajanje člankov iz tujih virov. To je odličen način za ustvarjanje stalnega toka vsebine na vaših straneh, ki bo čez čas začela privabljati obiskovalce!

Precej močan univerzalni razčlenjevalnik za WordPress. Omogoča zbiranje vsebine iz enega ali več virov in njeno obdelavo ter prilagajanje zahtevanemu formatu z uporabo vseh zmožnosti jezika PHP. Obstaja možnost zakasnjenega razčlenjevanja. Najboljši brezplačni razčlenjevalec za wordpress v tem trenutku - AftParser vam je vedno na voljo!

Kratek opis funkcionalnosti:

Razčlenjevalnik je sestavljen iz 4 strani: domače strani, strani z razčlenjevalnikom povezav, strani z razčlenjevalnikom virov RSS in strani z nastavitvami. Takole bo videti po namestitvi:

Pozor: Preberete lahko, kako konfigurirati AftParser.

Začnimo z domača stran. Prikaže seznam razčlenjevalnikov, ki se trenutno izvajajo.

Pojasnila so podana v blokih na vsaki strani. Vsa dokumentacija je vzeta iz škatle; le pozorno jo preberite, da bo vse jasno.

Razčlenjevalnik spletne strani:

Stran z razčlenjevalnikom spletnega mesta vam omogoča razčlenjevanje podatkov iz enega ali več virov. Navesti morate le povezave do materialov.

Kaj? Ste preleni, da bi brskali po spletu in ročno zbirali materiale? Ne obupajte – vse je avtomatizirano.

Obstajata dve orodji, ki vam omogočata samodejno izpolnjevanje seznama povezav.

- nekakšna emulacija iskalnik. Robot se bo sam sprehodil po straneh spletnega mesta, prenesenega nanj, in zbral vse notranje povezave z njih.

Seveda bo seznam povezav, napolnjen s samodejnimi algoritmi, močno zamašen z nepotrebnimi podatki. In tu vam na pomoč priskočijo filtri.

- najbolj preprost in hiter način filtracijo. Vnesete pogoje in filter sam opravi obdelavo.

Napredni filter povezav- filter povezav, ki vam omogoča, da spremenite njihovo vsebino in naredite kup drugih stvari. Samo za napredne uporabnike. Svetujem ti, da se naučiš php, preden karkoli počneš tam.

Če ste dokončali zbiranje povezav, je naslednji korak dodajanje meja vsebine.

Z uporabo teh meja bo razčlenjevalnik določil področja, ki jih je treba obdelati.

Označevanje sintakse je izvedeno z urejevalnikom javascript ACE. Vsa dokumentacija in vse razpoložljive funkcije so na voljo na strani vtičnika. Seznam je zelo impresiven in ga tukaj ne morem predstaviti, saj je to gradivo že zelo dolgo. Preprosto namestite vtičnik in preberite, navdušeni boste, zagotavljam.

Tako izgleda stran Razčlenjevalnik virov RSS, z edino razliko, da ni treba zagotoviti seznamov povezav.

Obstaja kar nekaj področij delovanja, kjer lahko razčlenjevalnik uporabljamo, predvsem pa je to zbiranje različnih informacij. Slike in povezave lahko hitro zbirate samo programsko. Uporaba razčlenjevalnika za iskanje informacij vam omogoča, da avtomatizirate ta postopek in znatno prihranite čas. Če imate spletno stran na Wordpressu, jo lahko enostavno samodejno izpolnite z razčlenjevalnikom AftParser.

je brezplačen, univerzalni razčlenjevalnik za WordPress. omogoča zbiranje vsebin iz enega oz različnih virov, obdelavo pod zahtevana oblika v jeziku PHP. Razčlenjevalnik je narejen kot vtičnik za WordPress. Po normalni namestitvi vtičnika se bo v konzoli WordPress prikazal meni razčlenjevalnika, kot na sliki.

Razčlenjevalnik izvaja dve glavni orodji: razčlenjevalnik spletnega mesta WordPress in razčlenjevalnik rss Wordpress.

Parser za WordPress lahko:

1. Razčleni podatke iz povezav

Navesti morate le povezave do vira. Če povezav ni, jih lahko zbere razčlenjevalnik. Določite pot do zemljevida spletnega mesta in grabber bo zbral vse povezave. Lahko pa zbirate povezave iz katerega koli html strani. Povezave lahko filtrirate po želenih kriterijih. Obstajata dva filtra povezav, s katerima lahko spreminjate pogoje razčlenjevanja. Izkušeni uporabniki lahko sami ustvarijo makre za razčlenjevanje, zaradi česar je razčlenjevalnik zelo prilagodljiv, da ustreza njihovim potrebam.

2. Razčleni podatke vira RSS

Tukaj je vse preprosto, vnesite želeni URL vira in kliknite začni razčlenjevati.
Ena od možnih uporab razčlenjevalnika za Wordpress je polnjenje stolpcev z novicami na vašem spletnem mestu z uporabo virov informacij, kot so spletni dnevniki, viri RSS, strani VKontakte itd. Konkurenti - WP-O-Matic, FeedWordPress, CyberSyn.