Blog parser s izvozom u WordPress. Moj WP Uniparser dodatak je univerzalni parser za automatsko popunjavanje bloga!!! Skupno objavljivanje u WordPressu

Parser za WordPress je Datacol postavka dizajnirana za prikupljanje sadržaja (vijesti, članci, recenzije itd.) s daljnjim izvozom u WordPress CMS.

U ovom primjeru, rezultirajući sadržaj se izvozi u . Rezultati za svaki post spremaju se u zasebna datoteka, čiji se naslov generira na temelju naslova objave, a sadržaj se generira na temelju raščlanjenih informacija. Također možete postaviti izravan izvoz na svoj WordPress blog. Kako to učiniti prikazano je u videu.

Parser za WordPress možete besplatno testirati u demo verziji programa.
Glavne prednosti parsera za WordPress koji se temelji na Datacolu su:

  • Mogućnost prilagodbe parsiranja za WordPress kako bi odgovarala vašim potrebama (vi ili sami).
  • Mogućnost daljnje obrade prikupljenih podataka pomoću dodataka i njihovo učitavanje u .
  • Mogućnost cikličkog pokretanja kampanja. Kada će rezultati prvog zadatka parsiranja biti ulaz u drugi zadatak prikupljanja podataka. Čitaj više.

Kako se parser koristi za WordPress?

Ako ste napravili blog, nakon nekog vremena postaje vam jasno da je za njegovu promociju stalno potreban novi jedinstveni sadržaj. I postajete previše lijeni da sami pišete članke i ručno ispunjavate web mjesto. Ali gdje možete nabaviti novi sadržaj? Prije ili kasnije dođe vrijeme kada želite pribjeći autobloggingu. Jednostavno rečeno, upotrijebite parser koji će sam objaviti informacije koje su nam potrebne. Parser sadržaja za WordPress pomoći će nam da se nosimo s ovim zadatkom.

Sve su web stranice u nekom trenutku stvorene od nule. Ali ako je svrha vaše stranice pružanje informacija, ona će postati zanimljiva tek kada količina informacija prijeđe određenu količinu. WordPress blog parser izvrsno je rješenje za takav zadatak. Uz njegovu pomoć možete u kratkom vremenu sustići svoje konkurente, značajno proširujući katalog informacija na web mjestu. Parser WordPressa može se implementirati kao grabber za WordPress s određene stranice.

Parser za WordPress blog može pomoći u rješavanju mnogih problema, evo nekih od njih:
— početno punjenje resursa (parser web mjesta za WordPress omogućit će vam da svoj blog popunite informacijama od nule do potrebne količine u najkraćem mogućem vremenu);
— stvaranje bloga s automatskim popunjavanjem (parser WordPressa moći će osigurati redovito automatsko ažuriranje sadržaja stranice)
— objavljivanje sadržaja “prema rasporedu” (možete zakazati vrijeme za dodavanje postova na svoju stranicu)

Skupno objavljivanje u WordPressu

Parser za WordPress predstavljen u Datacolu jasan je primjer korištenja parsera za masovno objavljivanje. Omogućuje vam da automatski primate sadržaj i objavljujete ga na svom blogu. Proces struganja WordPressa može se podijeliti u nekoliko faza:

1) Proces prikupljanja sadržaja. WordPress parser prikuplja potrebne podatke za svaki blog post: naslov, sadržaj (preuzet sa slikama koje se spremaju na vaše računalo za daljnje preuzimanje putem FTP-a na vaš server), kategoriju, autora i poveznicu s koje su podaci prikupljeni (URL).

2) Spremanje informacija koje je prikupio parser za WordPress. Nakon parsiranja, prikupljeni podaci se spremaju u TXT datoteke (svaka objava se sprema u posebnu tekstualnu datoteku), čiji se nazivi generiraju u skladu s naslovom objave.

3) Izvezite WordPress. Također je moguće izravno izvesti raščlanjene informacije na vaš WordPress blog. To čini proces punjenja vrlo brzim i eliminira mogućnost ljudske pogreške. Mogućnost izvoza u WordPress uključena je u osnovnu funkcionalnost programa. U postavkama programa morate navesti parametre za povezivanje s blogom te navesti podatke za izvoz (naslov, sadržaj, kategorija itd.)

4) Obrada informacija. Ako želite, informacije prikupljene tijekom postupka parsiranja WordPressa mogu se obraditi (na primjer, podvrgnuti automatskom prijevodu ili sinonimizaciji). Ove se značajke implementiraju pomoću dodataka.

Kako analizirati WordPress stranicu?

Ne samo da možete objaviti raščlanjene informacije u WordPressu, već ih možete i izvući iz njega. Zadatak korištenja tuđih WordPress blogova kao izvora sadržaja za vaše blogove javlja se prilično često. Da biste riješili ovaj problem, pomoći će vam parser WordPress stranice. Algoritam za rad s parserom WordPress stranice sličan je gore opisanom.

Prednosti WordPress parsera web stranica

Vjerojatno ste već uvjereni da će vam parser WordPress bloga pomoći da ne trošite puno vremena i truda na ručno popunjavanje bloga. Zahvaljujući njemu, ne samo da možete automatizirati svoj rad, već i povećati njegovu učinkovitost. Parser za WordPress, implementiran unutar Datacola, možete preuzeti na

Testiranje parsera bloga

Za testiranje parsera bloga:

Korak 2. Stablo kampanje sadrži kampanju content-parsers/kolchaka-net.par. Odaberite ga i kliknite gumb Reproduciraj. Prije početka možete urediti Ulazne podatke. Na ovaj način možete postaviti poveznicu na blog ili stranice bloga s kojih ćete analizirati sadržaj.

Korak 3. Pričekajte da se pojave rezultati analize bloga. Nakon što se pojave rezultati, možete prisilno zaustaviti raščlanjivanje (klikom na gumb Stop).

kliknite na sliku za povećanje

Korak 4. Nakon završetka/prisilnog zaustavljanja parsera u mapi Moji dokumenti možete pronaći tekstualne datoteke(svaka objava se sprema u zasebnu datoteku), čiji se nazivi generiraju na temelju naslova objave:

kliknite na sliku za povećanje

Predstavljam vam univerzalno WordPress grabber WP UniParser. Ovaj dodatak je univerzalni prilagodljivi parser. Prilikom izrade postova, dodatak može prevoditi sadržaj putem Google servis Prevedite koristeći bilo koji jezični par.

Recenzije kupaca

Moderatori su izbrisali temu na serveru, gdje je bilo oko 6-7 recenzija (kažu da proizvod ne zadovoljava pravila foruma). Ipak, može se pročitati jedna recenzija na Mulnet forumu i Armadi. Tu su i recenzije blogera: ovdje i ovdje. Nedavno sam slučajno naišao na recenziju.

Osnovna funkcionalnost

Dodatak WP UniParser koji sam izradio može učiniti sljedeće:
izvući sadržaj iz web stranice na svim motorima(parser je konfiguriran pomoću regularni izrazi i niz ograničenja, postavljanje je vrlo jednostavno, objasnit ću i pokazati sve, osim toga, postoji );
izrežite skripte, komentare, poveznice, obrasce, slike, raspone, objekte, kao i sve fragmente koje odredite iz sadržaja.
objava plana postovi;
stavite analizirane materijale u kategoriju koju definirate (ili ih nasumično rasporedite u kategorije);
ostvariti automatski prijevod(u bilo kojem smjeru) na svim podržanim jezicima Google prevoditelj.

Možete saznati više o skupu funkcija dodatka na snimci zaslona njegove administratorske ploče:

Također je vrijedno u potpunosti razumjeti rad univerzalnog hvatača.

Ponekad nema smisla trošiti vrijeme sami na pisanje teksta za WordPress stranicu. Ovo se ne odnosi na blogove i informativne stranice, budući da se njihov prihod ostvaruje upravo zahvaljujući objavljenim objavama.

A govorimo o internetskim trgovinama, web stranicama tvrtki i novinski portali, nije dizajniran za organski promet. Za takve resurse jedinstveni materijali nisu toliko važni koliko njihovo stalno ažuriranje.

Da biste napravili web mjesto s automatskim popunjavanjem, morat ćete postaviti parser vijesti za svoj projekt. Prvo morate pronaći prikladna mjesta s kojih ćete strugati. Moraju odgovarati temi vašeg projekta, inače nema smisla duplicirati informacije iz njih. Ako je to slučaj, tada morate prijeći na drugi dio rješenja problema s raščlanjivanjem - ovako ćete klonirati tekst s drugog mjesta. Najprimitivnija i najneprikladnija metoda je ručno kopiranje. Ali puno je pametnije upotrijebiti jedan od dodataka navedenih u ovom članku za aktiviranje uspješnog parsera vijesti i sadržaja.

WP-O-Matic

Vrlo popularan modul za WordPress koji će vam omogućiti da postavite funkcionalni parser vijesti s drugih stranica. Alat postavlja na jednostavan način: bilo izravno učitavanjem u mapu na hostingu ili putem kartice "Dodaci".

Zatim morate konfigurirati dodatak ako želite osigurati raščlanjivanje sadržaja. Da biste to učinili, samo četiri puta kliknite “Dalje” i na kraju “Pošalji”. Time potvrđujete svoju suglasnost s uvjetima korištenja ovih podataka WordPress modul. Konkretno, slažete se da ste sami odgovorni za krađu tuđih materijala, sadržaja s drugih stranica, itd.

Ako vas osim tekstualne komponente zanimaju i slike, tada morate u mapi s dodatkom napraviti direktorij pod nazivom Cache. Postavite posebna prava pristupa ovoj mapi. Zatim ćete se morati vratiti u administratorsko područje WordPressa. Idite na postavke dodatka i pažljivo pogledajte postoji li kvačica pokraj stavke Unix cron. Morate potvrditi okvir Cache Image kako bi analizator vijesti također kopirao slike u vaš resurs.

Modul WP-O-Matic je dobar jer radi na bilo kojoj stranici web mjesta. Možete dodati zasebnu kategoriju ako želite da se tamo prikazuje popis vijesti i sadržaja koje nudi parser. Da biste to učinili, prvo stvorite potrebnu kategoriju. Zatim u WordPress administratoru u postavkama alata WP-O-Matic kliknite Dodaj kampanju. U retku Kategorije označite posebnu kategoriju koju ste stvorili. I u obrazac Feeds unesite RSS feed koji ćete analizirati. Možete unijeti nekoliko URL-ova za feedove odjednom, tako da parser teksta prikuplja informacije iz tri ili čak četiri izvora odjednom.

I još jedan veliki plus u smjeru dodatka WP-O-Matic je automatsko objavljivanje materijala. Ne morate se svaki sat prijavljivati ​​u svog WordPress administratora da biste promijenili status svojih objava u "Objavljeno". Modul će to učiniti sam. A ako želite, može unikatizirati tekst kroz poseban mehanizam sinonimizacije. Ovo je ključna razlika ovaj alat od svog konkurenta – dodatka FeedWordPress.

Datacol

Ovo je funkcionalna grabilica koja je prikladna ne samo za WordPress motor. Ovo nije samo analizator teksta za web stranice - to je pametna aplikacija koja vam omogućuje filtriranje kopiranog materijala. Na primjer, moći ćete objavljivati ​​samo članke koji sadrže određene ključne riječi. Vijesti možete duplicirati izravno s Yandexa. Klonirani materijali bit će izvezeni u jedan od 15 dostupnih formata. Usluga će prikupljati ne samo tekst, već i naslove, fotografije, datum objave, poveznice i druge važne podatke.

Ali Datacol se distribuira na plaćenoj osnovi. Međutim, puno je jeftinije nego da ste naručili materijal na stranicu putem razmjena. Aplikacija košta manje od 500 rubalja i može se koristiti za gotovo svaki motor. Postoji demo verzija.

FDE grabilica

Još jedan plaćeni parser s velikim brojem funkcija. Ovo je već u kategoriji skupih grabbera, jer će koštati oko 90 dolara. Ali bit će moguće koristiti ga na 10 poslužitelja odjednom, odnosno, u teoriji, različiti webmasteri mogu ubaciti 9 dolara i tako kupnju učiniti jeftinijom.

FDE Grabber nije baš WordPress dodatak. Programeri svoju kreaciju nazivaju autonomnim sustavom koji radi bez obzira na vrstu CMS-a instaliranog na web mjestu. Glavne značajke ovog sustava parsiranja:

  • preuzimanje cjelovitih vijesti ili pojedinačnih fragmenata;
  • možete zakazati publikacije;
  • ako želite unikatizirati duplicirani materijal, postoji ugrađena funkcija sinonimizacije;
  • možete raditi preko proxy poslužitelja;
  • parsiranje može zaobići preusmjeravanja, što može biti problem za druge dodatke;
  • možete automatski preuzeti sav sadržaj sa stranice i premjestiti ga na svoju stranicu (ako se radi o portalima koji nisu novinski);

Parsiranje možete u potpunosti postaviti prema vlastitom nahođenju, budući da program ima mogućnost implementacije mikroprograma za ispravljanje rada. Na primjer, na ovaj način možete konfigurirati značajke poravnanja i dizajna kopiranog materijala. Također možete dodati parametre noindex i nofollow za sve poveznice koje će biti u tekstu stranice. Parser vam čak omogućuje kopiranje i automatski prijevod članaka iz stranih izvora. Ovo je sjajan način za stvaranje stalnog toka sadržaja na vašim stranicama koji će s vremenom početi privlačiti posjetitelje!

Prilično moćan univerzalni parser za WordPress. Omogućuje prikupljanje sadržaja iz jednog ili više izvora i njegovu obradu, prilagođavanje potrebnom formatu koristeći sve mogućnosti PHP jezika. Postoji mogućnost odgođenog parsiranja. Najbolji besplatni parser za wordpress u ovom trenutku - AftParser vam je uvijek na usluzi!

Kratak opis funkcionalnosti:

Parser se sastoji od 4 stranice: početna stranica, stranica parsera poveznica, stranica parsera RSS feedova i stranica postavki. Evo kako će izgledati nakon instalacije:

Pažnja: Možete pročitati kako konfigurirati AftParser.

Počnimo s početna stranica. Prikazuje popis parsera koji se trenutno izvode.

Objašnjenja su navedena u blokovima na svakoj stranici. Sva dokumentacija dolazi iz kutije; samo je pažljivo pročitajte kako bi sve bilo jasno.

Parser web stranice:

Stranica parsera web-mjesta omogućuje vam analizu podataka iz jednog ili više izvora. Vi samo trebate dati veze na materijale.

Što? Previše ste lijeni da pretražujete web i ručno prikupljate materijale? Ne očajavajte - sve je automatizirano.

Postoje dva alata koja vam omogućuju automatsko popunjavanje popisa veza.

- vrsta emulacije pretraživač. Robot će sam hodati stranicama web-mjesta koje su mu prenesene i prikupljati sve interne poveznice s njih.

Naravno, popis poveznica ispunjen automatskim algoritmima bit će jako zakrčen nepotrebnim podacima. I tu vam u pomoć dolaze filteri.

- najjednostavniji i brz način filtracija. Vi unesete uvjete i filter sam izvrši obradu.

Napredni filtar veza- filtar veza koji vam omogućuje da promijenite njihov sadržaj i učinite hrpu drugih stvari. Samo za napredne korisnike. Savjetujem vam da naučite php prije nego bilo što radite tamo.

Ako ste dovršili prikupljanje veza, sljedeći korak je dodavanje granica sadržaja.

Pomoću ovih granica parser će odrediti područja koja treba obraditi.

Označavanje sintakse implementirano je pomoću uređivača javascripta ACE. Sva dokumentacija i sve dostupne funkcije nalaze se na stranici dodatka. Popis je vrlo impresivan i ne mogu ga ovdje iznijeti jer je ovaj materijal već jako dugačak. Samo instalirajte dodatak i čitajte, bit ćete impresionirani, jamčim to.

Ovako izgleda stranica Parser RSS feedova, s jedinom razlikom što nema zahtjeva za pružanje popisa poveznica.

Postoji dosta područja djelovanja u kojima se parser može koristiti, ali uglavnom je to prikupljanje raznih informacija. Možete brzo prikupiti slike i poveznice samo programski. Korištenje parsera za traženje informacija omogućuje automatizaciju ovog procesa, značajno štedeći vrijeme. Ako imate web stranicu na Wordpressu, možete je jednostavno automatski popuniti pomoću parsera AftParser.

je besplatni, univerzalni parser za WordPress. omogućuje prikupljanje sadržaja s jedne ili različiti izvori, obrađujući ga pod potreban format u PHP jeziku. Parser je napravljen kao dodatak za WordPress. Nakon što normalno instalirate dodatak, u WordPress konzoli će se pojaviti izbornik parsera, kao na slici.

Parser implementira dva glavna alata: WordPress parser web stranice i Wordpress rss parser.

Parser za WordPress može:

1. Raščlanjuje podatke s poveznica

Samo trebate dati poveznice na izvor. Ako nema veza, može ih prikupiti parser. Navedite put do karte web mjesta i grabber će prikupiti sve poveznice. Ili možete skupljati veze s bilo kojeg html stranice. Veze je moguće filtrirati prema željenim kriterijima. Postoje dva filtera veza pomoću kojih možete promijeniti uvjete parsiranja. Iskusni korisnici mogu sami kreirati makronaredbe za raščlanjivanje, što čini raščlanjivač vrlo fleksibilnim da odgovara njihovim potrebama.

2.Raščlanjuje podatke RSS kanala

Ovdje je sve jednostavno, unesite željeni URL feeda i kliknite početak parsiranja.
Jedna od mogućih upotreba parsera za Wordpress je popunjavanje stupaca vijesti na vašoj web stranici korištenjem izvora informacija kao što su blogovi, RSS feedovi, VKontakte stranice itd. Konkurenti - WP-O-Matic, FeedWordPress, CyberSyn.