Parser blogova sa izvozom u WordPress. Moj WP Uniparser dodatak je univerzalni parser za automatsko popunjavanje blogova!!! Grupno objavljivanje u WordPress-u

Parser za WordPress je Datacol postavka dizajnirana za prikupljanje sadržaja (vijesti, članaka, recenzija, itd.) s daljnjim izvozom u WordPress CMS.

U ovom primjeru, rezultirajući sadržaj se izvozi u . Rezultati za svaki post se pohranjuju u zaseban fajl, čiji se naslov generiše na osnovu naslova posta, a sadržaj se generiše na osnovu raščlanjenih informacija. Također možete postaviti direktan izvoz na svoj WordPress blog. Kako to učiniti prikazano je u videu.

Možete besplatno testirati parser za WordPress u demo verziji programa.
Glavne prednosti WordPress parsera baziranog na Datacol su:

  • Mogućnost prilagođavanja parsiranja za WordPress posebno prema vašim potrebama (od vas ili).
  • Mogućnost dalje obrade prikupljenih podataka pomoću dodataka i učitavanja u .
  • Mogućnost cikličkog pokretanja kampanja. Kada će rezultati prvog zadatka raščlanjivanja biti ulaz za drugi zadatak prikupljanja podataka. Čitaj više.

Kako se parser koristi za WordPress?

Ako ste kreirali blog, onda vam nakon nekog vremena postaje jasno da je za njegovu promociju stalno potreban novi jedinstveni sadržaj. I postajete previše lijeni da sami pišete članke i ručno popunjavate web stranicu. Ali gdje možete nabaviti novi sadržaj? Prije ili kasnije dođe vrijeme kada želite da pribjegnete autobloggingu. Jednostavno rečeno, koristite parser koji će sam objaviti informacije koje su nam potrebne. Parser sadržaja za WordPress pomoći će nam da se nosimo s ovim zadatkom.

Sve web stranice su u nekom trenutku kreirane od nule. Ali ako je svrha vaše stranice pružanje informacija, ona će postati zanimljiva tek kada količina informacija premaši određenu količinu. WordPress blog parser je odlično rješenje za takav zadatak. Uz njegovu pomoć možete sustići svoje konkurente u kratkom vremenu, značajno proširujući katalog informacija na stranici. WordPress parser se može implementirati kao grabber za WordPress sa određene stranice.

Parser za WordPress blog može pomoći u rješavanju mnogih problema, evo nekih od njih:
— početno popunjavanje resursa (parser stranice za WordPress će vam omogućiti da svoj blog popunite informacijama od nule do potrebnog volumena u najkraćem mogućem roku);
— kreiranje bloga koji se automatski popunjava (WordPress parser će moći osigurati redovno automatsko ažuriranje sadržaja stranice)
— objavljivanje sadržaja „po rasporedu“ (možete zakazati vrijeme za dodavanje objava na svoju web stranicu)

Grupno objavljivanje u WordPress-u

Parser za WordPress predstavljen u Datacolu je jasan primjer korištenja parsera za masovno objavljivanje. Omogućava vam da automatski primate sadržaj i objavljujete ga na svom blogu. WordPress proces scraping-a može se podijeliti u nekoliko faza:

1) Proces prikupljanja sadržaja. WordPress parser prikuplja potrebne informacije za svaki blog post: naslov, sadržaj (preuzet sa slikama koje se čuvaju na vašem računaru za dalje preuzimanje preko FTP-a na vaš server), kategoriju, autora i link sa kojeg su podaci prikupljeni (URL).

2) Čuvanje informacija prikupljenih od strane parsera za WordPress. Nakon raščlanjivanja, prikupljene informacije se spremaju u TXT datoteke (svaka objava se čuva u zasebnom tekstualnom fajlu), čiji se nazivi generišu u skladu sa naslovom posta.

3) Izvezite WordPress. Također je moguće direktno izvesti raščlanjene informacije na vaš WordPress blog. Ovo čini proces punjenja veoma brzim i eliminiše mogućnost ljudskih grešaka. Mogućnost izvoza u WordPress uključena je u osnovnu funkcionalnost programa. Morate navesti parametre za povezivanje na vaš blog u postavkama programa i navesti podatke za izvoz (naslov, sadržaj, kategorija, itd.)

4) Obrada informacija. Po želji, informacije prikupljene tokom procesa raščlanjivanja WordPress-a mogu se obraditi (na primjer, podvrgnuti automatskom prijevodu ili sinonimizaciji). Ove funkcije se implementiraju pomoću dodataka.

Kako raščlaniti WordPress stranicu?

Ne samo da možete objaviti raščlanjene informacije u WordPress-u, već ih možete i izvući iz njega. Zadatak korištenja tuđih WordPress blogova kao izvora sadržaja za svoje blogove javlja se prilično često. Da biste riješili ovaj problem, pomoći će vam parser WordPress stranice. Algoritam za rad sa WordPress parserom sajta sličan je gore opisanom.

Prednosti WordPress Website Parser

Vjerovatno ste već uvjereni da će vam WordPress parser blogova pomoći da ne trošite puno vremena i truda na ručno popunjavanje bloga. Zahvaljujući njemu, ne samo da možete automatizirati svoj rad, već i povećati njegovu efikasnost. Parser za WordPress, implementiran unutar Datacola, možete preuzeti na adresi

Testiranje parsera bloga

Da testirate parser bloga:

Korak 2. Stablo kampanje sadrži kampanju content-parsers/kolchaka-net.par. Odaberite ga i kliknite na dugme Play. Prije početka, možete urediti ulazne podatke. Na ovaj način možete postaviti vezu do bloga ili stranica bloga sa kojih ćete analizirati sadržaj.

Korak 3. Sačekajte da se pojave rezultati analize bloga. Nakon što se rezultati prikažu, možete nasilno zaustaviti raščlanjivanje (klikom na dugme Stop).

kliknite na sliku za uvećanje

Korak 4. Nakon završetka/prinudnog zaustavljanja parsera možete pronaći u folderu Moji dokumenti tekstualne datoteke(svaka objava se čuva u posebnoj datoteci), čiji se nazivi generišu na osnovu naslova postova:

kliknite na sliku za uvećanje

Predstavljam vam univerzalno WordPress grabber WP UniParser. Ovaj dodatak je univerzalni prilagodljivi parser. Prilikom kreiranja postova, dodatak može prevesti sadržaj putem Google usluga Prevodite koristeći bilo koji jezički par.

Recenzije kupaca

Temu na serveru, gdje je bilo oko 6-7 recenzija, moderatori su izbrisali (kažu da proizvod ne zadovoljava pravila foruma). Ipak, jedna recenzija se može pročitati na Mulnet forumu i Armadi. Tu su i recenzije blogera: ovdje i ovdje. Nedavno sam slučajno naišao na recenziju.

Osnovna funkcionalnost

Dodatak WP UniParser koji sam kreirao može učiniti sljedeće:
izvući sadržaj iz stranice na bilo kojim motorima(parser je konfigurisan pomoću regularni izrazi i niz ograničenja, podešavanje je vrlo jednostavno, sve ću objasniti i pokazati, osim toga postoji i );
izrežite skripte, komentare, veze, forme, slike, raspone, objekte, kao i sve fragmente koje odredite iz sadržaja.
objava plana stupovi;
stavite raščlanjene materijale u kategoriju koju definišete (ili ih nasumično rasporedite u kategorije);
shvatiti automatski prevod(u bilo kojem smjeru) na svim podržanim jezicima Google prevodilac.

Možete saznati više o skupu funkcija dodatka na snimku ekrana njegovog admin panela:

Također je vrijedno u potpunosti razumjeti rad univerzalnog grabbera.

Ponekad nema smisla trošiti vrijeme na pisanje teksta za WordPress stranicu. Ovaj slučaj se ne odnosi na blogove i informativne stranice, jer se njihov prihod ostvaruje upravo zahvaljujući objavljenim objavama.

A govorimo o internet trgovinama, web stranicama kompanija i novinski portali, nije dizajniran za organski promet. Za takve resurse jedinstveni materijali nisu toliko važni koliko njihovo stalno ažuriranje.

Da biste napravili web lokaciju za automatsko popunjavanje, morat ćete postaviti parser vijesti za svoj projekt. Prvo morate pronaći odgovarajuća mjesta s kojih ćete skidati. Moraju odgovarati temi vašeg projekta, inače nema smisla umnožavati informacije od njih. Ako je to slučaj, onda morate prijeći na drugi dio rješenja za problem raščlanjivanja - ovako ćete klonirati tekst s druge stranice. Najprimitivnija i najnezgodnija metoda je ručno kopiranje. Ali mnogo je mudrije koristiti jedan od dodataka navedenih u ovom članku da aktivirate uspješan parser vijesti i sadržaja.

WP-O-Matic

Vrlo popularan modul za WordPress koji će vam omogućiti da postavite funkcionalni parser vijesti sa drugih stranica. Alat je instaliran od strane na jednostavan način: ili putem upload-a direktno u folder na hostingu, ili preko kartice “Plugins”.

Zatim morate konfigurirati dodatak ako želite osigurati raščlanjivanje sadržaja. Da biste to uradili, samo kliknite na „Dalje“ četiri puta i na kraju „Pošalji“. Time potvrđujete da se slažete sa uslovima korišćenja ovih podataka WordPress modul. Konkretno, slažete se da ste sami odgovorni za krađu tuđih materijala, sadržaja sa drugih stranica itd.

Ako vas, osim tekstualne komponente, zanimaju i slike, onda morate kreirati direktorij pod nazivom Cache u folderu s dodatkom. Postavite posebna prava pristupa ovom folderu. Zatim ćete morati da se vratite na WordPress admin oblast. Idite na postavke dodatka i pažljivo pogledajte da li postoji kvačica pored Unix cron stavke. Morate afirmativno označiti polje Cache Image tako da parser vijesti također kopira slike u vaš resurs.

WP-O-Matic modul je dobar jer radi na bilo kojoj stranici sajta. Možete dodati posebnu kategoriju ako želite da se tamo prikaže lista vijesti i sadržaja koje je dao parser. Da biste to učinili, prvo kreirajte potrebnu kategoriju. Zatim u WordPress administratoru u postavkama alata WP-O-Matic kliknite Dodaj kampanju. U liniji Kategorije označite posebnu kategoriju koju ste kreirali. I u obrascu Feeds unesite RSS feed koji ćete analizirati. Možete unijeti nekoliko URL-ova za feedove odjednom, tako da analizator teksta prikuplja informacije od tri ili čak četiri izvora odjednom.

I još jedan veliki plus u pravcu dodatka WP-O-Matic je automatsko objavljivanje materijala. Ne morate se svaki sat prijavljivati ​​na svog WordPress administratora da biste promijenili status svojih objava u "Objavljeno". Modul će to učiniti sam. A ako želite, može jedinstveni tekst kroz poseban mehanizam sinonimizacije. Ovo je ključna razlika ovaj alat od svog konkurenta – dodatka FeedWordPress.

Datacol

Ovo je funkcionalni grabber koji je pogodan ne samo za WordPress engine. Ovo nije samo analizator teksta za web stranice - to je pametna aplikacija koja vam omogućava da filtrirate kopirani materijal. Na primjer, moći ćete objavljivati ​​samo članke koji sadrže određene ključne riječi. Možete duplirati vijesti direktno iz Yandexa. Klonirani materijali će biti izvezeni u jednom od 15 dostupnih formata. Usluga će prikupljati ne samo tekst, već i naslove, fotografije, datum objavljivanja, linkove i druge važne podatke.

Ali Datacol se distribuira na plaćenoj osnovi. Međutim, to je mnogo jeftinije nego da ste naručili materijal na stranici putem mjenjačnica. Aplikacija košta manje od 500 rubalja i može se koristiti za gotovo svaki motor. Postoji demo verzija.

FDE Grabber

Još jedan plaćeni parser sa velikim brojem funkcija. Ovo je već u kategoriji skupih grabbera, jer će koštati oko 90 dolara. Ali biće moguće koristiti ga na 10 servera odjednom, odnosno, u teoriji, različiti webmasteri mogu ubaciti 9 dolara, čime će kupovina biti jeftinija.

FDE Grabber nije baš WordPress dodatak. Programeri svoju kreaciju nazivaju autonomnim sistemom koji radi bez obzira na vrstu CMS-a instaliranog na stranici. Glavne karakteristike ovog sistema za raščlanjivanje:

  • preuzimanje cjelovitih vijesti ili pojedinačnih fragmenata;
  • možete zakazivati ​​objave;
  • ako želite da unikatujete duplikat materijala, postoji ugrađena funkcija sinonimizacije;
  • možete raditi preko proxy servera;
  • raščlanjivanje može zaobići preusmjeravanja, što može biti problem za druge dodatke;
  • možete automatski preuzeti sav sadržaj sa stranice i premjestiti ga na svoju stranicu (ako se radi o portalima koji nisu novinski);

Možete postaviti raščlanjivanje u potpunosti prema vlastitom nahođenju, jer program ima mogućnost implementacije mikroprograma za ispravljanje posla. Na primjer, na ovaj način možete konfigurirati karakteristike poravnanja i dizajna kopiranog materijala. Također možete dodati parametre noindex i nofollow za sve veze koje će biti u tekstu stranice. Parser vam čak omogućava da kopirate i automatski prevodite članke sa stranih izvora. Ovo je odličan način da kreirate stalan tok sadržaja na vašim stranicama koji će vremenom početi privlačiti posjetitelje!

Prilično moćan univerzalni parser za WordPress. Omogućava vam da prikupite sadržaj iz jednog ili više izvora i obradite ga, prilagođavajući ga potrebnom formatu koristeći sve mogućnosti PHP jezika. Postoji mogućnost odgođenog raščlanjivanja. Najbolji besplatni parser za wordpress u ovom trenutku - AftParser vam je uvijek na usluzi!

Kratak opis funkcionalnosti:

Parser se sastoji od 4 stranice: početna stranica, stranica parsera linkova, stranica parsera RSS feeda i stranica s postavkama. Evo kako će to izgledati nakon instalacije:

pažnja: Možete pročitati kako konfigurirati AftParser.

Počnimo sa početna stranica. Prikazuje listu parsera koji su trenutno pokrenuti.

Objašnjenja su data u blokovima na svakoj stranici. Sva dokumentacija dolazi iz kutije; samo je pažljivo pročitajte da sve bude jasno.

Parser web stranice:

Stranica parsera stranice vam omogućava da analizirate podatke iz jednog i više izvora. Potrebno je samo da navedete linkove do materijala.

Šta? Previše ste lijeni da pretražujete internet i prikupljate materijale ručno? Ne očajavajte – sve je automatizovano.

Postoje dva alata koji vam omogućavaju da automatski popunite svoju listu veza.

- vrsta emulacije pretraživač. Robot će sam prošetati stranicama stranice koje su mu prenesene i sa njih prikupiti sve interne linkove.

Naravno, lista linkova ispunjenih automatskim algoritmima bit će jako zakrčena nepotrebnim podacima. I tu vam filteri dolaze u pomoć.

- najjednostavniji i brz način filtracija. Unesete uslove i filter sam izvrši obradu.

Napredni filter linkova- filter linkova koji vam omogućava da promijenite njihov sadržaj i uradite gomilu drugih različitih stvari. Samo za napredne korisnike. Savjetujem vam da naučite php prije nego što bilo šta radite tamo.

Ako ste završili kolekciju linkova, sljedeći korak je dodavanje granica sadržaja.

Koristeći ove granice, parser će odrediti područja koja treba obraditi.

Isticanje sintakse je implementirano pomoću javascript editora ACE. Sva dokumentacija i sve dostupne funkcije nalaze se na stranici dodatka. Lista je vrlo impresivna i ne mogu je ovdje predstavljati, jer je ovaj materijal već jako dugačak. Samo instalirajte dodatak i čitajte, bit ćete impresionirani, garantiram.

Ovako izgleda stranica Parser RSS feeda, sa jedinom razlikom što ne postoji obaveza davanja liste linkova.

Postoji dosta područja aktivnosti u kojima se može koristiti parser, ali uglavnom je to prikupljanje različitih informacija. Slike i veze možete brzo prikupiti samo programski. Korištenje parsera za traženje informacija omogućava vam da automatizirate ovaj proces, značajno štedeći vrijeme. Ako imate web stranicu na Wordpress-u, lako je možete automatski popuniti pomoću parsera AftParser.

je besplatan, univerzalni parser za WordPress. omogućava prikupljanje sadržaja od jednog ili različitih izvora, obrada pod potreban format u PHP jeziku. Parser je napravljen kao dodatak za WordPress. Nakon normalnog instaliranja dodatka, meni za parser će se pojaviti u WordPress konzoli, kao na slici.

Parser implementira dva glavna alata: raščlanjivač WordPress stranice i rss raščlanjivač Wordpress.

Parser za WordPress može:

1.Razbir podataka sa linkova

Potrebno je samo da navedete linkove do izvora. Ako nema veza, može ih prikupiti parser. Navedite putanju do mape stranice i grabber će prikupiti sve veze. Ili možete prikupiti veze od bilo kojeg html stranice. Linkovi se mogu filtrirati prema željenim kriterijima. Postoje dva filtera veza pomoću kojih možete promijeniti uslove raščlanjivanja. Iskusni korisnici mogu sami kreirati makroe za raščlanjivanje, što parser čini vrlo fleksibilnim da odgovara njihovim potrebama.

2.Razbir podataka RSS feeda

Ovdje je sve jednostavno, unesite željeni URL feeda i kliknite na početak raščlanjivanja.
Jedna od mogućih upotreba parsera za Wordpress je popunjavanje stupaca vijesti na vašoj web stranici koristeći izvore informacija kao što su blogovi, RSS feedovi, VKontakte stranice itd. Konkurenti - WP-O-Matic, FeedWordPress, CyberSyn.