Blogg-parser med eksport til WordPress. Min WP Uniparser-plugin er en universell parser for automatisk utfylling av blogger!!! Masseinnlegg i WordPress

En parser for WordPress er en Datacol-innstilling designet for å samle innhold (nyheter, artikler, anmeldelser, etc.) med videre eksport til WordPress CMS.

I dette eksemplet eksporteres det resulterende innholdet til . Resultatene for hvert innlegg lagres i egen fil, hvis tittel genereres basert på innleggstittelen, og innholdet genereres basert på den analyserte informasjonen. Du kan også sette opp direkte eksport til WordPress-bloggen din. Hvordan du gjør dette er vist i videoen.

Du kan teste parseren for WordPress gratis i demoversjonen av programmet.
De viktigste fordelene med den Datacol-baserte WordPress-parseren er:

  • Muligheten til å tilpasse parsing for WordPress spesielt for å passe dine behov (av deg eller).
  • Muligheten til å viderebehandle de innsamlede dataene ved hjelp av plugins og også laste dem inn i .
  • Mulighet for syklisk lansering av kampanjer. Når resultatene av den første analyseoppgaven vil være input til den andre datainnsamlingsoppgaven. Les mer.

Hvordan brukes parseren for WordPress?

Hvis du har opprettet en blogg, blir det etter en tid klart for deg at det hele tiden trengs nytt unikt innhold for å promotere den. Og du blir for lat til å skrive artikler selv og fylle ut siden manuelt. Men hvor kan vi få nytt innhold? Før eller siden kommer tiden da du vil ty til autoblogging. Enkelt sagt, bruk en parser som publiserer informasjonen vi trenger på egen hånd. En innholdsparser for WordPress vil hjelpe oss med å takle denne oppgaven.

Alle nettsider har på et tidspunkt blitt laget fra bunnen av. Men hvis formålet med nettstedet ditt er å gi informasjon, vil det først bli interessant når informasjonsmengden overstiger en viss mengde. WordPress-bloggparseren er en utmerket løsning for en slik oppgave. Med dens hjelp kan du ta igjen konkurrentene dine på kort tid, og utvide nettstedets informasjonskatalog betydelig. WordPress-parseren kan implementeres som en grabber for WordPress fra et spesifikt nettsted.

Parser for WordPress blogg kan hjelpe med å løse mange problemer, her er noen av dem:
— innledende fylling av ressursen (en side-parser for WordPress lar deg fylle bloggen din med informasjon fra bunnen av til det nødvendige volumet på kortest mulig tid);
- opprettelse av en automatisk fylt blogg (WordPress-parseren vil kunne sikre regelmessig automatisk oppdatering av nettstedets innhold)
- publisering av innhold "på en tidsplan" (du kan planlegge tidspunktet for å legge til innlegg på nettstedet ditt)

Masseinnlegg i WordPress

Parseren for WordPress presentert i Datacol er et tydelig eksempel på bruk av en parser for massepostering. Den lar deg automatisk motta innhold og publisere det på bloggen din. WordPress-skrapeprosessen kan deles inn i flere stadier:

1) Prosessen med å samle innhold. WordPress-parseren samler inn nødvendig informasjon for hvert blogginnlegg: tittel, innhold (lastet ned med bilder som er lagret på datamaskinen din for videre nedlasting via FTP til serveren), kategori, forfatter og lenke som dataene ble samlet inn fra (URL).

2) Lagre informasjon samlet inn av parseren for WordPress. Etter parsing lagres den innsamlede informasjonen i TXT-filer (hvert innlegg lagres i en egen tekstfil), hvis navn genereres i samsvar med tittelen på innlegget.

3) Eksporter WordPress. Det er også mulig å eksportere analysert informasjon direkte til WordPress-bloggen din. Dette gjør fyllingsprosessen veldig rask og eliminerer muligheten for menneskelige feil. Muligheten til å eksportere til WordPress er inkludert i den grunnleggende funksjonaliteten til programmet. Du må spesifisere parametrene for å koble til bloggen din i programinnstillingene og spesifisere dataene som skal eksporteres (tittel, innhold, kategori, etc.)

4) Informasjonsbehandling. Om ønskelig kan informasjonen som samles inn under WordPress-parsingsprosessen behandles (for eksempel underkastes automatisk oversettelse eller synonymisering). Disse funksjonene implementeres ved hjelp av plugins.

Hvordan analysere et WordPress-nettsted?

Du kan ikke bare publisere analysert informasjon i WordPress, men du kan også skrape den fra den. Oppgaven med å bruke andres WordPress-blogger som innholdskilde for bloggene dine dukker opp ganske ofte. For å løse dette problemet vil en WordPress-nettstedsparser hjelpe deg. Algoritmen for å jobbe med en WordPress-nettstedparser er lik den som er beskrevet ovenfor.

Fordeler med WordPress Website Parser

Du er sannsynligvis allerede overbevist om at WordPress-bloggparseren vil hjelpe deg med å ikke bruke mye tid og krefter på å fylle bloggen din manuelt. Takket være det kan du ikke bare automatisere arbeidet ditt, men også øke effektiviteten. Du kan laste ned parseren for WordPress, implementert i Datacol, på

Tester bloggparseren

For å teste bloggparseren:

Trinn 2. Kampanjetreet inneholder content-parsers/kolchaka-net.par-kampanjen. Velg den og klikk på Spill av-knappen. Før du starter, kan du redigere inndataene. På denne måten kan du sette en lenke til bloggen eller bloggsidene som du vil analysere innhold fra.

Trinn 3. Vent til resultatene fra bloggparseren vises. Etter at resultatene vises, kan du tvangsstoppe parsingen (ved å klikke på Stopp-knappen).

klikk på bildet for å forstørre

Trinn 4. Etter å ha fullført/tvangsstoppet parseren i Mine dokumenter-mappen kan du finne tekstfiler(hvert innlegg lagres i en egen fil), hvis navn genereres basert på innleggstitlene:

klikk på bildet for å forstørre

Jeg presenterer for deg det universelle WordPress-grabber WP UniParser. Denne plugin er universell tilpassbar parser. Ved opprettelse av innlegg kan plugin-en oversette innhold via Google-tjeneste Oversett med alle språkpar.

Kunde anmeldelser

Emnet på serveren, hvor det var omtrent 6-7 anmeldelser, ble slettet av moderatorer (de sier at produktet ikke oppfyller forumreglene). En anmeldelse kan likevel leses på Mulnet-forumet og Armada. Det er også anmeldelser fra bloggere: her og her. Ganske nylig kom jeg tilfeldigvis over en anmeldelse.

Grunnleggende funksjonalitet

WP UniParser-pluginen jeg opprettet kan gjøre følgende:
hente innhold fra nettsteder på alle motorer(parseren er konfigurert med vanlig uttrykk og strenger med restriksjoner, oppsettet er veldig enkelt, jeg vil forklare og vise alt, i tillegg er det en );
klipp ut skript, kommentarer, lenker, skjemaer, bilder, spenn, objekter, samt eventuelle fragmenter du spesifiserer fra innholdet.
planpublisering innlegg;
legg det analyserte materialet inn i en kategori du definerer (eller fordel dem tilfeldig i kategorier);
innse automatisk oversettelse(i alle retninger) på alle språk som støttes Google Oversetter.

Du kan lære mer om settet med funksjoner til plugin-en i skjermbildet av administrasjonspanelet:

Det er også verdt å fullt ut forstå driften av den universelle griperen.

Noen ganger er det ingen vits i å bruke tid på å skrive tekst til en WordPress-side selv. Denne saken gjelder ikke blogger og informasjonssider, siden inntektene deres genereres nettopp takket være innleggene som er lagt ut.

Og vi snakker om nettbutikker, firmanettsider og nyhetsportaler, ikke designet for organisk trafikk. For slike ressurser er unike materialer ikke like viktige som deres konstante oppdatering.

For å lage et autofyll-nettsted, må du sette opp en nyhetsparser for prosjektet ditt. Først må du finne passende nettsteder som du vil skrape fra. De må samsvare med temaet for prosjektet ditt, ellers er det ingen vits i å duplisere informasjon fra dem. Hvis dette er tilfelle, må du fortsette til den andre delen av løsningen på parsingsproblemet - dette er hvordan du vil klone tekst fra et annet nettsted. Den mest primitive og upraktiske metoden er manuell kopiering. Men det er mye klokere å bruke en av pluginene gitt i denne artikkelen for å aktivere en vellykket nyhets- og innholdsanalyser.

WP-O-Matic

En veldig populær modul for WordPress som lar deg sette opp en funksjonell nyhetsparser fra andre nettsteder. Verktøyet er installert av på en enkel måte: enten ved å laste opp direkte til en mappe på hostingen, eller gjennom "Plugins"-fanen.

Deretter må du konfigurere plugin-en hvis du vil sikre innholdsanalyse. For å gjøre dette, klikk bare på "Neste" fire ganger og på slutten "Send". Dermed bekrefter du at du godtar vilkårene for bruk av disse dataene WordPress-modul. Spesielt godtar du at du alene er ansvarlig for tyveri av andres materialer, innhold fra andre nettsteder osv.

Hvis du i tillegg til tekstkomponenten også er interessert i bilder, må du lage en katalog kalt Cache i mappen med plugin. Angi spesielle tilgangsrettigheter til denne mappen. Deretter må du gå tilbake til WordPress-administrasjonsområdet. Gå til plugin-innstillingene og se nøye for å se om det er en hake ved siden av Unix cron-elementet. Du må bekrefte boksen Cache Image slik at nyhetsparseren også kopierer bilder til ressursen din.

WP-O-Matic-modulen er bra fordi den fungerer på alle sider på nettstedet. Du kan legge til en egen kategori hvis du vil at listen over nyheter og innhold levert av parseren skal vises der. For å gjøre dette må du først opprette den nødvendige kategorien. Deretter klikker du på Legg til kampanje i WordPress admin i WP-O-Matic-verktøyinnstillingene. På kategorier-linjen, sjekk spesialkategorien du opprettet. Og i innmatingsskjemaet skriver du inn RSS-feeden du skal analysere. Du kan angi flere nettadresser for feeder samtidig, slik at tekstparseren samler informasjon fra tre eller til og med fire ressurser samtidig.

Og et annet stort pluss i retning av WP-O-Matic-plugin er den automatiske publisering av materiale. Du trenger ikke å logge på WordPress-administratoren din hver time for å endre statusen til innleggene dine til «Publisert». Modulen vil gjøre dette på egen hånd. Og hvis du ønsker det, kan det gjøre teksten unik gjennom en spesiell synonymiseringsmekanisme. I det nøkkelforskjell dette verktøyet fra konkurrenten – FeedWordPress-pluginen.

Datacol

Dette er en funksjonell griper som passer ikke bare for WordPress-motor. Dette er ikke bare en tekstparser for nettsider – det er en smart applikasjon som lar deg filtrere det kopierte materialet. For eksempel vil du kun kunne legge ut artikler som inneholder visse søkeord. Du kan duplisere nyheter direkte fra Yandex. Klonet materiale vil bli eksportert i ett av 15 tilgjengelige formater. Tjenesten vil samle inn ikke bare tekst, men også overskrifter, fotografier, publiseringsdato, lenker og andre viktige data.

Men Datacol distribueres på betalt basis. Det er imidlertid mye billigere enn om du bestilte materiale til nettstedet gjennom utveksling. Applikasjonen koster mindre enn 500 rubler og kan brukes til nesten hvilken som helst motor. Det er en demoversjon.

FDE Grabber

Nok en betalt parser med et stort antall funksjoner. Dette er allerede i kategorien dyre grabbere, siden det vil koste rundt $90. Men det vil være mulig å bruke det på 10 servere samtidig, det vil si at i teorien kan forskjellige webmastere chip inn $9, og dermed gjøre kjøpet billigere.

FDE Grabber er ikke akkurat en WordPress-plugin. Utviklerne kaller deres opprettelse et autonomt system som fungerer uavhengig av hvilken type CMS som er installert på nettstedet. Hovedtrekkene til dette analysesystemet:

  • nedlasting av fullskala nyheter eller individuelle fragmenter;
  • du kan planlegge publikasjoner;
  • hvis du ønsker å gjøre duplikatmateriale unik, er det en innebygd synonymiseringsfunksjon;
  • du kan jobbe gjennom proxy-servere;
  • parsing er i stand til å omgå omdirigeringer, noe som kan være et problem for andre plugins;
  • du kan automatisk laste ned alt innhold fra nettstedet og flytte det til nettstedet ditt (hvis det gjelder ikke-nyhetsportaler);

Du kan sette opp parsing helt etter eget skjønn, siden programmet har muligheten til å implementere mikroprogrammer for å korrigere arbeidet. På denne måten kan du for eksempel konfigurere justerings- og designfunksjonene til det kopierte materialet. Du kan også legge til noindex og nofollow parametere for alle lenker som vil være i sideteksten. Parseren lar deg til og med kopiere og automatisk oversette artikler fra utenlandske ressurser. Dette er en fin måte å skape en konstant strøm av innhold på sidene dine som vil begynne å tiltrekke seg besøkende over tid!

Ganske kraftig universell parser for WordPress. Lar deg samle innhold fra en eller flere kilder og behandle det, tilpasse det til det nødvendige formatet ved å bruke alle funksjonene til PHP-språket. Det er en mulighet for forsinket parsing. Den beste gratis parseren for WordPress for øyeblikket - AftParser står alltid til tjeneste!

Kort beskrivelse av funksjonalitet:

Parseren består av 4 sider: Hjemmeside, Link-parserside, RSS feed-parserside og innstillingsside. Slik vil det se ut etter installasjon:

Merk følgende: Du kan lese hvordan du konfigurerer AftParser.

La oss begynne med hjemmeside. Den viser en liste over parsere som kjører for øyeblikket.

Forklaringer er gitt i blokker på hver side. All dokumentasjon kommer ut av esken, bare les den nøye for å gjøre alt klart.

Nettstedparser:

Nettstedsparsersiden lar deg analysere data fra både én og flere kilder. Du trenger bare å gi lenker til materialer.

Hva? For lat til å lete på nettet og samle materialer for hånd? Fortvil ikke – alt er automatisert.

Det er to verktøy som lar deg fylle listen over lenker automatisk.

- en slags emulering søkemotor. Roboten vil selv gå gjennom sidene på nettstedet som er overført til den og samle inn alle interne lenker fra dem.

Naturligvis vil en liste over lenker fylt med automatiske algoritmer være tett med unødvendige data. Og her kommer filtre til hjelp.

- den enkleste og rask måte filtrering. Du legger inn betingelsene og filteret utfører selve behandlingen.

Avansert lenkefilter- et lenkefilter som lar deg endre innholdet deres og gjøre en haug med andre forskjellige ting. Kun for avanserte brukere. Jeg anbefaler deg å lære php før du gjør noe der.

Hvis du har fullført lenkesamlingen, er neste trinn å legge til innholdsgrenser.

Ved å bruke disse grensene vil parseren bestemme områdene som må behandles.

Syntaksutheving implementeres ved hjelp av javascript-editoren ACE. All dokumentasjon og alle tilgjengelige funksjoner finnes på plugin-siden. Listen er veldig imponerende, og jeg kan ikke presentere den her, siden dette materialet allerede er veldig langt. Bare installer plugin og les, du vil bli imponert, jeg garanterer det.

Slik ser siden ut RSS feed parser, med den eneste forskjellen at det ikke er noe krav om å oppgi lister over lenker.

Det er ganske mange aktivitetsområder hvor en parser kan brukes, men hovedsakelig er det innsamling av ulike opplysninger. Du kan raskt samle bilder og lenker kun programmatisk. Ved å bruke en parser for å søke etter informasjon kan du automatisere denne prosessen, noe som sparer betydelig tid. Hvis du har et nettsted på Wordpress, kan du enkelt gjøre det automatisk utfylt ved å bruke AftParser-parseren.

er en gratis, universell parser for WordPress. lar deg samle innhold fra en eller ulike kilder, behandler den under nødvendig format på PHP-språket. Parseren er laget som en plugin for WordPress. Etter å ha installert plugin normalt, vil en parser-meny vises i WordPress-konsollen, som på bildet.

Parseren implementerer to hovedverktøy: WordPress-nettstedparseren og Wordpress rss-parseren.

Parser for WordPress kan:

1. Analyserer data fra lenker

Du trenger bare å gi lenker til kilden. Hvis det ikke er noen lenker, kan de samles inn av en parser. Spesifiser stien til nettstedskartet, og griperen vil samle alle lenkene. Eller du kan samle lenker fra hvilken som helst html sider. Lenker kan filtreres i henhold til ønskede kriterier. Det er to koblingsfiltre som du kan endre parsingbetingelsene med. Erfarne brukere kan lage parsing-makroer selv, noe som gjør parseren veldig fleksibel for å passe deres behov.

2. Analyserer RSS-feeddata

Alt er enkelt her, skriv inn ønsket feed-URL og klikk start parsing.
En av de mulige bruksområdene for en parser for Wordpress er å fylle nyhetskolonner på nettstedet ditt ved å bruke informasjonskilder som blogger, RSS-feeder, VKontakte-sider, etc. Konkurrenter - WP-O-Matic, FeedWordPress, CyberSyn.