Programmer for å søke informasjon på datamaskinen. Programvare og tjenester for profesjonelt søk. Finn filer raskt på datamaskinen Alt

Det er en vanskelig følelse når du kan finne en fil på Internett raskere enn på din egen datamaskin... På bakgrunn av den raske fremgangen til Internett-søkemotorer, ser stasjonærsøkesjangeren ut som en stille, overgrodd dam av andemat. Tidligere eksisterende tilbud fra store markedsaktører, og her på en gang ble både Google og Yandex notert, har ikke blitt oppdatert på flere år, selskaper anså retningen som lite lovende og mistet interessen for den. Men problemet har ikke forsvunnet. Native Windows-søk er bra, men langt fra perfekt. Et godt tillegg heltene i vår anmeldelse vil bli med ham.

For å komme i gang, la oss ta en rask titt på mulighetene det gir oss. standard system Windows-søk 8. Som du vet kan du søke der direkte fra Metro-startskjermen. Bare begynn å skrive tekst, et søkepanel åpnes automatisk, som viser søkeresultater for installerte programmer, filer og mapper. Mindre kjent er systemsøkemodusen Windows-innstillinger, men det sparer virkelig tid som ville blitt brukt på å navigere gjennom mange forvirrende menyer. Du kan forresten raskt gå inn i ulike søkemoduser ved hjelp av hurtigtaster. Win+F vil åpne panelet i filsøkemodus, og Win+Q vil åpne programmer. Win+W-kombinasjonen vil søke etter systemparametere.

Ved søk direkte fra Windows utforsker alle tilleggsparametere er plassert på en egen verktøylinje, som behjelpelig åpnes når vi begynner å skrive inn noe i søkefeltet. Følgelig foreslås det å komponere komplekse spørringer ved hjelp av brytere. På den ene siden er det oversiktlig og ganske enkelt. På den annen side, når du prøver å lage mer komplekse spørringer, begynner vanskeligheter. For eksempel, for å spesifisere det nøyaktige datointervallet for opprettelsen av den ønskede filen, må du tukle mye første gang. For at tilleggsfunksjoner skal fungere, er det nødvendig at ønsket kilde forhåndsindekseres separat. Det tilsvarende alternativet finner du i egenskaper logiske stasjoner systemer. Arbeidshastigheten er ikke særlig høy. Dette skyldes blant annet at systemet ved søk produserer mye informasjonsstøy i resultatene. Som standard ser Windows Search etter de angitte tegnene selv i fragmenter av filnavn, mens den opprinnelige forespørselen behandles ganske fritt. Denne typen uavhengighet gir mening for relativt vage spørsmål, men når du trenger å finne noe spesifikt, er denne oppførselen rett og slett irriterende, fordi du til slutt må se på lange lister over alle slags unødvendige småting, hvis navn inneholder et par tegn i samme rekkefølge som i gitt forespørsel. Alt dette gir plass til tredjepartsløsninger. La oss fokusere på gratisapper.

Uten å gå inn på tekniske detaljer, er det to hovedmåter å søke etter filer på Windows-miljø. Den første er sekvensiell visning filstruktur. For å øke hastigheten på søk, kan programmer bygge sine egne hjelpeindeksdatabaser. Ulempen med denne metoden er relativt lav hastighet. Fordeler - muligheten til å samtidig indeksere og søke etter filinnhold og tilgjengelighet i forbindelse med dette flere alternativer. Den andre måten er å bruke eksisterende NTFS-filsystemlogger. Fordelen er veldig høy hastighet, men ulempen er muligheten til å søke kun etter filnavn.

Det ser ut til at å kombinere disse tilnærmingene i ett program er det mest åpenbare trinnet som vil tillate deg å få det beste fra dem begge. Men selv den mest interessante ideen kan bli ødelagt av implementering av utilstrekkelig høy kvalitet. Derfor er det dessverre ingen universalmester som passer våre krav her ennå. Jeg vil bare merke meg en kommersiell applikasjon av høy kvalitet - Ultra File Search. Derfor er det fornuftig å bli kjent med de beste representantene for spesialiserte søkemotorer fra hver leir.

La oss starte med Listary (www.listary.com), som integreres direkte i Windows Utforsker-grensesnittet, så det er ingen grunn til å fikle med nye vinduer når du starter det. Du kan ringe programvaren ved å dobbeltklikke i Utforsker eller enkeltklikke med midterste museknapp, noe jeg personlig liker bedre. Hvis du fokuserer på den tastaturbaserte metoden, er det bedre å bruke en tastaturkombinasjon for å ringe. Du kan tilordne det selv når du starter applikasjonen for første gang. På en eller annen måte åpnes et lite popup-panel, der relevante resultater vises når du skriver inn en spørring. Programmet bruker NTFS-logger, så denne applikasjonen fungerer kun med filnavn. Fordeler sammenlignet med standard Windows-søk - høy hastighet og streng overholdelse av en gitt forespørsel.

Listary har ganske fleksible innstillinger der du kan finjustere både oppførselen til programmet og dets utseende. Det er også tilleggsfunksjoner i ånden til din egen søkehistorikk, favoritter og kommandoer.

Når det kommer til frittstående søkeapplikasjoner som er avhengige av NTFS-funksjoner, er en av de mest kjente Search Everything (www.voidtools.com). Den er i utgangspunktet bærbar og krever ikke installasjon. Det eneste forbeholdet er at applikasjonen kan kreve ytterligere rettigheter for å kjøre, noe som begrenser bruken i en bærbar form. Etter all sannsynlighet skyldes dette tillegget av egne innebygde HTTP- og FTP/ETP-servere. Når du først starter programmet, oppretter det sin egen indeksdatabase, som det deretter oppdaterer automatisk. Søket er raskt og ganske nøyaktig. Grensesnittet til programvaren er enkelt. Støtter bruk av full vanlig uttrykk. Blant de nyttige små tingene vil jeg nevne støtte til arbeid fra kommandolinje– for dette må du laste ned den tilhørende modulen.

Utvikleren av programmet har for vane å falle ut av vår syndige verden i lang tid, så utviklingen fortsetter i ujevne spruter. Derfor, hvis det oppstår spørsmål eller problemer, er det bedre å stole på støtte fra andre programvarebrukere på forumet. I tillegg til selve programmet tilbyr den sin egen SDK, så applikasjonen har allerede en rekke tillegg og utvidelser.

Et godt alternativ til dette programmet er FileSearchy-applikasjonen (www.filesearchy.com). For det første er den oversatt til russisk. For det andre har programvaren et grensesnitt bygget på bokmerker, slik at du kan utføre flere søk samtidig og få tilgang til dem etter behov. Søkeresultater lastes umiddelbart, alt skjer veldig raskt og praktisk.

En interessant funksjon ved programmet er at hvis det blir funnet kataloger og filer hvis navn er nesten det samme (dette kan for eksempel skje i kataloger med musikk eller bilder), vises bare katalogikoner i listen over resultater. Dette virket praktisk for meg, siden resultatsiden ikke er full av unødvendige elementer, og fra resultatene vil vi mest sannsynlig gå til katalogen.

Alle klassiske søkealternativer støttes: søk etter eksakt frase, fragment (substitusjon), samt bruk av regulære uttrykk. Det er ingen mulighet for noen håndtering av listen over gjenstander som er funnet, annet enn sortering etter ulike kriterier. Visningsmodus: bare ren tekstliste. Dette er ikke veldig praktisk hvis søkemålet er et bilde. De fleste bilder i ekte arkiver på våre datamaskiner har generert navn som er til liten hjelp i søkingen, dette er ikke et grafisk miniatyrbilde.

SearchMyFiles-programmet (www.nirsoft.net/utils/search_my_files.html) fungerer i samsvar med en annen søkeorganisasjonsmodell og kan søke ikke bare etter navn, men også etter innholdet i filene. Den er i utgangspunktet bærbar, så for å starte applikasjonen trenger du bare å pakke ut det nedlastede arkivet. For å russifisere grensesnittet, må du laste ned og kopiere den russiske oversettelsesfilen, som er tilgjengelig på nettstedet, til programkatalogen. Det er ikke nødvendig å endre noen innstillinger; neste gang du starter SearchMyFiles vil du bli møtt med et russisk grensesnitt. Standard søkemodus er avansert. Nok detaljerte alternativer samlet i én dialogboks, som du kan lage ganske sofistikerte spørringer med. Filattributter kan også brukes som søkefunksjoner. Søk etter masker støttes. Personlig liker jeg muligheten til å søke etter flere rekker av filopprettingsdatoer samtidig - i noen tilfeller hjalp det virkelig og sparte mye tid. Du kan søke i filer ikke bare etter tekst, men også etter vilkårlige data. Det er veldig praktisk at du kan bruke logiske ekskluderingsoperatorer i fulltekstmodus. I tillegg til enkelt søk denne søknaden kan også brukes til å identifisere dupliserte filer.

Et program for raskt å søke etter filer i spesifiserte mapper både etter filnavn og innhold. Forskjellig fra standard Windows søkefunksjon høy hastighet og operasjonell effektivitet, samt muligheten til å finne filer selv inne i arkiver!

Skjermbildegalleri

Å jobbe ved en datamaskin, på en eller annen måte, innebærer å håndtere en rekke tekstdata. Enten vi leter etter informasjon på Internett, skriver en årsrapport eller bare leser en bok, kommer vi over tekst overalt!

Vi vet vanligvis hvor alle arbeidsfilene våre er plassert fordi vi åpner dem nesten hver dag. Men noen ganger er det situasjoner når vi husker at vi et sted hadde et dokument med nødvendig informasjon, men vi glemte hvor det var og hva det het.

Vi har to alternativer: vi kan enten manuelt prøve å finne filen vi trenger ved å åpne og sjekke alle arbeidsmappene våre, eller vi kan bruke Windows-funksjonen til å søke etter et ord eller en setning.

Men hvis vi har mange mapper og filer, er det nesten umulig å finne noe manuelt, og det innebygde søkeverktøyet kan bare søke i vanlig tekstfiler(Windows 7 vet imidlertid allerede hvordan man søker i DOC).

Bare i dette tilfellet tredjepartsprogramvare, som har avanserte søkefunksjoner. Alle programmer av denne typen kan deles inn i to kategorier: de som bruker indekseringsmekanismen, og de som ikke gjør det.

De applikasjonene som ikke bruker indeksering når de skanner, sjekker faktisk alle filer hver gang for tilstedeværelsen av søkestrengen, det vil si at de automatisk implementerer en mekanisme som ligner på manuelt søk.

Hastighetsøkning i forhold til standard betyr søk, oppnås hovedsakelig på grunn av bedre parallellisering av spørringer til filsystem, men likevel kan det ta ganske mye tid.

Prinsippet for å indeksere filer på en lokal PC er i hovedsak det samme som på Internett. Programmet forhåndsskanner den angitte stasjonen eller mappen og lager en database med filer med muligheten til raskt å oppdage innholdet. På grunn av dette skjer søket i løpet av sekunder!

Ulempen med denne typen programmer er deres egen fordel - behovet for å indeksere filer, noe som tar ganske lang tid :(. Ellers, etter min mening, er denne klassen av programmer bedre og mer funksjonell enn sine motparter som fungerer uten en indeks , så jeg foreslår at du gjør deg kjent med et av de beste gratisprogrammene av denne typen - DocFetcher.

I dag finnes det ganske mange programmer for lokal indeksering og søking av filer, men ikke alle har de samme mulighetene. Når det gjelder bredden av funksjonalitet, kan DocFetcher sammenlignes med det populære betalte indekseringssystemet Archivarius 3000.

Sammenligning med en betalt analog

Fra sammenligningen er det klart at programmene skiller seg lite fra hverandre (unntatt kanskje grensesnittet). Begge programmene fungerer med nesten alle filtyper, og begge lar deg bruke komplekse søk som inneholder søkemasker.

Den eneste fordelen med arkivaren er at den bruker en vedvarende database for indeksering, som lar deg se innhold som ikke er tilgjengelig i dette øyeblikket eksterne mapper og flyttbare medier.

Selv om det faktum at DocFetcher bruker en dynamisk database ikke er et slikt minus, siden den automatisk indekserer lagt til og slettede filer, som lar deg alltid ha den nyeste versjonen av listen over alle arbeidsfiler tilgjengelig.

Forbereder på å jobbe med programmet

En ekstra fordel med DocFetcher er tilstedeværelsen av en bærbar versjon, som anbefales for bruk av utviklerne selv (selv om den også er tilgjengelig). Utviklerne anbefaler å bruke den bærbare versjonen av to grunner:

Den bærbare versjonen kan kjøre på alle populære systemer, siden den er skrevet i det plattformuavhengige JAVA-språket og inneholder kjørbare filer fra alle for tiden populære operativsystemer (Windows, UNIX og Mac OS).
Hvis du er vant til å ha med deg alle arbeidsfilene dine på en flash-stasjon eller ekstern harddisk, kan den bærbare versjonen indeksere filer selv på flyttbar enhet, som lar deg finne filene du trenger like raskt som på en PC. Igjen, flash-stasjonen kan kobles til hvilken som helst datamaskin med hvilket som helst operativsystem, og overalt vil vi raskt kunne søke!

Jeg vil legge til at den bærbare versjonen fungerer litt raskere (jeg vet ikke hvorfor) enn installasjonsversjonen, så jeg anbefaler også å bruke den!

I arkivet lastet ned fra nettsiden vår finner du nøyaktig bærbar versjon programmer. For å få det til å fungere, pakke ut mappen "DocFetcher 1.1.9" til et hvilket som helst sted på PC-en (bortsett fra Program Files-mappen).

Du vil også trenge et sett med Java Runtime Environment-biblioteker (JRE) installert på datamaskinen din, versjon 1.6.0 eller høyere (nåværende versjon 7.40). Vanligvis er JAVA allerede installert på alle moderne systemer, men sjekk i tilfelle ;)

Når alt er klart, kan du starte DocFetcher.

Programgrensesnitt

Etter lansering kjørbar fil DocFetcher.exe vi vil se arbeidsvinduet til programmet:

Hvis systemet ditt er på russisk, vil programgrensesnittspråket automatisk være russisk, så du trenger ikke å endre noe!

Selve grensesnittet består av fire seksjoner som kan skjules/vises ved hjelp av knapper med svarte piler:

I øvre venstre hjørne er det en seksjon for søkealternativer. Her kan du sette minimum og maksimal størrelse filen du leter etter, og angi også utvidelsen (alle utvidelser er aktive som standard);
I øvre høyre hjørne av vinduet er det en søkelinje med et resultatfelt. Her, til høyre for søkefeltet, kan du se tilleggsknapper som henter frem hjelp, innstillinger og skjuler programvinduet i skuffen.
Søkeområdet er plassert i nedre venstre hjørne. Det er i denne delen at alle indekserte mapper med arbeidsfilene våre vises.
I nedre høyre hjørne er det et forhåndsvisningsvindu av den valgte filen. Som standard viser dette vinduet readme til programmet, men så snart vi velger en fil, vil innholdet umiddelbart vises her, og den søkte setningen eller ordet vil bli uthevet i farger!

Mappeindekseringsmekanisme

Hvis du prøver å finne noe med DocFetcher akkurat nå, vil du mislykkes, for for å søke må programmet først indeksere mappene med filene vi trenger!

For å gjøre dette, må vi hente frem kontekstmenyen til søkeområdet og holde markøren over det eneste aktive elementet "Opprett indeks fra":

For eksempel vil jeg indeksere arbeidsmappen min med artikler ved å velge "Mappe" -elementet. Men i tillegg til mapper, kan DocFetcher indeksere arkiver, Outlook e-postlagringsfiler og, av en eller annen grunn, utklippstavlen.

Etter å ha valgt indekseringsmodus, vil vi bli bedt om å spesifisere mappen som skal skannes, og da vil vi se følgende vindu:

Her kan vi angi indekseringsparametere som:

spesielle instruksjoner for behandling av visse typer filer;
ekskludering av visse filer fra indeksen ved utvidelse eller MIME-type (regulære uttrykk støttes);
andre tilleggsinnstillinger.

Hvis du er en vanlig bruker, trenger du ikke endre noe her. Hvis du er en utvikler, anbefaler jeg deg å spesifisere filene som inneholder koden din som tekstfiler i delen "Filutvidelser".

Dette er nødvendig for at DocFetcher skal søke etter de nødvendige uttrykkene inne i koden (som standard blir for eksempel PHP-filer behandlet som HTML, det vil si at søket utføres kun av tekst som er synlig i nettleseren!).

Hvis du er fornøyd med alle innstillingene, klikker du på "Kjør"-knappen og venter på at indekseringen er fullført:

Programmet tar bare noen få sekunder å skanne små mapper med et lite antall filer. Men hvis mappene er store og har en kompleks struktur av vedlegg med arkiver og bilder, kan indeksering ta litt tid.

Som du kan se fra skjermbildet, behandlet DocFetcher arbeidsmappen min som veide 3,6 Gigabyte, som, som skanneren hevder, inneholdt nesten 46 tusen filer (inkludert i arkiver) i nesten en halv time! Ganske lenge, men verdt det!

Ja! Jeg anbefaler ikke å indeksere systemmapper (og Drive C generelt), siden dette for det første vil bremse programmet, og for det andre kan føre til " Blå skjerm død" på grunn av hyppige endringer i innhold ...

Og en ting til... Jo flere filer i den indekserte mappen, jo flere tilfeldig tilgang minne vil bli brukt av programmet for å støtte driften av indeksen. Mine 46 tusen filer, for eksempel, i inaktiv modus "sluker" opptil 200 megabyte RAM og opptil 20% av prosessoren! Og i søkemodus hender det at alle ressurser blir brukt (heldigvis tar søket bare et par sekunder).

Vel, nå ser det ut til at du vet alt - la oss komme til den morsomme delen.

Enkelt filsøk i DocFetcher

Etter å ha lukket skannevinduet, går vi tilbake til hovedvinduet igjen, men nå vil vi ha en indeksert mappe i søkeområdet:

Ved å klikke på plusstegnet til venstre for mappenavnet vil vi utvide strukturen og kunne se katalogtreet. I tillegg, sammen med vanlige mapper, inkluderer treet også arkiver, hvis vedleggsstruktur vi også kan se!

Som standard er alle mapper i den indekserte katalogen merket for søk. Vi kan imidlertid alltid begrense søkefeltet ved kun å sjekke de nødvendige katalogene eller arkivene.

La oss la hele mappen være valgt og prøve å sette det første ordet til å søke. La for eksempel være ordet "installatør". Skriv inn ordet i søkefeltet og klikk på "Søk"-knappen:

Programmet tenkte i 3 sekunder, og produserte deretter en liste med 180 (se nedre venstre hjørne for "Resultater") filer der det søkte ordet forekommer i samme form som vi skrev inn.

Alle filer sorteres som standard etter "Treff"-indikatoren, som i prosent uttrykker graden av relevans for hver fil for det angitte søket. I vårt eksempel ble den maksimale samsvarsprosenten - 22 % - tildelt en fil der søkeordet vises to ganger (og i samme avsnitt).

Hvis du velger denne filen i søkelisten, vil innholdet vises i forhåndsvisningsvinduet, og det første treffet som ble funnet vil utheves i blått (som et normalt utvalg). Påfølgende kamper vil bli uthevet i gult, og du kan raskt navigere til dem ved å bruke pil opp og ned på visningsportens verktøylinje.

På samme panel for vanlige tekstfiler er det ytterligere to knapper som lar deg slå av utheving av søkeresultater og aktivere/deaktivere HTML-visningsmodus (hvis tilgjengelig for av denne typen fil).

Og en siste ting. Enhver fil i listen over funnet kan åpnes ved et vanlig dobbeltklikk eller ved å bruke kontekstmenyen. Sistnevnte inneholder også elementer som lar deg åpne hovedmappen til en fil eller kopiere selve filen til utklippstavlen.

Bruke søkemasker

Avanserte (og noen ganger ikke så avanserte) brukere vet at du kan søke i søkemotorer på Internett, ikke bare ved å bruke enkle søk, men også ved å bruke en rekke spesialfunksjoner som lar deg inkludere/ekskludere visse ord i/fra søkeresultater, søke etter unøyaktig fyrstikker osv. .P.

DocFetcher, som i hovedsak er den samme søkemotoren, men lokal, kan også gjøre dette :). Men i motsetning til konvensjonelle søkeroboter, ser den som standard bare etter strenge samsvar med søket. For å omgå denne begrensningen må du bruke spesialtegn «?» Og «*» . La meg forklare med et eksempel med ordet som allerede er nevnt ovenfor "installatør":

Spesiell karakter "?" erstatter en hvilken som helst bokstav. Det vil si, hvis vi setter det på slutten av det søkte ordet, kan vi finne filer der det er forskjellige former for dette ordet, der bare den siste bokstaven endres (se skjermbildet ovenfor: "installer", "installer" , etc.) . Du bør imidlertid huske at med et slikt søk vil ikke filer med hovedformen til søkeordet bli funnet!

For et mer fleksibelt søk, bruk spesialtegnet "*":

Dette symbolet lar deg finne resultater som er helt ekvivalente med søket, eller som har forskjellige endelser, som kanskje ikke består av én bokstav, som i forrige tilfelle (for eksempel filer med ordene "installatør", "installatører", "installatører" og til og med "installatører").

Bruk alltid en stjerne når du vil spesifisere et ikke-eksakt samsvar for et søk!

Forresten, i skjermbildet ovenfor kan vi se aktiveringen av HTML-kodebehandlingsfunksjonen. I denne modusen forhåndsvisningsvinduet blir til en mini-nettleser med navigasjonsknapper, søkelinje og alle nødvendige attributter. Du kan bytte til kodevisningsmodus ved å bruke den ytterste knappen til høyre.

I tillegg til å bruke spesialtegnene nevnt ovenfor, støtter DocFetcher noen andre søkefunksjoner:

Boolske operatorer "AND", "OR" og "NOT" (ligner på "&&", "||" og "-") for søk som inneholder to søkeord samtidig, ett av nøkkelordene, eller ekskluderer ett av ord. For eksempel: "katt && hund" - alle dokumenter der ordene "katt" og "hund" forekommer vil bli funnet, "katt ELLER hund" - dokumenter der minst ett av ordene finnes, "katt - hund" - dokumenter hvor det kun er ordet «katt», uten omtale av ordet «hund». Du kan kombinere flere operatorer, for eksempel vil søket "(katt ELLER hund) OG mus" returnere alle dokumenter som inneholder ordet "katt" eller "hund" så vel som ordet "mus".
Frasale spesialtegn. Dette inkluderer anførselstegn og "+"-tegnet. For eksempel vil en setning plassert i anførselstegn bli søkt i sin uendrede form (den du skrev den i). Denne funksjonen ligner den eksakte søkefunksjonen i vanlige søkemotorer. "+"-tegnet indikerer at ordet merket av det har prioritet, mens de resterende ordene i spørringen kanskje ikke er til stede. For eksempel vil forespørselen "+katthund" først gi oss alle filer som inneholder begge nøkkelordene, og deretter de som bare inneholder ordet "katt". Hvis du legger til "+" til alle søkeord, vil resultatet tilsvare å bruke "AND"-operatoren.
Søk etter lignende ord. Med DocFetcher kan vi søke etter filer som inneholder ord som ligner på nøkkelordet. For å gjøre dette, bruk spesialtegnet "~" på slutten av nøkkelordet. For eksempel kan søket "cat~" returnere ordene "code", "that", "sweat", etc. I tillegg kan vi spesifisere graden av likhet i området fra "0" til "1". Som standard (hvis vi ikke har spesifisert en verdi), er denne graden "0,5" (tilsvarer søket "cat ~0,5").
Søk etter filattributter. I praksis er det ofte nødvendig å finne filer ikke bare (og ikke så mye) etter innhold, men også etter visse attributter. For eksempel ønsker vi å finne alle brev fra Vasya Pupkin. For å gjøre dette kan du bruke følgende forespørsel: "avsender:"Vasya Pupkin"". Dessverre er attributtsøk bare tilgjengelig for tekstfiler (attributter: tittel, filnavn og forfatter) og e-postfiler (attributter: emne, avsender og mottakere).

Det er også noen andre spesifikke søkefunksjoner, men siden de ikke er spesielt etterspurte, vil vi ikke vurdere dem (hvis du vil, kan du lese om dem i den engelske håndboken for programmet i delen "Query Syntax").

Søkeområde kontekstmeny

Jeg tenkte lenge på om det var verdt å fokusere på kontekstmenyen, men til slutt, for å fullføre bildet, så å si, bestemte jeg meg tross alt for å slutte :). Hvis du husker, helt i begynnelsen, var bare det første elementet aktivt her - "Opprett indeks fra". Nå, etter å ha indeksert mappen, blir alle andre alternativer tilgjengelige for oss:

Hvis vi ikke tar hensyn til åpenbare funksjoner som "Oppdater indeks" eller "Slett "døde" indekser", vil vi bare være interessert i det siste elementet i kontekstmenyen - "Liste over dokumenter". Ved å aktivere den, vil vi i søkeresultatfeltet ikke motta resultatet av noen spørring, men en liste over alle filene i mappen som dokumentlistevisningsfunksjonen ble kalt for. Noen ganger vil en slik mulighet være nyttig og til og med praktisk!

DocFetcher-innstillinger

Du kan komme inn i programmets få innstillinger ved å klikke på den andre knappen til høyre for søkelinjen:

Her skal alle parametere være klare og uten ytterligere forklaringer. Det eneste du bør være oppmerksom på er lenken "Avanserte innstillinger" i nedre venstre hjørne. Ved å klikke på den åpnes en tekstmelding konfigurasjonsfil, der du kan gjøre noen fine justeringer.

Dessverre, kommentarene til innstillingene (og de selv) er på engelsk, så jeg anbefaler deg å endre noe bare hvis du tydelig forstår hva den valgte parameteren vil påvirke!

Fordeler og ulemper med programmet

nesten øyeblikkelig søk etter filnavn og innhold;
evnen til å lage komplekse spørringer;
sortering av søkeresultater etter relevans;
søk i arkiver;
forhåndsvisning av filinnhold med utheving av spørringer.

behovet for foreløpig indeksering av filer;
som standard søkes det etter et strengt samsvar med forespørselen, noe som ikke alltid er praktisk;
høyt ressursforbruk ved indeksering av et stort antall filer.

konklusjoner

DocFetcher er ikke det eneste programmet i sitt slag, men et av de mest funksjonelle, selv i sammenligning med betalt programvare.

Den eneste alvorlige ulempen, etter min mening, er det faktum at applikasjonen er skrevet i JAVA, som, til tross for alle uttalelsene fra utviklerne, belaster systemet tungt. Selvfølgelig, for moderne multi-core PC-er er dette ikke et problem, men på eldre maskiner kan "bremser" noen ganger observeres.

Ellers er DocFetcher en utmerket søkemotor som alle kan finne på noen få øyeblikk. viktig fil bare ett ord den inneholdt. Programmet vil også være uunnværlig for utviklere, da det lar deg søke etter komplekse kodestrukturer.

P.S. Tillatelse er gitt til fritt å kopiere og sitere denne artikkelen, forutsatt at en åpen aktiv lenke til kilden er angitt og forfatterskapet til Ruslan Tertyshny er bevart.

Hver dag øker volumet av informasjon fra nettverket, og dermed på brukernes datamaskiner. På harddisk For en gjennomsnittlig bruker kan antallet filer nå flere hundre, og det er slett ikke lett å finne den du trenger i den totale massen. Standard Windows-søkemotoren fungerer ikke alltid raskt og har svært begrenset funksjonalitet, så det er fornuftig å bruke tredjepartsprogrammer.

I denne anmeldelsen skal vi se på flere programmer som vil hjelpe deg med å finne de nødvendige dataene på datamaskinen din.

Dette programmet er kanskje det kraftigste verktøyet for å søke på PC-disker. Har mange finjusteringer, filtre og funksjoner. Distribusjonen inkluderer også tilleggsverktøy for samhandling med filsystemet.

En av de karakteristiske egenskapene til Search My Files er muligheten fullstendig fjerning filer ved å overskrive dem med nuller eller tilfeldige data.

SearchMyFiles

Søk i mine filer blir ofte forvekslet med den forrige programvaren på grunn av dets lignende navn. Dette programmet skiller seg ut ved at det er enklere å bruke, men samtidig mangler det noen funksjoner, for eksempel søk på nettverksstasjoner.

Alt

Et enkelt søkeprogram med egne funksjoner. Alt kan søke etter data ikke bare på den lokale datamaskinen, men også på ETP og FTP-servere. Den skiller seg ut fra andre representanter for lignende programvare ved at den lar deg spore endringer i datamaskinens filsystem.

Effektivt filsøk

En annen programvare som er veldig enkel å sette opp og bruke. På absolutt liten størrelse har et tilstrekkelig antall funksjoner, er i stand til å eksportere resultater til tekst- og tabellfiler, og kan installeres på en flash-stasjon.

UltraSearch

UltraSearch kan ikke bare finne filer og mapper, men også søke etter informasjon i innholdet i dokumenter etter nøkkelsetninger eller ord. Hjem særpreg Programmet skal automatisk initialisere tilkoblede medier.

R.E.M.

REM har et mer brukervennlig grensesnitt enn tidligere deltakere. Prinsippet til programmet er å lage soner der filer automatisk indekseres, noe som kan fremskynde søkeprosessen betydelig. Soner kan opprettes ikke bare på den lokale datamaskinen, men også på disker i nettverket.

Google Desktop-søk

Google Desktop Search er utviklet av et verdenskjent selskap, og er en liten lokal søkemotor. Med dens hjelp kan du søke etter informasjon både på din hjemme-PC og på Internett. I tillegg til hovedfunksjonen sørger programmet for bruk av informasjonsblokker - gadgets for skrivebordet.

Alle programmer oppført i denne listen, er flotte for å erstatte opprinnelig Windows-søk. Velg selv: installer enklere programvare, men med et mindre sett med funksjoner, eller en hel søkemotor med mulighet til å behandle filer. Hvis du jobber med mapper og stasjoner i lokalt nettverk, så er REM og Everything passende for deg, og hvis du planlegger å "bære programmet med deg", så vær oppmerksom på Effektivt filsøk eller Søk i mine filer.

Til profesjonelt søk Internett krever spesialisert programvare, samt spesialiserte søkemotorer og søketjenester.

PROGRAMMER

http://dr-watson.wix.com/home – programmet er designet for å utforske arrays tekstinformasjon for å identifisere enheter og forbindelser mellom dem. Resultatet av arbeidet er en rapport om objektet som studeres.

http://www.fmsasg.com/ - et av de beste programmene i verden for å visualisere forbindelser og relasjoner Sentinel Vizualizer. Selskapet har fullstendig russifisert sine produkter og koblet til hotline på russisk.

http://www.newprosoft.com/ – “Web Content Extractor” er den kraftigste og mest brukervennlige programvaren for å trekke ut data fra nettsider. Den har også en effektiv Visual Web-edderkopp.

SiteSputnik – en programvarepakke som ikke har noen analoger i verden, som lar deg søke og behandle resultatene på det synlige og usynlige Internett ved å bruke alle søkemotorene som er nødvendige for brukeren.

WebSite-Watcher – lar deg overvåke nettsider, inkludert passordbeskyttede, overvåkingsfora, RSS-feeds, nyhetsgrupper, lokale filer. Har et kraftig filtersystem. Overvåking utføres automatisk og leveres i en brukervennlig form. Et program med avanserte funksjoner koster 50 euro. Stadig oppdatert.

http://www.scribd.com/ er den mest populære plattformen i verden og brukes i økende grad i Russland for å legge ut ulike typer dokumenter, bøker osv. for gratis tilgang med en veldig praktisk søkemotor for titler, emner osv.

http://www.atlasti.com/ er det kraftigste og mest effektive verktøyet for kvalitativ informasjonsanalyse tilgjengelig for individuelle brukere, små og til og med mellomstore bedrifter. Programmet er multifunksjonelt og derfor nyttig. Den kombinerer muligheten til å skape et enhetlig informasjonsmiljø for arbeid med ulike tekst-, tabell-, lyd- og videofiler som en helhet, samt verktøy for kvalitativ analyse og visualisering.

Ashampoo ClipFinder HD – en stadig større del av informasjonsflyten kommer fra video. Følgelig trenger konkurrerende etterretningsoffiserer verktøy som lar dem jobbe med dette formatet. Et slikt produkt er gratisverktøyet vi presenterer. Den lar deg søke etter videoer basert på spesifiserte kriterier på videofillagringssider som YouTube. Programmet er enkelt å bruke, viser alle søkeresultater på én side med detaljert informasjon, titler, varighet, tidspunkt for når videoen ble lastet opp til lagringen, etc. Det er et russisk grensesnitt.

http://www.advego.ru/plagiatus/ – programmet er laget SEO-optimalisatorer, men er ganske egnet som et Internett-intelligensverktøy. Plagiat viser graden av unikhet til teksten, kildene til teksten og prosentandelen av tekstmatch. Programmet sjekker også unikheten til den angitte URL-en. Programmet er gratis.

http://neiron.ru/toolbar/ – inkluderer et tillegg for å kombinere Google søk og Yandex, og lar deg også konkurranseanalyse, basert på å vurdere effektiviteten til nettsteder og kontekstuell annonsering. Implementert som en plugin for FF og GC.

http://web-data-extractor.net/ er en universell løsning for å skaffe data tilgjengelig på Internett. Oppsett av dataklipp fra hvilken som helst side gjøres med noen få museklikk. Du trenger bare å velge dataområdet du vil lagre, og Datacol vil automatisk velge en formel for å kutte ut denne blokken.

CaptureSaver er et profesjonelt Internett-forskningsverktøy. Rett og slett uerstattelig fungerende program, slik at du kan fange opp, lagre og eksportere all Internett-informasjon, inkludert ikke bare nettsider, blogger, men også RSS-nyheter, e-post, bilder og mye mer. Den har den bredeste funksjonaliteten, et intuitivt grensesnitt og en latterlig pris.

http://www.orbiscope.net/en/software.html – webovervåkingssystem til mer enn rimelige priser.

http://www.kbcrawl.co.uk/ – programvare for arbeid, inkludert på "Invisible Internet".

http://www.copernic.com/en/products/agent/index.html – programmet lar deg søke ved hjelp av mer enn 90 søkemotorer, med mer enn 10 parametere. Lar deg kombinere resultater, eliminere duplikater, blokkere ødelagte koblinger og vise de mest relevante resultatene. Kommer i gratis, personlige og profesjonelle versjoner. Brukt av mer enn 20 millioner brukere.

Maltego er en fundamentalt ny programvare som lar deg etablere forholdet mellom emner, hendelser og objekter i det virkelige liv og på Internett.

TJENESTER

new er en effektiv søkemotoraggregator for å finne folk på hovedrussisk i sosiale nettverk.

https://hunter.io/ er en effektiv tjeneste for å oppdage og sjekke e-post.

https://www.whatruns.com/ er en enkel å bruke, men effektiv skanner for å finne ut hva som fungerer og ikke fungerer på et nettsted og hva sikkerhetshullene er. Også implementert som en plugin for Chrom.

https://www.crayon.co/ er en amerikansk budsjettplattform for markeds- og konkurranseetterretning på Internett.

http://www.cs.cornell.edu/~bwong/octant/ – vertsidentifikator.

https://iplogger.ru/ – en enkel og praktisk tjeneste for å bestemme andres IP.

http://linkurio.us/ er et kraftig nytt produkt for arbeidere med økonomisk sikkerhet og korrupsjonsetterforskere. Behandler og visualiserer enorme mengder ustrukturert informasjon fra økonomiske kilder.

http://www.intelsuite.com/en – engelskspråklig nettplattform for konkurransedyktig intelligens og overvåking.

http://yewno.com/about/ er det første operativsystemet for å oversette informasjon til kunnskap og visualisere ustrukturert informasjon. Støtter for øyeblikket engelsk, fransk, tysk, spansk og portugisisk.

https://start.avalancheonline.ru/landing/?next=%2F – prognose- og analysetjenester av Andrey Masalovich.

https://www.outwit.com/products/hub/ – et komplett sett med frittstående programmer for profesjonelt arbeid i web 1.

https://github.com/search?q=user%3Acmlh+maltego – utvidelser for Maltego.

http://www.whoishostingthis.com/ – søkemotor for hosting, IP-adresser osv.

http://appfollow.ru/ – analyse av applikasjoner basert på anmeldelser, ASO-optimalisering, plasseringer i topper og søkeresultater for App Store, Google Play og Windows Phone Store.

http://spiraldb.com/ er en tjeneste implementert som en plugin for Chrom, som lar deg få mye verdifull informasjon om enhver elektronisk ressurs.

https://millie.northernlight.com/dashboard.php?id=93 - en gratis tjeneste som samler inn og strukturerer nøkkelinformasjon om bransjer og bedrifter. Det er mulig å bruke informasjonspaneler basert på tekstanalyse.

http://byratino.info/ – innsamling av faktadata fra offentlig tilgjengelige kilder på Internett.

http://www.datafox.co/ – CI-plattformen samler inn og analyserer informasjon om selskaper av interesse for kunder. Det er en demo.

https://unwiredlabs.com/home - en spesialisert applikasjon med en API for søk etter geolokalisering av enhver enhet som er koblet til Internett.

http://visualping.io/ – en tjeneste for overvåking av nettsteder og først av alt fotografiene og bildene som er tilgjengelige på dem. Selv om bildet dukket opp et sekund, vil det være det e-post abonnent Har en plugin for Google Chrome.

http://spyonweb.com/ er et forskningsverktøy som gjør det mulig å analysere alle Internett-ressurser i dybden.

http://bigvisor.ru/ – tjenesten lar deg spore reklamekampanjer for visse segmenter av varer og tjenester, eller spesifikke organisasjoner.

http://www.itsec.pro/2013/09/microsoft-word.html – instruksjoner for bruk av Artem Ageev Windows-programmer for konkurrerende etterretningsbehov.

http://granoproject.org/ er et åpen kildekodeverktøy kildekode for forskere som sporer nettverk av forbindelser mellom enkeltpersoner og organisasjoner innen politikk, økonomi, kriminalitet, etc. Lar deg koble til, analysere og visualisere informasjon hentet fra ulike kilder, samt vise betydelige sammenhenger.

http://imgops.com/ – tjeneste for å trekke ut metadata fra grafiske filer og jobbe med dem.

http://sergeybelove.ru/tools/one-button-scan/ – en liten nettskanner for å sjekke sikkerhetshull på nettsider og andre ressurser.

http://isce-library.net/epi.aspx – tjeneste for søk i primærkilder ved å bruke et fragment av tekst på engelsk

https://www.rivaliq.com/ er et effektivt verktøy for å utføre konkurrerende etterretning i vestlige, primært europeiske og amerikanske markeder for varer og tjenester.

http://watchthatpage.com/ er en tjeneste som lar deg automatisk samle inn ny informasjon fra overvåkede Internett-ressurser. Tjenesten er gratis.

http://falcon.io/ er en slags Rapportive for Web. Det er ikke en erstatning for Rapportive, men gir tilleggsverktøy. Derimot gir Rapportive en generell profil av en person, som om den er limt sammen fra data fra sosiale nettverk og omtaler på nettet http://watchthatpage.com/ - en tjeneste som lar deg automatisk samle inn ny informasjon fra overvåkede ressurser på internettet. Tjenesten er gratis.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – tillegg for Firefox. Overvåker nettsideoppdateringer. Nyttig for nettsteder som ikke har nyhetsstrømmer (Atom eller RSS).

http://agregator.pro/ – samler av nyhets- og medieportaler. Brukes av markedsførere, analytikere, etc. å analysere nyhetsstrømmer om bestemte emner.

http://price.apishops.com/ – automatisert webtjeneste for overvåking av priser for utvalgte produktgrupper, spesifikke nettbutikker og andre parametere.

http://www.la0.ru/ er en praktisk og relevant tjeneste for å analysere lenker og tilbakekoblinger til en Internett-ressurs.

www.recordedfuture.com er et kraftig verktøy for dataanalyse og visualisering, implementert som en nettbasert tjeneste bygget på cloud computing.

http://advse.ru/ er en tjeneste med slagordet "Finn ut alt om konkurrentene dine." Lar deg skaffe konkurrenters nettsider i samsvar med søk og analysere konkurrenters annonsekampanjer i Google og Yandex.

http://spyonweb.com/ – tjenesten lar deg identifisere nettsteder med de samme egenskapene, inkludert de som bruker de samme stGoogle Analytics, IP-adresser osv.

http://www.connotate.com/solutions – en produktlinje for konkurransedyktig intelligens, styring av informasjonsflyt og konvertering av informasjon til informasjonsressurser. Det inkluderer både komplekse plattformer og enkle, billige tjenester som muliggjør effektiv overvåking sammen med informasjonskomprimering og kun oppnå de nødvendige resultatene.

http://www.clearci.com/ - konkurransedyktig etterretningsplattform for bedrifter av ulike størrelser fra oppstartsbedrifter og små bedrifter til Fortune 500-bedrifter. Løst som saas.

http://startingpage.com/ er et Google-tillegg som lar deg søke på Google uten å registrere IP-adressen din. Støtter alle Google-søkefunksjoner fullt ut, inkludert på russisk.

http://newspapermap.com/ er en unik tjeneste som er svært nyttig for en konkurrerende etterretningsoffiser. Kobler geolokalisering med en nettbasert mediesøkemotor. De. du velger regionen du er interessert i, eller til og med en by eller et språk, se stedet på kartet og en liste over nettversjoner av aviser og magasiner, klikk på den aktuelle knappen og les. Støtter russisk språk, veldig brukervennlig grensesnitt.

http://infostream.com.ua/ er et veldig praktisk nyhetsovervåkingssystem "Infostream", kjennetegnet ved et førsteklasses utvalg og ganske tilgjengelig for enhver lommebok, fra en av klassikerne innen internettsøk, D.V. Lande.

http://www.instapaper.com/ er et veldig enkelt og effektivt verktøy for å lagre de nødvendige nettsidene. Kan brukes på datamaskiner, iPhones, iPads, etc.

http://screen-scraper.com/ – lar deg automatisk trekke ut all informasjon fra nettsider, laste ned de aller fleste filformater og automatisk legge inn data i ulike former. Lagrer nedlastede filer og sider i databaser, utfører mange andre ekstremt nyttige funksjoner. Fungerer på alle større plattformer, har fullt funksjonelle gratis og svært kraftige profesjonelle versjoner.

http://www.mozenda.com/ - har flere tariffplaner og en webtjeneste for multifunksjonell nettovervåking og levering av nødvendig informasjon for brukeren fra utvalgte nettsteder, tilgjengelig selv for små bedrifter.

http://www.recipdonor.com/ – tjenesten lar deg automatisk overvåke alt som skjer på konkurrentenes nettsider.

http://www.spyfu.com/ – og dette er hvis konkurrentene dine er utenlandske.

www.webground.su er en tjeneste for overvåking av Runet laget av profesjonelle internettsøkere, som inkluderer alle de store leverandørene av informasjon, nyheter, etc., og er i stand til individuelle overvåkingsinnstillinger for å passe brukerens behov.

SØKEMOTORER

https://www.idmarch.org/ er den beste søkemotoren for verdensarkivet av pdf-dokumenter når det gjelder kvalitet. For tiden er mer enn 18 millioner pdf-dokumenter indeksert, alt fra bøker til hemmelige rapporter.

http://www.marketvisual.com/ er en unik søkemotor som lar deg søke etter eiere og toppledelse etter fullt navn, firmanavn, stilling eller en kombinasjon av disse. Søkeresultatene inneholder ikke bare objektene du leter etter, men også forbindelsene deres. Designet primært for engelsktalende land.

http://worldc.am/ er en søkemotor for fritt tilgjengelige fotografier knyttet til geolokalisering.

https://app.echosec.net/ er en offentlig søkemotor som beskriver seg selv som det mest avanserte analyseverktøyet for rettshåndhevelse og sikkerhets- og etterretningspersonell. Lar deg søke etter bilder lagt ut på ulike nettsteder, sosiale plattformer og sosiale nettverk i forhold til spesifikke geolokaliseringskoordinater. Det er for øyeblikket syv datakilder tilkoblet. Ved utgangen av året vil antallet være mer enn 450. Takk til Dementy for tipset.

http://www.quandl.com/ er en søkemotor for syv millioner finansielle, økonomiske og sosiale databaser.

http://bitzakaz.ru/ – søkemotor for anbud og offentlige bestillinger med ekstra betalte funksjoner

Website-Finder – gjør det mulig å finne nettsteder som Google ikke indekserer godt. Den eneste begrensningen er at for hver nøkkelord den søker bare på 30 nettsteder. Programmet er enkelt å bruke.

http://www.dtsearch.com/ er en kraftig søkemotor som lar deg behandle terabyte med tekst. Fungerer på desktop, web og intranett. Støtter både statiske og dynamiske data. Lar deg søke i alle MS Office-programmer. Søket utføres ved hjelp av fraser, ord, tagger, indekser og mye mer. Den eneste forente søkemotoren som er tilgjengelig. Den har både betalte og gratisversjoner.

http://www.strategator.com/ – søker, filtrerer og samler informasjon om selskapet fra titusenvis av nettkilder. Søk i USA, Storbritannia, store EEC-land. Det er svært relevant, brukervennlig og har gratis og betalte alternativer ($14 per måned).

http://www.shodanhq.com/ er en uvanlig søkemotor. Umiddelbart etter at han dukket opp, fikk han kallenavnet «Google for hackere». Den søker ikke etter sider, men bestemmer IP-adresser, typer rutere, datamaskiner, servere og arbeidsstasjoner på en bestemt adresse, sporer kjeder av DNS-servere og lar deg implementere mange andre interessante funksjoner for konkurransedyktig intelligens.

http://search.usa.gov/ er en søkemotor for nettsteder og åpne databaser for alle amerikanske offentlige etater. Databasene inneholder mye praktisk nyttig informasjon, inkludert for bruk i vårt land.

http://visual.ly/ – i dag brukes visualisering i økende grad for å presentere data. Dette er den første infografiske søkemotoren på nettet. Sammen med søkemotoren har portalen kraftige datavisualiseringsverktøy som ikke krever programmeringskunnskaper.

http://go.mail.ru/realtime – søk etter diskusjoner om emner, hendelser, objekter, emner i sanntid eller tid som kan tilpasses. Det tidligere sterkt kritiserte søket i Mail.ru fungerer svært effektivt og gir interessante, relevante resultater.

Zanran er nettopp lansert, men fungerer allerede utmerket, den første og eneste søkemotoren for data som henter den fra PDF-filer, EXCEL-tabeller, data på HTML-sider.

http://www.ciradar.com/Competitive-Analysis.aspx er et av verdens beste systemer for informasjonsinnhenting for konkurransedyktig intelligens på deep web. Henter nesten alle typer filer i alle formater om emnet av interesse. Implementert som en webtjeneste. Prisene er mer enn rimelige.

http://public.ru/ – Effektivt søk og profesjonell analyse av informasjon, mediearkiv siden 1990. Nettmediebiblioteket tilbyr et bredt spekter av informasjonstjenester: fra tilgang til elektroniske arkiver av russiskspråklige mediepublikasjoner og ferdige tematiske presseanmeldelser til individuell overvåking og eksklusiv analytisk forskning basert på pressemateriale.

Cluuz er en ung søkemotor med store muligheter for konkurransedyktig intelligens, spesielt på det engelskspråklige Internett. Lar deg ikke bare finne, men også visualisere og etablere forbindelser mellom personer, selskaper, domener, e-poster, adresser osv.

www.wolframalpha.com – morgendagens søkemotor. Som svar på en søkeforespørsel gir den statistisk og faktainformasjon tilgjengelig om forespørselsobjektet, inkludert visualisert informasjon.

www.ist-budget.ru – universelt søk i databaser for offentlige anskaffelser, anbud, auksjoner, etc.

Snakk om hva i vår tid informasjonsteknologier og den endeløse veksten i volumet av data som er tilgjengelig for både et individ og samfunnet, er det mange problemer med å behandle informasjon og søke etter den - dette er allerede blasfemi. Hvem tar ikke opp dette temaet? Og for ikke å belaste deg med subjektive og til dels objektive vurderinger hentet fra ulike informasjonskilder angående problemet, vil jeg gå direkte til løsningen. I dag skal vi snakke om søk. Det vil si om programmer og seriøse informasjonssystemer som søker etter dokumentene og dataene vi trenger.

Oppgrader "direkte søk"

For ikke så lenge siden, da trærne var store, og det ikke var mye informasjon selv på bedriftens lokale nettverk, ble ethvert søk utført ved å søke gjennom en håndfull tilgjengelige filer og konsekvent kontroll av navn og innhold. Et slikt søk kalles direkte, og programmer (verktøy) som bruker direkte søketeknologi er tradisjonelt tilstede i alle operativsystemer og verktøypakker. Men selv kraften moderne datamaskiner ikke nok for raskt og tilstrekkelig søk i gigantiske datamengder under direkte søk. Å søke gjennom et par hundre dokumenter på en disk og søke i et enormt bibliotek og flere dusin postkasser er to forskjellige ting. Derfor faller direktesøk-programmer i dag helt klart i bakgrunnen - når det kommer til universelle verktøy.

Selvfølgelig har denne typen søk ikke vært etterspurt på lenge i bedriftssektoren. Volumene er ikke de samme. Og derfor, i mange år nå, og inn I det siste Det er klart at teknologier som er i stand til raskt og nøyaktig å søke etter dokumenter i ulike formater og fra ulike kilder, er mer enn relevante. For ikke så lenge siden kunngjorde Microsofts "far" Bill Gates, tilsynelatende misunnelig på den fenomenale suksessen til Internett-søkemotoren Google, på en av pressekonferansene ønsket fra programvareindustrien (og ikke bare) om å bidra på alle mulige måter, utvikle og utdype etableringen av søkemotorer og teknologier. Men det er for tidlig å lage et fenomenalt fungerende program fra Microsoft eller en konkurrerende server på Internett (MSN når fortsatt ikke Google). La oss derfor gå til eksisterende utvikling. Indeks, spørring, relevans

Moderne teknologier er basert på to grunnleggende prosesser. For det første er det å indeksere den tilgjengelige informasjonen og behandle forespørselen med påfølgende utdata av resultatene. Når det gjelder det første, et hvilket som helst program (det være seg en stasjonær søkemotor, bedrift Informasjon System eller Internett-søkemotor) oppretter sitt eget søkeområde. Det vil si at den behandler dokumenter og genererer en indeks over disse dokumentene (en organisert struktur som inneholder informasjon om de behandlede dataene). I fremtiden er det den opprettede indeksen som brukes til arbeid - raskt å få en liste over nødvendige dokumenter i henhold til forespørselen. Det som følger, selv om det på ingen måte er enkelt når det gjelder teknologi, er ganske forståelig for den gjennomsnittlige brukeren. Programmet behandler forespørselen (ved hjelp av en nøkkelordsetning) og viser en liste over dokumenter som inneholder denne søkeordsetningen. Siden informasjonen er inneholdt i en strukturert indeks, er forespørselsbehandlingen mye raskere (titil og hundrevis av ganger!) enn ved direkte søk (utvelgelsen av dokumenter utføres ikke ved å telle opp filer, men ved å analysere tekstinformasjon i indeks).

Programmet viser de funnet dokumentene i den resulterende listen i henhold til relevans - dokumentets samsvar med søketeksten. I forskjellige teknologier er det selvfølgelig forskjellige metoder for å søke og bestemme relevansen til et dokument (antall "forekomster" av et ord og dets omtalefrekvens i dokumentet, forholdet mellom disse parameterne og det totale antallet ord i dokumentet, avstanden mellom ordene i søkefrasen i de søkte filene, og så videre). Basert på disse parametrene bestemmes "vekten" til dokumentet, og avhengig av den vises en bestemt fil i resultatlisten på en bestemt posisjon. Når det gjelder Internett-søk, er situasjonen enda mer komplisert. Faktisk, i dette tilfellet må mange andre faktorer tas i betraktning (Googles Page Rank er et eksempel på dette). Men dette er et emne for en egen artikkel, så vi vil ikke røre Internett. Gjennomgang av søkemotorer

I dette materialet Mulighetene til flere populære søkeprogrammer, som kan skilte med både greie hastigheter og god funksjonalitet, vurderes. Men å vise seg frem i brosjyrer er én ting, men å stå under blikket til en ekspert er noe helt annet. Og det var ikke flere eksperter, ikke mindre et kontor fullt av folk som likte å tukle med programvaren for dens brukervennlighet. På en eksperimentell datamaskin (Athlon 2,2 MHz, med 1 GB RAM, en 160 GB Seagate IDE-harddisk ved 7200 rpm og Windows-system XP) ble et sett med programmer installert: dtSearch Desktop, Bloodhound Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. For testene ble det satt sammen en tekstdatabase med dokumenter i doc-, txt- og html-formater med en total størrelse på verken mer eller mindre, men 20 gigabyte. En gruppe kamerater under ledelse av din ydmyke tjener testet, sammenlignet og delte sine subjektive inntrykk av hver programvare. Les et sammendrag av funnene nedenfor. dtSearch Desktop

Et program som ifølge utviklerne hevder å være det raskeste, mest praktiske og beste søkemotor. Som, generelt, alle andre fra denne anmeldelsen. dtSearch-grensesnittet er ganske enkelt, men noen vinduer eller faner er noe overbelastet med elementer, noe som gjør det vanskelig å bruke. Men i virkeligheten er det ingen spesielle vanskeligheter. Det eneste virkelig ubehagelige punktet er programvarens mangel på støtte for det russiske språket (til tross for at programmet kan søke etter dokumenter på flere språk, er grensesnittet utelukkende engelsk).

Men dtSearch er et av få programmer som kan indeksere nettsider til en brukerspesifisert "dybde" (riktignok tatt i betraktning "ekstra kjøp" av dtSearch Spider-tilleggssettet). Dette kommer i tillegg til å støtte filer på disk av ulike tekstformater og e-poster fra postkasse Outlook. Samtidig kan ikke programmet fungere med databaser, som er en så velsmakende bit for søkemotorer på grunn av de store mengder informasjon som finnes i dem og deres brede distribusjon i selskaper, og derfor i bedriftsnettverk. Hastigheten på å indeksere dtSearch-dokumenter viste seg å være på riktig nivå. Når jeg ser fremover, vil jeg si at dette programmet taklet indekseringen av en gitt mengde informasjon på nivå med en annen konkurrent - iSYS - og delte andreplassen med den i listen over de raskeste systemene. dtSearch indekserte en test 20 gigabyte med informasjon på 6 timer og 13 minutter, og skapte en indeks på 7,9 GB for påfølgende søkebehov.

Når det gjelder søkefunksjonene, her er de på riktig nivå. For det første har dtSearch et morfologisk søk (søker etter et ord i alle dets morfologiske former). Ved hjelp av denne sjansen, frigjør du deg selv fra for eksempel tanker som "i hvilket tilfelle ble et bestemt ord brukt i dokumentet jeg trengte?" Bruk av morfologisk søk er nesten alltid berettiget, så det bør være til stede i enhver profesjonell søkemotor.

Søk etter lyd er en ikke-standard funksjon selv for profesjonelle søkemotorer. Essensen er at programmet vil søke etter ord som høres ut på samme måte som ordet du skrev inn. Og det beste er at denne funksjonen også fungerer for det russiske språket! For eksempel, når du skriver inn ordet "øre" i et søk, vil du se ikke bare ordene "øre", men også "øre" som et resultat.

Søk med feilretting er en svært viktig funksjon. Den brukes til å søke etter ord som inneholder syntaktiske feil - disse kan enten være skrivefeil eller feil i dokumenter hentet ved hjelp av tegngjenkjenningssystemer, for eksempel. Et enkelt eksempel - du leter etter ordet tastatur. Noen dokumenter inneholder ordet "tastatur", det er åpenbart at dette faktisk er ordet "tastatur", personen gjorde nettopp en skrivefeil da han skrev. Så et feilrettingssøk vil oppdage og inkludere et dokument med ordet "tastatur" i resultatet. Det er også en innstilling i dtSearch som lar deg bestemme graden av mulige feilaktige tegn.

Søk med synonymer. Denne funksjonen bruker en liste over synonymer for forskjellige ord. Så, for eksempel, ved å skrive inn ordet "rask", vil programmet også finne ordene "høyhastighet" og andre som er synonymer for ordet "rask", hvis de selvfølgelig er til stede i listen over synonymer . En ferdig liste over synonymer følger ikke med dtSearch-programmet, men det er mulig å bruke lister på Internett (det er derfor nødvendig med en tilkobling, noe som ikke alltid er praktisk), eller du kan lage din egen liste over synonymer .

I tillegg til funksjonene som er oppført, kan dtSearch søke ved hjelp av fraser som består av ord forbundet med logiske operasjoner. Hvert ord i en spørring kan tildeles sin egen "vekt", det vil si betydning. Et nyttig alternativ er å bruke en ordbok som består av uviktige ord for ikke å ta hensyn til dem når du søker, men denne ordboken er også tom og du må fylle den ut selv.

La oss deretter se på programmets muligheter når du arbeider på nettverket. Faktisk tilbyr ikke dtSearch noen spesifikke muligheter for å jobbe med nettverket. Det er imidlertid fullt mulig å bruke det på nettet. Alternativt kan du lage en slags indeks og legge den i en offentlig (delt) mappe. Selve programmet kan installeres på hver brukers datamaskin, eller det kan også plasseres i en mappe som er åpen for offentlig tilgang, og lag snarveier på en spesiell måte for hver bruker separat, ved å bruke kommandolinjeparametere, hvis formål er beskrevet i hjelpefilen som følger med programmet. Det er også en mulighet automatisk installasjon programmer til nettverket ved hjelp av MSI-fil. Dette vil ta hensyn til innstillingene for hver tilkoblet bruker.

Generelt er det et godt program fra kategorien profesjonelle søkemotorer. Det kan kvalifisere for en god vurdering, men å få tillit og respekt fra brukere er kanskje ikke lett for dtSearch på grunn av visse faktorer (ikke alt er glatt med grensesnittet, russiske brukere er fratatt, det er ingen lyse funksjoner for å jobbe med nettverket) . Når det gjelder direkte søk etter dokumenter, hadde programmet ingen problemer med russisk tekst. Siden det ikke var noen med den deklarerte morfologien, eller med et uklart søk. Systemet ganske tilstrekkelig funnet nødvendige dokumenter og ved en enkel forespørsel i ett ord og ved å bruke et par avsnitt eller et dokument som nøkkeluttrykk.

Offisiell side:
Distribusjonsstørrelse: 23 Mb Bloodhound Prof Deluxe

Basert på navnet kan du gjette at det er støtte for det russiske språket i dette programmet. Dette er allerede fint. Når det gjelder grensesnittet, generelt er det noe uvanlig, men utseendemessig er det veldig attraktivt. En annen ting er bekvemmelighet. Et veldig kontroversielt kriterium, men likevel, sannsynligvis, er en flervindusløsning ikke det mest vellykkede alternativet (forespørselen legges inn i ett vindu, resultatet vises i et annet og lignende).

Snoop bruker de samme indeksene for å utføre et raskt søk, men indeksering er mye tregere enn andre programmer. Dette er veldig rart, spesielt med tanke på at evnene for behandling av søk er svært svake, og derfor er indeksstrukturen ikke kompleks. Mest sannsynlig er dette på grunn av uoptimaliserte algoritmer. Dette programmet viste seg å være en tydelig outsider når det gjelder indeksering og søkehastigheter: tiden brukt på å lage indeksen var seks ganger lengre enn samme dtSearch og iSYS. Indeksering av 20 gigabyte med tekster for blodhunden resulterte i 38 timer og 46 minutters arbeid. Og det opprettede "søkeområdet" tok opp samme størrelse på harddisken som de originale dataene med et lite minus - 19 gigabyte.

Bloodhound kan presenteres som et alternativ til standardsøket i Windows; det er usannsynlig at det er i stand til mer. Om at Blodhundens førsteprioritet er enkelt søk filer indikeres ikke bare av et lite antall funksjoner for å analysere teksten i søkespørsmål og et avansert søk etter filattributter, men til og med et resultatvindu som gir direkte lenker til filene som er funnet, så vel som til mappene som inneholder disse filene. Resultatvinduet er lite informativt i den forstand at du kan lese hele filen som ble funnet bare ved å kjøre den, det vil si at den ikke har en innebygd filviser. Men et utdrag fra filen der det søkte ordet ble funnet vises; generelt minner dette visningsskjemaet veldig om Internett-søkemotorer.

Når vi snakker om spesifikke funksjoner for å behandle søkespørsmål, er det verdt å merke seg at det ikke er noe som heter "søketekst"; det maksimale som kan søkes er en setning, om ikke annet fordi det ikke er noe flerlinjers tekstinntastingsfelt. Du kan imidlertid også analysere den angitte frasen, og Snoop tilbyr oss et standard søkesett her: logiske operasjoner, maskesøk og sitatsøk... ikke mye. Programmet inneholder noen rudimenter av morfologisk søk, men det er sannsynligvis så grovt at det mest sannsynlig forstyrrer korrekt drift (under tester ble det lagt merke til mange feil med feil bruk av morfologi).

Men programmet lar deg spesifisere filattributter når du søker (dokumentdato, filnavn, mappenavn), og i disse spørringene kan du også bruke det samme søkesettet. Du kan også søke etter bokstaver ved å spesifisere parametrene (Fra, Emne... osv.).

Så vi fant ut selve søket, hva annet er interessant med programmet, som det mottok så mange priser for, ifølge informasjon fra det offisielle nettstedet? Det er vanskelig å si hva som er så spesielt med det; mest sannsynlig er Bloodhound-grensesnittet attraktivt (nøyaktig i utseende, for ikke å nevne brukervennlighet).

Operasjoner med indekser er veldig standard; en fin funksjon er muligheten til å oppdatere indekser på en tidsplan. I tillegg kan indekser også brukes online. Fra nå av trenger vi flere detaljer.

Til tross for primitiviteten til søkespørringer, kan programmet brukes til å søke etter filer, slik at bruken kan rettferdiggjøres i nettverk. Selv om dette er en strekk, siden i et stort nettverk er prioritet å raskt søke etter data ved hjelp av komplekse søkespørringer på grunn av den enorme mengden informasjon - og det er helt klart problemer med hastigheten på søket og programmet. Jeg må si at arbeidet med nettverket på Izhishika er gjennomtenkt som det skal. En egen applikasjon er designet spesielt for dette - Bloodhound Server. Det fungerer på samme måte som ganske enkelt Snooper (de har samme søkemotor), bare for dokumenter som ligger på en sentral server eller på delte ressurser i bedriftsnettverk. Snooper Server oppretter nye indekser på delte ressurser eller bruker tidligere opprettede. Enhver bruker av bedriftsnettverket kan koble seg til søkeserveren og bruke den til å få tilgang til ethvert dokument (plassert i gjeldende indeks) ved hjelp av en nettleser. Enig, denne ordningen er ekstremt praktisk: det viser seg at filer på ditt eget nettverk kan søkes på samme måte som informasjon på Internett gjennom for eksempel Google.

Ved å vurdere alle fordelene og ulempene ved dette programmet, antyder konklusjonen seg selv at dets evner mest sannsynlig ikke er nok for bedriftsnettverk (til tross for den gode organiseringen av å jobbe med nettverket), men for en hjemmedatamaskin eller til og med for et hjemmenettverk er det , i prinsippet, , kan det komme opp. Selv om verken arbeidshastigheten eller søkemulighetene inspirerer til optimisme...

Offisiell nettside på russisk:
Distribusjonsstørrelse: 6 MbGoogle Desktop Search + GDS Enterprise

Selvfølgelig kunne vi ikke ignorere en så kjent utvikler. Navnet Google sier allerede mye. Folk som har brukt den kraftigste Internett-søkemotoren i årevis, vil helt sikkert, uten en eneste tvil, bestemme seg for å installere denne søkemotoren på datamaskinen. Bare tenk: Google på hjemmedatamaskinen! Men uten å gi etter for provokasjoner med et bredt markedsført merke, la oss prøve nøkternt, og viktigst objektivt, å vurdere mulighetene til "desktop"-søkemotoren fra Google.

Det første som fanger oppmerksomheten er mangelen på et eget skall for programmet. Google Desktop Search er fortsatt plassert i nettleservinduet, henholdsvis hele grensesnittet til skrivebordsversjonen ble arvet fra programvaren fra den eldre Internett-broren. Hvorvidt dette er bra eller dårlig er et problem: noen liker minimalismen i utformingen av denne søkemotoren, mens andre ønsker å se en fullverdig applikasjon fylt med alle slags knapper og så videre.

Hva fanger oppmerksomheten din rett etter designet? Og det faktum at det samme Google Desktop Search begynner å indeksere alt på datamaskinen, uten noen etterspørsel! Og det som er mest interessant er å velge indekseringsbaner når Google-hjelp Desktop Search er ikke mulig. Du må laste ned et eget program (TweakGDS), som lar deg utvide litt Google-innstillinger Desktop, inkludert spesifisering av stedene som kreves for indeksering. Selv om når du finner ut av alt dette, vil den allerede indeksere en standard harddisk, så denne innstillingen er mer sannsynlig å være nødvendig når du arbeider med store datamengder, noe som er veldig viktig når det brukes i bedriftsnettverk (Enterprise-versjoner) . Det er imidlertid ikke et faktum at etter å ha lastet ned TweakGDS, vil problemene dine være løst. Hun trenger tross alt Microsoft for å jobbe. NET Framework og Microsoft Scripting Runtime. Ja... installasjonen, samt tilgang til innstillingene, kunne vært gjort enklere, selv om utviklerne sikkert kan forstå: hvorfor skrive noe nytt når det er en ferdig søkemotor, portert det til lokal datamaskin og la brukeren "nyte", og la det berømte navnet lage nok et mesterverk av "dette". Kom igjen, la oss avslutte denne lyriske digresjonen og gå videre til søket.

Når det gjelder å analysere søk og levere resultater, er alt her helt identisk med Google på Internett: det samme systemet for å vise resultater, det samme standardsettet med logiske operasjoner for søk. Generelt er Google Desktop Search, som det forrige programmet, utelukkende beregnet på å søke etter filer - det har selvfølgelig ikke en intern visningsprogram for disse filene. Antallet filformater som støttes av Google Desktop Search er ganske tilstrekkelig, og det er også fint at det søker på besøkte Internett-sider og henter data fra hurtigbufferen. Søke- og indekseringshastigheter er ganske akseptable. Sant, for hjemmebruk. Google Desktop Search taklet imponerende 20 gigabyte med tekster på 8 timer og 17 minutter. Å bruke flere dager på å behandle informasjon fra bedriftsnettverket til en stor bedrift er ikke noe noen systemadministrator ønsker å gjøre. På plussiden: størrelsen på den opprettede indeksen var på samme nivå (4,5 GB) som en annen søkemotor testet i denne anmeldelsen - SearchInform.

Den store fordelen (eller ulempen – du bestemmer selv) med Google Desktop Search er at den støtter plugins, som kan endre mye til det bedre. En annen ting er at å koble til plugins og sette dem opp kompliserer oppgaven med å installere en søkemotor så mye at du begynner å lure på om alt dette er nødvendig når du kan installere en vanlig en. fullverdig program, der alt allerede vil være til stede. Tross alt, for å bruke hver funksjon må du installere en ny plugin. Selv for at programmet skal fungere fullt ut med arkiver, trengs en egen gadget. Det er fascinerende og forførende at alle disse tilleggsmodulene er gratis. Men hvis du ikke tar hensyn til skrivebordsversjonen av søkemotoren, kan det hende at kompetent konfigurasjon av GDS Enterprise ikke er innenfor din makt - tross alt er det ikke for ingenting at spesialister fra Google tilbyr sine tjenester for å sette opp sine egne programvare for nettverket ditt for kun $10 000.

Hvis du går gjennom oppsetts- og installasjonsprosedyren (eller betaler $10 000 til et raskt svar-team fra Google), vil du forstå at kompleksiteten til installasjonen mer enn kompenseres av de svært fleksible innstillingene når den brukes i bedriftsnettverk. Et viktig poeng Google arbeid Desktop på et bedriftsnettverk skal brukes gruppepolicyer, som gjør det mulig å sette innstillinger for hver bruker.

For å oppsummere, den mest fornuftige bruken av dette programmet er en hjemme- eller jobbdatamaskin. Tross alt, for vanlig datamaskin Du trenger bare å installere programmet - det vil gjøre resten selv (det vil ikke engang spørre deg om noe).

Google Desktop Search Enterprise vil imidlertid være akseptabelt i tilfeller der det er et presserende behov for fleksibel konfigurasjon av nettverkspolicy for å bruke søkemotoren, mens muligheten til å behandle søkespørsmål vil være på andre plass i viktighet, og tiden (eller pengene) ) brukt på å sette opp programmet vil være på førsteplass.

Offisiell side:
Distribusjonsstørrelse inkludert TweakGDS: 1,2 MbCopernic Desktop Search

Klikk på bildet for å forstørre

Programgrensesnittet fremkaller ekstremt positive følelser - alt er gjort i samsvar med allment aksepterte standarder, ingenting overflødig, med et ord, en hyggelig design. For en nybegynner vil det være veldig enkelt å forstå Copernic Desktop Search-grensesnittet. Selv om det er noe forvirrende at designerne tydelig opprettet programgrensesnittet med tanke på det faktum at programmet vil fungere i standard Windows XP-tema. Når du bruker det klassiske temaet, ser ikke programmet så pent ut. Men dette er mer en smakssak.

Ved første oppstart ber programmet deg om å lage indekser for søk. Det virket noe uvanlig at etter å ha valgt mapper for indeksering, tilbød ikke programmet å trykke på noen knapp, for eksempel "Start indeksering", og indeksering startet ikke automatisk, først da ble det lagt merke til at Copernic prøvde å starte indeksering mens datamaskinen var ledig. Du må grave litt dypere inn i programmets alternativer for å konfigurere alt riktig. Det skal bemerkes at det er ganske brede muligheter for å sette opp automatisk indeksoppretting: en innebygd planlegger, muligheten til å indeksere mens datamaskinen er inaktiv, i bakgrunnen, med lav prioritet. Indekseringen var ikke for rask - 10 timer 51 minutter - dette er tregere enn i andre søkemotorer (bortsett fra Isle of Bloodhound, men Copernic er fortsatt en størrelsesorden raskere enn utviklingen av iSleuthHound Technologies.

Nå om strukturen til indeksen. Generelt er det ikke noe spesielt med det. Det er mulig å velge filtyper, både i generell og detaljert form. Det vil si at du i utgangspunktet kan velge hva du vil indeksere - Dokumenter, Bilder, Videoer, Musikk. På den andre fanen i alternativvinduet vil du kunne velge spesifikke filtyper etter utvidelse. I tillegg kan du konfigurere indeksen slik at for eksempel bilder som er mindre enn 16x16 i størrelse ikke indekseres eller lydfiler som er mindre enn 10 sekunder lange ikke indekseres. I tillegg til å indeksere filer fra mapper, kan Copernic jobbe med e-poster og kontakter fra adresseboken til Microsoft Outlook og Microsoft Outlook Express, og det er mulig å indeksere favoritter og historikk fra Internet Explorer.

Når det gjelder søkemulighetene, er de veldig svake her. Under tester ble det til og med avslørt at programmet ikke søker etter dokumenter i txt- og html-formater på russisk, slik at du bare kan finne dem etter titler og ikke etter innhold. Det eneste programmet gir for å forbedre søkeeffektiviteten er bruken av et standard sett med logiske operasjoner, og selv da ble denne funksjonen oppdaget eksperimentelt, siden den ikke ble dokumentert. Forresten, ikke alt er i orden med programmets hjelp heller - det er bare tilgjengelig via Internett, som du ser er veldig upraktisk, og til og med på Internett referanse informasjon ikke for mye. Tilsynelatende bestemte utviklerne at det enkle grensesnittet til programmet ikke innebærer tilstedeværelsen av normal hjelp. For å fortsette samtalen om søkefunksjoner, bør det bemerkes at til tross for den svake analysen av spørringer, gir programmet et interessant søkesystem - brukeren kan velge filtype (bilder, videoer, musikk, etc.), angi et søk spørre og velg attributter som er spesifikke for valgt filtype. For eksempel, for lydfiler, kan disse være verdier fra mp3-tagger (artist, album, dato, etc.), for bilder kan du for eksempel velge størrelse (etter oppløsning), generelt har hver type sin egne innstillinger. Etter å ha søkt etter en bestemt filtype, vil programmet vise en svært informativ liste i resultatvinduet, og hvis forespørselen din inkluderer filer av andre typer, kan du åpne dem ved å klikke på en bestemt lenke.

Separat er det verdt å nevne resultatvisningsvinduet. Under listen over funnet filer vises innholdet i disse filene (et lignende opplegg brukes ofte i e-postklienter). Det er sant at tekstvisning bare kan gjøres i det opprinnelige formatet, og det er ingen ren tekstvisningsmodus, noe som ikke alltid er praktisk, siden det tar mer tid å åpne et dokument i dette tilfellet. Men gitt at Copernic kan søke etter bilder og musikk, er det mulig å se disse multimediefilene.

De grunnleggende prinsippene for driften av dette programmet er beskrevet, la oss nå se hva Copernic Desktop Search kan tilby oss for å jobbe med nettverket... I prinsippet kan du se veldig lenge, men du vil neppe kunne se noe . Dette programmet var med andre ord ikke ment å være nettverksbasert. Copernic Desktop Search er utelukkende en hjemmesøkemotor.

Åpenbart er den eneste (mest logiske) applikasjonen av dette programmet hjemmedatamaskin. Her vil den fullt ut takle alle enkle brukersøk som består av ett eller to ord, vil finne nødvendig informasjon, og inndeling av søk etter filtype og støtte for multimediefiler sammen med bakgrunnsindeksering i lavprioritetsmodus, kombinert med en hyggelig grensesnitt, bare gi programmet styrke til å få tillit blant uerfarne brukere.

Offisiell side
Distribusjonsstørrelse: 2,6 MbISYS Desktop

Klikk på bildet for å forstørre

Et veldig kraftig program. Når det gjelder utstyrsnivået med alle slags funksjoner, er det et sted i nærheten av neste SearchInform søkesystem på listen. Samtidig størrelsen installasjonsfil mer enn 40 Mb! Det er vanskelig å si hva som kan presses inn i slike dimensjoner, fordi den samme SearchInform, med lignende funksjonalitet, tar opp 15 Mb.

Installasjonsprosessen her er heller ikke veldig hyggelig, eller rettere sagt ikke engang installasjonsprosessen. Selv før du laster ned programmet, vil du bli bedt om å registrere deg, ellers er det ingen måte. Deretter grensesnittet. Det er laget veldig pent, ingenting unødvendig fanger øyet, men dette er inntrykkene til en person som allerede er litt vant til det. Det vil ikke være lett for en nybegynner å finne ut hvor og hva som ligger, hvor du skal klikke og hvor du til slutt skal søke. Det anbefales på det sterkeste å lese hjelpen før du starter arbeidet - du vil spare mye nerver og tid. I tillegg til alt annet er den fullstendige mangelen på støtte for det russiske språket i programmet. Ikke bra. I tillegg er ikke vinduene her overbelastet med kontroller, men vi måtte betale for dette med multimoduler og bruk av ekstra vinduer. For eksempel legges søk inn ved å starte ett program, og indeksstyring utføres ved hjelp av et annet program. Søkespørsmål legges også inn her i separate popup-vinduer. Det er vanskelig å si hva som er bedre - et overbelastet grensesnitt eller allestedsnærværende multivinduer; snarere er det en smakssak.

Når det gjelder å lage indekser, gir programmet funksjoner for å forenkle prosessen med å sette alternativer for en ny indeks. Disse funksjonene inkluderer flere ferdige malerå lage indekser for mappen «Mine dokumenter», «Mail», «Mail og dokumenter», «Spesifikk mappe», «Mappe med et utvalg av filtyper» osv. Slike maler forenkler opprettelsen av indekser i det første trinnet. Verktøyet for å jobbe med indekser har ikke et veldig godt grensesnitt, noe som er skremmende med en viss kompleksitet (dette er en veldig subjektiv vurdering, for å være ærlig), men hvis du ser på det, gir det mange nyttige alternativer og generelt , dens bruk forårsaker ikke store problemer. ISYS Desktop kan indeksere data fra ulike datakilder, og gir også mange fleksible innstillinger for slik indeksering. Blant tilleggsfunksjoner for indeksering: støtte for SQL, FTP, TRIM Context, WORLDOX 2002, skript. Ved opprettelse av en indeks, hvis du valgte punktet "Mappe med utvalg av filtyper", har du mulighet til å velge filtyper for indeksering manuelt (i utvidelse). Det må sies at det ganske enkelt er et stort antall støttede filtyper, men legg til din egen type (utvidelse) til eksisterende liste det vil ikke fungere. Du kan også merke tilstedeværelsen av en indekseringsplanlegger. Å lage en indeks og behandle 20 gigabyte med informasjon tok ISYS Desktop 6 timer og 13 minutter, og viste til slutt en god tid og størrelsen på den opprettede filen - 7,9 GB.

Søkemulighetene til dette programmet er ganske gode. Det som brukes i ISYS er mye kraftigere enn konvensjonell støtte for logiske operasjoner. Blant de avanserte søkemulighetene tilbyr programmet bruk av synonymer og et sorteringsfilter (etter bane, navn og dato for filoppretting). Sett logiske operatorer noe bredere enn standardsettet. I tillegg til logiske operasjoner lar programmet deg jobbe med mange andre operatører, som i prinsippet kan erstatte noen typer søk, for eksempel kan søk med parsing erstattes fullstendig ved å bruke spesielle operatører. Jeg ble veldig overrasket over at programmet ikke har et søk ved hjelp av morfologi. Dette er en alvorlig utelatelse, siden søkeeffektiviteten forbedres betraktelig ved bruk av morfologisk analyse. I tillegg er det ingen liste over betydningsfulle ord, men det er en omfattende liste over uvesentlige ord. Det er også oppgitt slike søkefunksjoner som "tilnærmet søk" og "heuristisk analyse".

ISYS gir et utvalg av flere typer søk, nemlig visuelle typer. Dette gjøres ved å bruke forskjellige typer vinduer for å legge inn søk, men faktisk tillater ikke et eneste vindu bruk av andre teknologier enn de som er oppført ovenfor.

Søkeresultatene er svært informative og vises som en liste over dokumenter sortert etter relevans. En forhåndsvisning av det valgte dokumentet vises nedenfor. I motsetning til Copernic Desktop Search, er forhåndsvisning her kun tilgjengelig i form av ren tekst; det var ikke mulig å vise dokumenter i deres opprinnelige format, det være seg Word, Html eller PDF, selv om dette i prinsippet ikke er for kritisk. Programmet lar deg dele opp funnet dokumenter i grupper i henhold til visse kriterier (som standard er de delt inn etter relevans). Du kan også se dokumenter som allerede er funnet ved å velge individuelle mapper (dette er praktisk når resultatet produserer et veldig stort antall dokumenter).

Å bruke programmet på et bedriftsnettverk er også svært berettiget, siden det gir gode muligheter for å organisere nettverkssøk. Søkesystemet er basert på opprettelsen av en offentlig indeks som inneholder indekserte data fra offentlig tilgjengelige nettressurser.

Faktisk er programmet fra ISYS verdig oppmerksomhet, i det minste å bli kjent med det. Dette programmet er et modent prosjekt med et stort antall funksjoner (ikke alltid og ikke alle trenger dem selvfølgelig, men likevel). Sjansene for at programmet vil se noen forbedringer når det gjelder behandling av søk er ukjent, men for øyeblikket kan det anbefales for nesten universell bruk. Og gitt at det fortsatt er for tungt for hjemmesystemer, er de viktigste stedene for installasjonen bedriftsnettverk.

Offisiell side:
Distribusjonsstørrelse: 40 MbSearchInform

Klikk på bildet for å forstørre

Det er sannsynligvis ikke verdt å starte med en gang med en beskrivelse av SearchInform-grensesnittet. Vi bør først beskrive installasjonsprosessen, eller snarere en av detaljene: du kan ikke installere programmet uten en Internett-tilkobling. Faktum er at før den første lanseringen krever programmet brukerregistrering (gratis) og sender alle innlagte data til serveren. Tilsynelatende måtte utviklerne ta slike tiltak i kampen mot piratkopiering, men dette hadde ikke en positiv effekt på installasjonsvennligheten.

Programgrensesnittet er designet i samsvar med alle generelt aksepterte regler, men ved første øyekast er det noe tungvint. Når du bruker programmet for første gang, ser det ut til at det er for komplisert, noen ganger er det ikke lett å huske i hvilken meny eller på hvilken fane det ønskede alternativet er plassert, men med lengre bruk virker grensesnittet ikke lenger så forferdelig komplekst . Det viktigste er å lese sertifikatet først.

Etter å ha forstått grensesnittet litt, kan du begynne å lage en indeks. Selve prosessen er veldig enkel og indekseringshastigheten, selv etter øye, er betydelig høyere enn alle andre søkemotorer i anmeldelsen. Tydelige testtall viser at SearchInform er dobbelt så rask som dtSearch og iSYS når det gjelder indekseringshastighet! Programmet indekserte de oppgitte dataene i mengden 20 gigabyte på en rekordtid på 3 timer og 17 minutter. Og størrelsen på den opprettede indeksen viste seg å være den minste 4,4 GB - 100 megabyte mindre enn Google Desktop Search.

Programmet støtter, i tillegg til vanlige filer og mapper, også indeksering av e-poster, tilkobling og indeksering av databaser (!) og andre eksterne kilder(DMS, CRM), umiddelbart under indeksering kan du spesifisere en ordbok for å utføre et morfologisk søk, og alle filattributter kan indekseres. Etter å ha opprettet indeksen, når du prøver å utføre det første testsøket etter dokumenter, kan du bli litt forvirret: "det er to typer søk her, men hvilken trenger jeg?" Som nevnt tidligere, det viktigste er å lese sertifikatet, så vil alt bli klart. Programmet kan faktisk utføre to typer søk - frasesøk og søk etter dokumenter som i innhold ligner søketeksten.

En beskrivelse av alle hovedfunksjonene for å analysere et søk ble gitt ovenfor, så nå vil vi bare vise søkemulighetene som tilbys av dette programmet. La oss starte med setningssøk: selvfølgelig, morfologisk søk, sitatsøk, logiske operasjoner, søk med ordanalyse (søk i begynnelsen av ordet, på slutten, i midtdelen eller et fullstendig samsvar), blandet siteringssøk ( når alle ord fra spørringen må være tilstede i dokumentet, men ikke nødvendigvis i den angitte rekkefølgen), søk med feilretting, bruk av synonymer, «nesten sitatsøk» (søk på den angitte setningen som sitering, men andre ord kan evt. være tilstede mellom de angitte ordene), etc. Noen av alternativene som er oppført har sine egne spesifikke innstillinger. I tillegg er det mulig å bruke en ordbok med uviktige ord, og programmet har allerede en ferdig liste over disse ordene; du kan også bruke en ordbok med prioriterte ord for å søke (selvfølgelig må du fylle den ut deg selv).

Her har vi i prinsippet kort gjennomgått alle hovedtrekkene ved setningssøk.

La oss gå videre til å vurdere funksjonene til dette programmet - søk etter lignende dokumenter. Utviklerne hevder at dette på ingen måte er et enkelt tekstsøk, det er nettopp et "søk etter lignende" - det er akkurat slik det beskrives overalt, men jammen, du kan kalle det hva du vil - hovedpoenget er . Et raskt søk på Internett kan raskt avsløre at såkalt «liknende søk» er en nyutvikling innen tekstanalyse. Dette systemet lar deg finne tekster som ligner på semantisk innhold. Det hyggeligste var at etter å ha gjennomført testsøk, viste det seg at teorien stemmer ganske bra med praksis! Programmet søker faktisk etter dokumenter med lignende innhold og viser dem i en liste, og sorterer dem etter prosentandel av likhet.

La oss deretter se på hva SearchInform (spesielt bedriftsversjonen SearchInform Corporate) tilbyr for å jobbe på et bedriftsnettverk. Det er to typer applikasjoner: serverside og brukerside. Serverdelen behandler uavhengig de angitte indeksene, og brukere kan bruke dem til søk, avhengig av tilgangsrettighetene som er tildelt dem. Brukere kan konfigureres automatisk ved hjelp av Kontoer Windows (i profesjonelle termer, SearchInform bruker NTFS Windows-autentisering), og manuelt (brukere må legges til separat). Hver bruker kan tillates eller nektes tilgang til visse indekser, og brukere kan også kombineres i grupper. Generelt er SearchInforms innstillinger for arbeid på nettverket foran Google når det gjelder fleksibilitet, og Ishhound Server når det gjelder bekvemmelighet og enkelhet.

Offisiell side:
Distribusjonsstørrelse: 14,7 Mb Sammenligning av indekseringshastigheter

Søkesystem	Indekseringstid	Indeksstørrelse
Bloodhound Prof Deluxe 4.5	38 timer 46 minutter	19 GB
Isys Desktop 7.0	6 timer 13 minutter	7,9 GB
DtSearch 7.0	6 timer 3 minutter	8,6 GB
Google Desktop Search Enterprise	8 timer 17 minutter	4,5 GB
Copernic Desktop Search *	10 timer 51 minutter	7 GB
SearchInform 1.5.02	3 timer 17 minutter	4,4 GB

* De fleste documents.html og .txt som inneholder russisk tekst, var, selv om de var indeksert, umulig å finne unntatt ved navn.

Alle programmer er verdt oppmerksomhet.

Basert på tester og en nøye undersøkelse av hvert program presentert i gjennomgangen, kan visse konklusjoner trekkes. Så Google Desktop Search Copernic Desktop Search er ganske egnet for den uerfarne brukeren som et hjemmeinformasjonssøkesystem. De takler enkle spørsmål godt, overbelaster ikke brukeren med innstillinger og er dessuten helt gratis. Googles forsøk på å komme inn på bedriftens søkemotormarked er ennå ikke særlig berettiget: for fullverdig arbeid programmet må oppdateres tilleggsmoduler, og det er langt fra enkelt å sette opp. Derfor reserverer de selvforklarende navnene Desktop Search, Copernic og Google bak seg nisjen med "desktop" søkemotorer.

Riktignok kraftigere løsninger - dtSearch, iSYS og SearchInform er heller ikke idiotsikre og tilbyr brukerne deres "desktop"-versjoner. Men til en rimelig pris, i motsetning til gratis programvare fra Google og Copernic. Du må selvfølgelig betale for kraft, hastighet og funksjonalitet. Men hovedfokuset til utviklerne av dtSearch, iSYS og SearchInform er selvfølgelig på bedriftssektoren. Nettverk, funksjonalitet, indeksering og søkehastighet er det som skiller disse produktene fra deres "konkurrenter". Basert på testresultatene ble favoritten identifisert - SearchInform. Programmet gir muligheten til å søke etter lignende dokumenter, har den raskeste indekserings- og søkehastigheten, og har et godt sett med funksjoner.