Programy na vyhľadávanie informácií v počítači. Softvér a služby pre profesionálne vyhľadávanie. Rýchlo nájdite súbory v počítači Všetko

Je to nepríjemný pocit, keď na internete nájdete súbor rýchlejšie ako na svojom počítači... Na pozadí rýchleho pokroku internetových vyhľadávačov vyzerá žáner desktopového vyhľadávania ako tichá, zarastená mláka žaburinky. Predtým existujúce ponuky od veľkých účastníkov trhu, a tu boli naraz zaznamenané aj Google aj Yandex, sa roky neaktualizovali, korporácie považovali smer za neperspektívny a stratili oň záujem. Problém však nezmizol. Natívne vyhľadávanie v systéme Windows je dobré, ale zďaleka nie dokonalé. Dobrý doplnok pridajú sa k nemu aj hrdinovia našej recenzie.

Na začiatok sa stručne pozrime na možnosti, ktoré nám ponúka. štandardný systém Windows vyhľadávanie 8. Ako viete, môžete tam vyhľadávať priamo z úvodnej obrazovky metra. Stačí začať písať text, automaticky sa otvorí vyhľadávací panel, ktorý zobrazí výsledky vyhľadávania pre nainštalované programy, súbory a priečinky. Menej známy je režim vyhľadávania v systéme nastavenia systému Windows, ale skutočne šetrí čas, ktorý by ste strávili prechádzaním mnohých mätúcich ponúk. Mimochodom, pomocou klávesových skratiek môžete rýchlo zadať rôzne režimy vyhľadávania. Win+F otvorí panel v režime vyhľadávania súborov a Win+Q otvorí programy. Kombinácia Win+W vyhľadá systémové parametre.

Pri vyhľadávaní priamo z Prieskumník systému Windows všetky ďalšie parametre sú umiestnené na samostatnom paneli nástrojov, ktorý sa nám otvorí, keď začneme niečo zadávať do vyhľadávacieho poľa. V súlade s tým sa navrhuje, aby sa zložité dopyty skladali pomocou prepínačov. Na jednej strane je to jasné a celkom jednoduché. Na druhej strane pri pokuse o vytvorenie zložitejších dopytov začínajú ťažkosti. Napríklad, ak chcete určiť presný rozsah dátumov na vytvorenie požadovaného súboru, budete musieť prvýkrát veľa pohrať. Aby ďalšie funkcie fungovali, je potrebné, aby bol požadovaný zdroj samostatne predindexovaný. Príslušnú možnosť nájdete vo vlastnostiach logické jednotky systémov. Rýchlosť práce nie je príliš vysoká. Čiastočne je to spôsobené tým, že pri vyhľadávaní systém produkuje vo výsledkoch veľký informačný šum. Windows Search štandardne hľadá zadané znaky dokonca aj vo fragmentoch názvov súborov, pričom s pôvodnou požiadavkou zaobchádza celkom voľne. Takáto nezávislosť má zmysel pri pomerne vágnych dopytoch, ale keď potrebujete nájsť niečo konkrétne, toto správanie vás jednoducho rozzúri, pretože v konečnom dôsledku sa musíte pozerať na dlhé zoznamy všelijakých nepotrebných drobností, ktorých názov obsahuje pár znakov v rovnakom poradí ako v danej požiadavke. To všetko necháva priestor pre riešenia tretích strán. Zamerajme sa na bezplatné aplikácie.

Bez toho, aby sme zachádzali do technických podrobností, existujú dva hlavné spôsoby vyhľadávania súborov Prostredie Windows. Prvým je sekvenčné prezeranie štruktúra súboru. Na urýchlenie vyhľadávania si programy môžu vytvoriť svoje vlastné pomocné indexové databázy. Nevýhodou tejto metódy je relatívne pomalá rychlosť. Výhody - schopnosť súčasne indexovať a vyhľadávať podľa obsahu súborov a dostupnosť v súvislosti s tým ďalšie možnosti. Druhým spôsobom je použitie existujúcich protokolov súborového systému NTFS. Jeho výhodou je veľmi vysoká rýchlosť, no nevýhodou je možnosť vyhľadávania len podľa názvov súborov.

Zdá sa, že spojenie týchto prístupov do jedného programu je najzrejmejším krokom, ktorý vám umožní získať to najlepšie z oboch. No aj ten najzaujímavejší nápad môže pokaziť nedostatočne kvalitná realizácia. Preto tu, žiaľ, zatiaľ neexistuje žiadny univerzálny šampión, ktorý by vyhovoval našim požiadavkám. Zaznamenám len jednu kvalitnú komerčnú aplikáciu - Ultra File Search. Preto má zmysel spoznať najlepších zástupcov špecializovaných vyhľadávačov z každého tábora.

Začnime s Listary (www.listary.com), ktorý sa integruje priamo do rozhrania Prieskumníka Windows, takže pri jeho spustení nie je potrebné sa trápiť s novými oknami. Softvér vyvoláte dvojitým kliknutím v Prieskumníkovi alebo jedným kliknutím stredným tlačidlom myši, čo sa mne osobne páči viac. Ak sa zameriate na metódu založenú na klávesnici, je lepšie použiť na volanie kombináciu klávesnice. Môžete si ho priradiť sami pri prvom spustení aplikácie. Tak či onak sa otvorí malý vyskakovací panel, v ktorom sa počas zadávania dotazu zobrazujú relevantné výsledky. Program používa protokoly NTFS, takže táto aplikácia pracuje iba s názvami súborov. Výhody oproti štandardnému Windows vyhľadávaniu – vysoká rýchlosť a prísne dodržanie zadanej požiadavky.

Listary má celkom flexibilné nastavenia, v ktorých si môžete doladiť ako správanie programu, tak aj jeho vzhľad. Je tu tiež doplnkové funkcie v duchu vlastnej histórie vyhľadávania, obľúbených položiek a príkazov.

Pokiaľ ide o samostatné vyhľadávacie aplikácie, ktoré sa spoliehajú na možnosti NTFS, jednou z najznámejších je Search Everything (www.voidtools.com). Spočiatku je prenosný a nevyžaduje inštaláciu. Jedinou výhradou je, že aplikácia môže vyžadovať dodatočné práva na spustenie, čo do istej miery obmedzuje jej použitie v prenosnej forme. S najväčšou pravdepodobnosťou je to spôsobené pridaním vlastných vstavaných serverov HTTP a FTP/ETP. Pri prvom spustení si program vytvorí vlastnú indexovú databázu, ktorú následne automaticky aktualizuje. Vyhľadávanie je rýchle a celkom presné. Rozhranie softvéru je jednoduché. Podporuje využitie plného regulárne výrazy. Z užitočných maličkostí by som rád spomenul podporu práce od príkazový riadok– na tento účel si budete musieť stiahnuť príslušný modul.

Vývojár programu má vo zvyku na dlhú dobu vypadávať z nášho hriešneho sveta, takže jeho vývoj prebieha nerovnomerne. Preto, ak sa vyskytnú otázky alebo problémy, je lepšie počítať s podporou ostatných používateľov softvéru na fóre. Okrem samotného programu ponúka vlastné SDK, takže aplikácia má už množstvo doplnkov a rozšírení.

Dobrou alternatívou k tomuto programu je aplikácia FileSearchy (www.filesearchy.com). Po prvé, bol preložený do ruštiny. Po druhé, softvér sa môže pochváliť rozhraním postaveným na záložkách, takže môžete vykonávať niekoľko vyhľadávaní naraz a pristupovať k nim podľa potreby. Výsledky vyhľadávania sa načítajú okamžite, všetko prebieha veľmi rýchlo a pohodlne.

Zaujímavosťou programu je, že ak sa nájdu adresáre a súbory, ktorých názvy sú takmer rovnaké (môže sa to stať napríklad v adresároch s hudbou alebo obrázkami), v zozname výsledkov sa zobrazia iba ikony adresárov. To sa mi zdalo výhodné, keďže stránka s výsledkami nie je preplnená zbytočnými prvkami a z výsledkov s najväčšou pravdepodobnosťou prejdeme do katalógu.

Podporované sú všetky klasické možnosti dotazu: vyhľadávanie podľa presnej frázy, fragmentu (substitúcie), ako aj použitie regulárnych výrazov. Neexistuje žiadne ustanovenie pre správu zoznamu nájdených položiek, okrem triedenia podľa rôznych kritérií. Režim zobrazenia: iba obyčajný textový zoznam. To nie je veľmi výhodné, ak je cieľom vyhľadávania obrázok. Väčšina obrázkov v skutočných archívoch na našich počítačoch má vygenerované názvy, ktoré sú málo nápomocné pri vyhľadávaní, toto nie je grafická miniatúra.

Program SearchMyFiles (www.nirsoft.net/utils/search_my_files.html) pracuje v súlade s iným modelom organizácie vyhľadávania a dokáže vyhľadávať nielen podľa mien, ale aj podľa obsahu súborov. Spočiatku je prenosný, takže na spustenie aplikácie stačí rozbaliť stiahnutý archív. Na rusifikáciu rozhrania si budete musieť stiahnuť a skopírovať ruský prekladový súbor, ktorý je k dispozícii na jeho webovej stránke, do adresára programu. Nie je potrebné meniť žiadne nastavenia, pri ďalšom spustení SearchMyFiles vás privíta ruské rozhranie. Štandardný režim vyhľadávania je pokročilý. Dosť podrobné možnosti zhromaždené v jednom dialógovom okne, pomocou ktorého môžete vytvárať pomerne sofistikované dotazy. Atribúty súboru možno použiť aj ako funkcie vyhľadávania. Je podporované vyhľadávanie podľa masiek. Osobne sa mi veľmi páči možnosť vyhľadávania viacerých rozsahov dátumov vytvorenia súboru naraz – v niektorých prípadoch to naozaj pomohlo a ušetrilo veľa času. V súboroch môžete vyhľadávať nielen text, ale aj ľubovoľné údaje. Je veľmi výhodné, že vo fulltextovom režime môžete používať logické operátory vylúčenia. Okrem jednoduchého vyhľadávania túto aplikáciu možno použiť aj na identifikáciu duplicitných súborov.

Program na rýchle vyhľadávanie súborov v určené priečinky podľa názvu súboru aj podľa jeho obsahu. Na rozdiel od štandardnej funkcie vyhľadávania systému Windows vysoká rýchlosť a prevádzkovú efektivitu, ako aj schopnosť nájsť súbory aj v archívoch!

Galéria snímok obrazovky

Práca na počítači, tak či onak, zahŕňa prácu s rôznymi textovými údajmi. Či už hľadáme informácie na internete, píšeme výročnú správu alebo len čítame knihu, všade, kam ideme, sa stretávame s textom!

Zvyčajne vieme, kde sa nachádzajú všetky naše pracovné súbory, pretože ich otvárame takmer každý deň. Ale niekedy nastanú situácie, keď si spomenieme, že niekde sme mali dokument s potrebnými informáciami, ale zabudli sme, kde to bolo a ako sa to volal.

Máme dve možnosti: môžeme sa buď manuálne pokúsiť nájsť súbor, ktorý potrebujeme, otvorením a kontrolou všetkých našich pracovných priečinkov, alebo môžeme použiť funkciu Windows na vyhľadanie slova alebo frázy.

Ak však máme veľa priečinkov a súborov, manuálne nájsť čokoľvek je takmer nemožné a vstavaný vyhľadávací nástroj dokáže vyhľadávať iba v bežných textové súbory(Windows 7 však už vie hľadať v DOC).

V tomto prípade iba softvér tretích strán, ktorý má pokročilé možnosti vyhľadávania. Všetky programy tohto druhu možno rozdeliť do dvoch kategórií: tie, ktoré používajú mechanizmus indexovania, a tie, ktoré ho nepoužívajú.

Tie aplikácie, ktoré pri skenovaní nepoužívajú indexovanie, v skutočnosti zakaždým kontrolujú všetky súbory na prítomnosť vyhľadávacieho reťazca, to znamená, že automaticky implementujú mechanizmus podobný manuálnemu vyhľadávaniu.

Zvýšenie rýchlosti v porovnaní s štandardné prostriedky vyhľadávanie, sa získava najmä vďaka lepšej paralelizácii dopytov do systém súborov, ale stále to môže trvať dosť dlho.

Princíp indexovania súborov na lokálnom PC je v podstate rovnaký ako na internete. Program vopred naskenuje zadaný disk alebo priečinok a vytvorí databázu súborov s možnosťou rýchlej detekcie ich obsahu. Vďaka tomu sa vyhľadávanie uskutoční v priebehu niekoľkých sekúnd!

Nevýhodou tohto druhu programov je ich výhoda - nutnosť indexovať súbory, čo trvá pomerne dlho :(. Inak je podľa mňa táto trieda programov lepšia a funkčnejšia ako jej náprotivky, ktoré pracujú bez indexu, preto vám navrhujem, aby ste sa zoznámili s jedným z najlepších bezplatných programov tohto druhu - DocFetcher.

Dnes existuje pomerne veľa programov na lokálne indexovanie a vyhľadávanie súborov, ale nie všetky majú rovnaké možnosti. Z hľadiska šírky funkčnosti možno DocFetcher porovnať s populárnym plateným indexovacím systémom Archivarius 3000.

Porovnanie s plateným analógom

Z porovnania je zrejmé, že programy sa od seba málo líšia (snáď okrem rozhrania). Oba programy pracujú s takmer všetkými typmi súborov a oba vám umožňujú používať zložité dotazy obsahujúce masky vyhľadávania.

Jedinou výhodou Archivistu je, že na indexovanie používa trvalú databázu, ktorá vám umožňuje prezerať obsah, ktorý nie je dostupný v tento moment vzdialené priečinky a vymeniteľné médiá.

Aj keď to, že DocFetcher používa dynamickú databázu, nie je až také mínus, keďže automaticky indexuje pridané a odstránené súbory, ktorý vám umožňuje mať vždy po ruke najaktuálnejšiu verziu zoznamu všetkých pracovných súborov.

Príprava na prácu s programom

Ďalšou výhodou DocFetcher je prítomnosť prenosnej verzie, ktorú odporúčajú používať samotní vývojári (hoci je tiež dostupná). Vývojári odporúčajú používať prenosnú verziu z dvoch dôvodov:

  1. Prenosná verzia môže bežať na všetkých populárnych systémov, keďže je napísaný v platformovo nezávislom jazyku JAVA a obsahuje spustiteľné súbory všetkých v súčasnosti populárnych operačných systémov (Windows, UNIX a Mac OS).
  2. Ak ste zvyknutí nosiť všetky svoje pracovné súbory so sebou na flash disku alebo externom pevnom disku, potom prenosná verzia dokáže indexovať súbory aj na odnímateľné zariadenie, ktorý vám umožní nájsť potrebné súbory rovnako rýchlo ako na PC. Opäť platí, že flash disk je možné pripojiť k akémukoľvek počítaču s akýmkoľvek operačným systémom a všade budeme môcť rýchlo vyhľadávať!

Dodám, že prenosná verzia funguje o niečo rýchlejšie (neviem prečo) ako inštalačná verzia, takže ju tiež odporúčam používať!

V archíve stiahnutom z našej webovej stránky nájdete presne prenosná verzia programy. Aby to fungovalo, stačí rozbaliť priečinok "DocFetcher 1.1.9" na ľubovoľné miesto v počítači (okrem priečinka Program Files).

Budete tiež potrebovať sadu knižníc Java Runtime Environment (JRE) nainštalovanú na vašom počítači, verzia 1.6.0 alebo vyššia (aktuálne verzia 7.40). Zvyčajne je JAVA už nainštalovaná na všetkých moderné systémy ale pre istotu si to over ;)

Keď je všetko pripravené, môžete spustiť DocFetcher.

Rozhranie programu

Po spustení spustiteľný súbor DocFetcher.exe uvidíme pracovné okno programu:

Ak je váš systém v ruštine, jazyk rozhrania programu bude automaticky ruský, takže nemusíte nič meniť!

Samotné rozhranie pozostáva zo štyroch sekcií, ktoré je možné skryť/zobraziť pomocou tlačidiel s čiernymi šípkami:

  1. V ľavom hornom rohu je sekcia možností vyhľadávania. Tu môžete nastaviť minimálnu a maximálna veľkosť súbor, ktorý hľadáte, a tiež uveďte jeho príponu (všetky prípony sú predvolene aktívne);
  2. V pravom hornom rohu okna sa nachádza vyhľadávací panel s poľom na výstup výsledkov. Tu, napravo od vyhľadávacieho panela, môžete vidieť ďalšie tlačidlá, ktoré vyvolávajú pomoc, nastavenia a skrývajú okno programu v zásobníku.
  3. Oblasť vyhľadávania sa nachádza v ľavom dolnom rohu. Práve v tejto časti sa zobrazia všetky indexované priečinky s našimi pracovnými súbormi.
  4. V pravom dolnom rohu je okno náhľadu vybraného súboru. Štandardne sa v tomto okne zobrazuje readme programu, no akonáhle vyberieme súbor, okamžite sa tu zobrazí jeho obsah a hľadaná fráza alebo slovo sa farebne zvýrazní!

Mechanizmus indexovania priečinkov

Ak sa práve teraz pokúsite niečo nájsť pomocou DocFetcher, neuspejete, pretože na vyhľadávanie musí program najprv indexovať priečinky so súbormi, ktoré potrebujeme!

Aby sme to dosiahli, musíme vyvolať kontextovú ponuku oblasti vyhľadávania a umiestniť kurzor myši na jedinú aktívnu položku „Vytvoriť index z“:

Napríklad budem indexovať svoje pracovný priečinok s článkami výberom položky „Priečinok“. Okrem priečinkov však môže DocFetcher indexovať aj archívy, ukladacie súbory e-mailov programu Outlook a z nejakého dôvodu aj schránku.

Po výbere režimu indexovania sa zobrazí výzva na zadanie priečinka na skenovanie a potom sa zobrazí nasledujúce okno:

Tu môžeme nastaviť parametre indexovania, ako napríklad:

  • špeciálne pokyny na spracovanie určitých typov súborov;
  • vylúčenie určitých súborov z indexu podľa prípony alebo typu MIME (podporované sú regulárne výrazy);
  • ďalšie dodatočné nastavenia.

Ak ste bežný používateľ, nemusíte tu nič meniť. Ak ste vývojár, odporúčam vám špecifikovať súbory obsahujúce váš kód ako textové súbory v časti „Prípony súborov“.

Je to potrebné, aby DocFetcher hľadal potrebné výrazy v kóde (štandardne sú napríklad súbory PHP spracované ako HTML, to znamená, že vyhľadávanie sa vykonáva iba podľa textu viditeľného v prehliadači!).

Ak ste spokojní so všetkými nastaveniami, kliknite na tlačidlo „Spustiť“ a počkajte na dokončenie indexovania:

Programu trvá skenovanie malých priečinkov s malým počtom súborov len niekoľko sekúnd. Ak sú však priečinky veľké a majú zložitú štruktúru príloh s archívmi a obrázkami, indexovanie môže chvíľu trvať.

Ako môžete vidieť na snímke obrazovky, DocFetcher spracovával môj pracovný priečinok s hmotnosťou 3,6 gigabajtov, ktorý, ako tvrdí skener, obsahoval takmer 46 tisíc súborov (vrátane archívov) takmer pol hodiny! Dosť dlho, ale stojí za to!

Áno! Neodporúčam indexovať systémové priečinky (a jednotku C vo všeobecnosti), pretože to po prvé spomalí program a po druhé môže viesť k „ modrá obrazovka smrť“ kvôli častým zmenám obsahu...

A ešte jedna vec... Čím viac súborov v indexovanom priečinku, tým viac Náhodný vstup do pamäťe budú spotrebované programom na podporu činnosti indexu. Mojich 46 000 súborov napríklad v nečinnom režime „zožerie“ až 200 megabajtov RAM a až 20 % procesora! A v režime vyhľadávania sa stáva, že sa využívajú všetky zdroje (hľadanie našťastie trvá len pár sekúnd).

Zdá sa, že teraz viete všetko - poďme k zábavnej časti.

Jednoduché vyhľadávanie súborov v DocFetcher

Po zatvorení okna skenovania sa opäť vrátime do hlavného okna, ale teraz budeme mať indexovaný priečinok v oblasti vyhľadávania:

Kliknutím na znamienko plus naľavo od názvu priečinka rozbalíme jeho štruktúru a budeme môcť vidieť strom adresárov. Okrem bežných priečinkov strom obsahuje aj archívy, ktorých štruktúru príloh si tiež môžeme prezerať!

V predvolenom nastavení sú všetky priečinky v indexovanom adresári označené na vyhľadávanie. Vždy však môžeme zúžiť pole vyhľadávania tak, že zaškrtneme len potrebné adresáre alebo archívy.

Nechajme vybratý celý priečinok a skúsme nastaviť prvé slovo na vyhľadávanie. Nech je napríklad slovo "inštalátor". Zadajte slovo do vyhľadávacieho panela a kliknite na tlačidlo „Hľadať“:

Program premýšľal 3 sekundy a potom vytvoril zoznam 180 (pozri ľavý dolný roh pre „Výsledky“) súborov, v ktorých sa hľadané slovo vyskytuje v rovnakej forme, akú sme zadali.

Všetky súbory sú štandardne zoradené podľa indikátora „Hit“, ktorý v percentách vyjadruje mieru relevantnosti každého súboru k zadanému dotazu. V našom príklade bolo maximálne percento zhody – 22 % – priradené súboru, v ktorom sa hľadané slovo vyskytuje dvakrát (a v tom istom odseku).

Ak vyberiete tento súbor v zozname vyhľadávania, jeho obsah sa zobrazí v okne náhľadu a prvá nájdená zhoda sa zvýrazní modrou farbou (ako bežný výber). Nasledujúce zhody budú zvýraznené žltou farbou a môžete k nim rýchlo prejsť pomocou tlačidiel so šípkami nahor a nadol na paneli nástrojov výrezu.

Na rovnakom paneli pre bežné textové súbory sú ďalšie dve tlačidlá, ktoré umožňujú vypnúť zvýrazňovanie výsledkov vyhľadávania a aktivovať/deaktivovať režim zobrazenia HTML (ak je k dispozícii pre tohto typu súbor).

A ešte posledná vec. Akýkoľvek súbor v zozname nájdených je možné otvoriť bežným dvojklikom alebo pomocou kontextového menu. Ten obsahuje aj položky, ktoré vám umožňujú otvoriť nadradený priečinok súboru alebo skopírovať samotný súbor do schránky.

Používanie vyhľadávacích masiek

Pokročilí (a niekedy nie až tak pokročilí) používatelia vedia, že v internetových vyhľadávačoch môžete vyhľadávať nielen pomocou jednoduchých dopytov, ale aj pomocou rôznych špeciálnych funkcií, ktoré vám umožňujú zahrnúť/vylúčiť určité slová do/z výsledkov vyhľadávania, hľadať nepresné zápalky atď. .P.

DocFetcher, keďže ide v podstate o rovnaký vyhľadávací nástroj, ale lokálny, to dokáže tiež :). Na rozdiel od konvenčných vyhľadávacích robotov však štandardne hľadá iba presné zhody s dopytom. Aby ste obišli toto obmedzenie, musíte použiť špeciálne znaky «?» A «*» . Vysvetlím to na príklade s už uvedeným slovom "inštalátor":

Špeciálny znak "?" nahrádza jedno písmeno. To znamená, že ak ho dáme na koniec hľadaného slova, môžeme nájsť súbory, v ktorých sú rôzne formy tohto slova, v ktorých sa mení iba posledné písmeno (pozri snímku obrazovky vyššie: „inštalátor“, „inštalátor“ , atď.) . Mali by ste však pamätať na to, že pri takomto vyhľadávaní sa nenájdu súbory s hlavnou formou hľadaného slova!

Pre flexibilnejšie vyhľadávanie použite špeciálny znak „*“:

Tento symbol vám umožňuje nájsť výsledky, ktoré sú úplne ekvivalentné dopytu, alebo ktoré majú odlišné konce, ktoré nemusia pozostávať z jedného písmena, ako v predchádzajúcom prípade (napríklad súbory so slovami „inštalátor“, „inštalátori“, „inštalátori“ a dokonca „inštalátor“).

Ak chcete zadať nepresnú zhodu pre dopyt, vždy použite hviezdičku!

Mimochodom, na snímke obrazovky vyššie môžeme vidieť aktiváciu funkcie spracovania HTML kódu. IN tento režim okno náhľadu sa zmení na miniprehliadač s navigačnými tlačidlami, vyhľadávací panel a všetky požadované atribúty. Do režimu prezerania kódu môžete prepnúť pomocou krajného tlačidla na pravej strane.

Okrem použitia špeciálnych znakov uvedených vyššie, DocFetcher podporuje niektoré ďalšie funkcie vyhľadávania:

  • Booleovské operátory „AND“, „OR“ a „NOT“ (podobné ako „&&“, „||“ a „-“) na vyhľadávanie, ktoré obsahuje dve kľúčové slová súčasne, jedno z kľúčových slov alebo vylučuje jedno z slová. Napríklad: „mačka && pes“ – nájdu sa všetky dokumenty, v ktorých sa vyskytujú slová „mačka“ a „pes“, „mačka ALEBO pes“ – dokumenty, v ktorých sa nachádza aspoň jedno zo slov, „mačka – pes“ - dokumenty, kde je len slovo "mačka", bez zmienky o slove "pes". Môžete skombinovať viacero operátorov, napríklad dotaz „(mačka ALEBO pes) AND myš“ vráti všetky dokumenty, ktoré obsahujú slovo „mačka“ alebo „pes“, ako aj slovo „myš“.
  • Frázové špeciálne znaky. To zahŕňa úvodzovky a znamienko „+“. Napríklad fráza umiestnená v úvodzovkách sa bude hľadať v nezmenenej podobe (v tej, v ktorej ste ju napísali). Táto funkcia je podobná funkcii presného vyhľadávania v bežných vyhľadávačoch. Znak „+“ znamená, že slovo ním označené má prioritu, zatiaľ čo ostatné slová dopytu nemusia byť prítomné. Napríklad požiadavka „+mačka pes“ nám najskôr poskytne všetky súbory, ktoré obsahujú obe kľúčové slová, a potom tie, ktoré obsahujú iba slovo „mačka“. Ak pridáte „+“ ku všetkým dopytovým slovám, výsledok bude ekvivalentný použitiu operátora „AND“.
  • Hľadajte podobné slová. Pomocou DocFetcher môžeme vyhľadávať súbory obsahujúce slová podobné kľúčovému slovu. Ak to chcete urobiť, použite špeciálny znak „~“ na konci kľúčového slova. Napríklad dotaz „cat~“ môže vrátiť slová „kód“, „to“, „pot“ atď. Okrem toho môžeme určiť stupeň podobnosti v rozsahu od „0“ do „1“. Štandardne (ak sme nešpecifikovali hodnotu) je tento stupeň "0,5" (ekvivalent dotazu "cat ~0,5").
  • Vyhľadávanie podľa atribútov súboru. V praxi je často potrebné hľadať súbory nielen (a nie až tak) podľa obsahu, ale aj podľa určitých atribútov. Napríklad chceme nájsť všetky listy od Vasya Pupkina. Na tento účel môžete použiť nasledujúcu požiadavku: „odosielateľ:„Vasya Pupkin“. Bohužiaľ, vyhľadávanie atribútov je dostupné len pre textové súbory (atribúty: názov, názov súboru a autor) a e-mailové súbory (atribúty: predmet, odosielateľ a príjemcovia).

Existujú aj niektoré ďalšie špecifické funkcie vyhľadávania, ale keďže nie sú obzvlášť žiadané, nebudeme ich brať do úvahy (ak chcete, môžete si o nich prečítať v anglickej príručke k programu v časti „Syntax dotazu“).

Kontextové menu oblasti vyhľadávania

Dlho som rozmýšľal, či sa oplatí zamerať na kontextové menu, no nakoniec, aby som obraz takpovediac doplnil, som sa rozhodol predsa len prestať :). Ak si pamätáte, na úplnom začiatku tu bola aktívna iba prvá položka - „Vytvoriť index z“. Teraz, po indexovaní priečinka, máme k dispozícii všetky ostatné možnosti:

Ak neberieme do úvahy zrejmé funkcie ako „Aktualizovať index“ alebo „Vymazať „mŕtve“ indexy, tak nás bude zaujímať len posledná položka kontextového menu – „Zoznam dokumentov“. Jeho aktiváciou dostaneme do poľa výsledkov vyhľadávania nie výsledok žiadneho dotazu, ale zoznam všetkých súborov v priečinku, pre ktorý bola funkcia zobrazenia zoznamu dokumentov vyvolaná. Niekedy bude takáto príležitosť užitočná a dokonca pohodlná!

Nastavenia DocFetcher

Do niekoľkých nastavení programu sa dostanete kliknutím na druhé tlačidlo napravo od vyhľadávacieho riadku:

Tu by mali byť všetky parametre jasné a bez ďalších vysvetlení. Jediná vec, ktorú by ste mali venovať pozornosť, je odkaz "Rozšírené nastavenia" v ľavom dolnom rohu. Kliknutím naň sa otvorí textová správa konfiguračný súbor, v ktorom môžete vykonať jemné úpravy.

Bohužiaľ, komentáre k nastaveniam (a ich samotné) sú v angličtine, takže vám odporúčam, aby ste čokoľvek zmenili, iba ak jasne rozumiete tomu, čo vybraný parameter ovplyvní!

Výhody a nevýhody programu

  • takmer okamžité vyhľadávanie podľa názvov súborov a obsahu;
  • schopnosť vytvárať zložité otázky;
  • triedenie výsledkov vyhľadávania podľa relevantnosti;
  • vyhľadávanie v archívoch;
  • náhľad obsahu súboru so zvýraznením dotazu.
  • potreba predbežnej indexácie súborov;
  • štandardne sa hľadá prísna zhoda s požiadavkou, čo nie je vždy vhodné;
  • vysoká spotreba zdrojov pri indexovaní veľkého počtu súborov.

závery

DocFetcher nie je jediným programom svojho druhu, ale jedným z najfunkčnejších, a to aj v porovnaní s plateným softvérom.

Jediným vážnejším nedostatkom je podľa mňa fakt, že aplikácia je napísaná v JAVA, čo napriek všetkým vyjadreniam vývojárov značne zaťažuje systém. Samozrejme, pre moderné viacjadrové počítače to nie je problém, ale na starších počítačoch možno niekedy pozorovať „brzdy“.

Inak je DocFetcher výborným vyhľadávačom, ktorý môže nájsť každý za pár okamihov. dôležitý súbor len jedno slovo, ktoré obsahoval. Program bude nepostrádateľný aj pre vývojárov, pretože vám umožňuje vyhľadávať akékoľvek zložité štruktúry kódu.

P.S. Udeľuje sa povolenie voľne kopírovať a citovať tento článok za predpokladu, že je uvedený otvorený aktívny odkaz na zdroj a je zachované autorstvo Ruslana Tertyshnyho.

Každý deň sa zvyšuje objem informácií zo siete, a teda aj z počítačov používateľov. Zapnuté pevné disky Pre bežného používateľa môže počet súborov dosiahnuť niekoľko stoviek a nájsť ten, ktorý potrebujete v celkovej mase, nie je vôbec jednoduché. Štandardný vyhľadávací nástroj systému Windows nefunguje vždy rýchlo a má veľmi obmedzenú funkčnosť, takže má zmysel používať programy tretích strán.

V tejto recenzii sa pozrieme na niekoľko programov, ktoré vám pomôžu nájsť potrebné údaje v počítači.

Tento program je možno najvýkonnejším nástrojom na vyhľadávanie diskov PC. Má mnoho jemné nastavenia, filtre a funkcie. Distribúcia obsahuje aj ďalšie pomocné programy na interakciu so súborovým systémom.

Jeden z charakteristické rysy Možnosťou je vyhľadávanie v mojich súboroch úplné odstránenie súbory ich prepísaním nulami alebo náhodnými údajmi.

SearchMyFiles

Search My Files je často zamieňaný s predchádzajúcim softvérom kvôli jeho podobnému názvu. Tento program sa líši tým, že sa ľahšie používa, no zároveň mu chýbajú niektoré funkcie, napríklad vyhľadávanie na sieťových diskoch.

Všetko

Jednoduchý vyhľadávací program s vlastnými funkciami. Všetko dokáže vyhľadávať dáta nielen na lokálnom počítači, ale aj na ETP a FTP servery. Od ostatných predstaviteľov podobného softvéru sa odlišuje tým, že vám umožňuje sledovať zmeny v súborovom systéme počítača.

Efektívne vyhľadávanie súborov

Ďalší softvér, ktorý sa veľmi ľahko nastavuje a používa. Pri absolútne malá veľkosť má dostatočné množstvo funkcií, je schopný exportovať výsledky do textových a tabuľkových súborov a je možné ho nainštalovať na flash disk.

UltraSearch

UltraSearch dokáže nájsť nielen súbory a priečinky, ale aj vyhľadať informácie v obsahu dokumentov podľa kľúčových fráz alebo slov. Hlavným rozlišovacím znakom programu je automatická inicializácia pripojených médií.

R.E.M.

REM má priateľskejšie rozhranie ako predchádzajúci účastníci. Princípom programu je vytváranie zón, v ktorých sa súbory automaticky indexujú, čo môže výrazne urýchliť proces vyhľadávania. Zóny je možné vytvárať nielen na lokálnom počítači, ale aj na diskoch v sieti.

Vyhľadávanie Google Desktop

Google Desktop Search, vyvinutý svetoznámou spoločnosťou, je malý miestny vyhľadávací nástroj. S jeho pomocou môžete vyhľadávať informácie na domácom počítači aj na internete. Okrem hlavnej funkcie program umožňuje použitie informačných blokov - miniaplikácií pre pracovnú plochu.

Všetky programy uvedené v tento zoznam, sú skvelé na nahradenie natívneho vyhľadávania Windows. Vyberte si sami: nainštalujte si jednoduchší softvér, ale s menšou sadou funkcií, alebo celý vyhľadávač so schopnosťou spracovávať súbory. Ak pracujete s priečinkami a jednotkami v lokálna sieť, potom sú pre vás vhodné REM a Všetko, a ak plánujete „nosiť program so sebou“, venujte pozornosť Efektívnemu vyhľadávaniu súborov alebo Vyhľadávaniu v mojich súboroch.

Pre profesionálne vyhľadávanie Internet si vyžaduje špecializovaný softvér, ako aj špecializované vyhľadávače a vyhľadávacie služby.

PROGRAMY

http://dr-watson.wix.com/home – program je určený na skúmanie polí textové informácie s cieľom identifikovať entity a prepojenia medzi nimi. Výsledkom práce je správa o skúmanom objekte.

http://www.fmsasg.com/ - jeden z najlepších programov na svete na vizualizáciu spojení a vzťahov Sentinel Vizualizer. Spoločnosť úplne rusifikovala svoje produkty a pripojila sa horúcu linku v ruštine.

http://www.newprosoft.com/ – „Web Content Extractor“ je najvýkonnejší a ľahko použiteľný softvér na extrahovanie údajov z webových stránok. Má tiež efektívny vizuálny webový pavúk.

SiteSputnik softvérový balík, ktorý nemá na svete analógy, ktorý vám umožňuje vyhľadávať a spracovávať jeho výsledky na viditeľnom a neviditeľnom internete pomocou všetkých vyhľadávacích nástrojov potrebných pre používateľa.

WebSite-Watcher – umožňuje vám monitorovať webové stránky vrátane tých, ktoré sú chránené heslom, monitorovacie fóra, RSS kanály, diskusné skupiny, lokálne súbory. Má výkonný filtračný systém. Monitorovanie prebieha automaticky a je dodávané v užívateľsky príjemnej forme. Program s pokročilými funkciami stojí 50 eur. Neustále aktualizované.

http://www.scribd.com/ je najpopulárnejšia platforma na svete a v Rusku sa čoraz viac používa na uverejňovanie rôznych druhov dokumentov, kníh atď. pre bezplatný prístup pomocou veľmi pohodlného vyhľadávača titulov, tém atď.

http://www.atlasti.com/ je najvýkonnejší a najefektívnejší nástroj pre kvalitatívnu analýzu informácií dostupný pre jednotlivých používateľov, malé a dokonca aj stredné podniky. Program je multifunkčný a preto užitočný. Spája v sebe schopnosť vytvárať jednotné informačné prostredie pre prácu s rôznymi textovými, tabuľkovými, zvukovými a video súbormi ako jedným celkom, ako aj nástroje pre kvalitatívnu analýzu a vizualizáciu.

Ashampoo ClipFinder HD – stále väčší podiel toku informácií pochádza z videa. Preto dôstojníci konkurenčného spravodajstva potrebujú nástroje, ktoré im umožnia pracovať s týmto formátom. Jedným z takýchto produktov je bezplatný nástroj, ktorý predstavujeme. Umožňuje vám vyhľadávať videá na základe špecifikovaných kritérií na stránkach na ukladanie video súborov, ako je napríklad YouTube. Program sa ľahko používa, zobrazuje všetky výsledky vyhľadávania na jednej stránke s podrobnými informáciami, názvami, trvaním, časom, kedy bolo video nahrané do úložiska atď. Existuje ruské rozhranie.

http://www.advego.ru/plagiatus/ – program je vytvorený SEO optimalizátory, ale je celkom vhodný ako internetový spravodajský nástroj. Plagiátorstvo ukazuje mieru jedinečnosti textu, zdroje textu a percento zhody textu. Program tiež kontroluje jedinečnosť zadanej adresy URL. Program je bezplatný.

http://neiron.ru/toolbar/ – obsahuje doplnok na kombinovanie Google vyhľadávanie a Yandex a tiež vám to umožňuje konkurenčná analýza, na základe posúdenia efektívnosti lokalít a kontextová reklama. Implementované ako plugin pre FF a GC.

http://web-data-extractor.net/ je univerzálne riešenie na získanie akýchkoľvek údajov dostupných na internete. Nastavenie rezania údajov z ľubovoľnej stránky sa vykonáva niekoľkými kliknutiami myšou. Stačí si vybrať oblasť údajov, ktorú chcete uložiť, a Datacol automaticky vyberie vzorec na vystrihnutie tohto bloku.

CaptureSaver je profesionálny internetový výskumný nástroj. Jednoducho nenahraditeľné pracovný program, ktorá vám umožňuje zachytávať, ukladať a exportovať akékoľvek internetové informácie, vrátane nielen internetové stránky, blogy, ale aj RSS novinky, e-mail, obrázky a mnoho iného. Má najširšiu funkčnosť, intuitívne rozhranie a smiešnu cenu.

http://www.orbiscope.net/en/software.html – webový monitorovací systém za viac ako prijateľné ceny.

http://www.kbcrawl.co.uk/ – softvér na prácu vrátane „neviditeľného internetu“.

http://www.copernic.com/en/products/agent/index.html – program vám umožňuje vyhľadávať pomocou viac ako 90 vyhľadávačov s použitím viac ako 10 parametrov. Umožňuje kombinovať výsledky, eliminovať duplikáty, blokovať nefunkčné odkazy a zobrazovať najrelevantnejšie výsledky. Dodáva sa v bezplatnej, osobnej a profesionálnej verzii. Používa ho viac ako 20 miliónov používateľov.

Maltego je zásadne nový softvér, ktorý vám umožňuje nadviazať vzťah medzi subjektmi, udalosťami a objektmi v reálnom živote a na internete.

SLUŽBY

new je efektívny agregátor vyhľadávačov na vyhľadávanie ľudí v hlavnom ruskom jazyku v sociálnych sieťach.

https://hunter.io/ je efektívna služba na zisťovanie a kontrolu e-mailov.

https://www.whatruns.com/ je ľahko použiteľný, ale účinný skener na zistenie, čo na webovej stránke funguje a čo nefunguje a aké sú jej bezpečnostné diery. Tiež implementované ako doplnok pre prehliadač Chrome.

https://www.crayon.co/ je americká rozpočtová platforma pre trhové a konkurenčné spravodajstvo na internete.

http://www.cs.cornell.edu/~bwong/octant/ – identifikátor hostiteľa.

https://iplogger.ru/ – jednoduchá a pohodlná služba na určenie IP niekoho iného.

http://linkurio.us/ je výkonný nový produkt pre pracovníkov ekonomickej bezpečnosti a vyšetrovateľov korupcie. Spracováva a vizualizuje obrovské množstvo neštruktúrovaných informácií z finančných zdrojov.

http://www.intelsuite.com/en – online platforma v anglickom jazyku pre konkurenčné spravodajstvo a monitorovanie.

http://yewno.com/about/ je prvý operačný systém na preklad informácií do vedomostí a vizualizáciu neštruktúrovaných informácií. V súčasnosti podporuje angličtinu, francúzštinu, nemčinu, španielčinu a portugalčinu.

https://start.avalancheonline.ru/landing/?next=%2F – prognostické a analytické služby Andrey Masalovich.

https://www.outwit.com/products/hub/ – kompletná sada samostatných programov pre profesionálnu prácu na webe 1.

https://github.com/search?q=user%3Acmlh+maltego – rozšírenia pre Maltego.

http://www.whoishostingthis.com/ – vyhľadávač hostingu, IP adries a pod.

http://appfollow.ru/ – analýza aplikácií na základe recenzií, optimalizácia ASO, pozície v top a výsledky vyhľadávania pre App Store, Google Play a Windows Phone Store.

http://spiraldb.com/ je služba implementovaná ako doplnok pre prehliadač Chrom, ktorý vám umožňuje získať množstvo cenných informácií o akomkoľvek elektronickom zdroji.

https://millie.northernlight.com/dashboard.php?id=93 - bezplatná služba, ktorá zhromažďuje a štruktúruje kľúčové informácie o odvetviach a spoločnostiach. Je možné použiť informačné panely založené na analýze textu.

http://byratino.info/ – zber faktografických údajov z verejne dostupných zdrojov na internete.

http://www.datafox.co/ – Platforma CI zhromažďuje a analyzuje informácie o spoločnostiach, ktoré sú pre klientov zaujímavé. Existuje demo.

https://unwiredlabs.com/home - špecializovaná aplikácia s API na vyhľadávanie podľa geolokácie akéhokoľvek zariadenia pripojeného na internet.

http://visualping.io/ – služba na monitorovanie stránok a predovšetkým fotografií a obrázkov na nich dostupných. Aj keby sa fotografia na sekundu objavila, bude e-mail predplatiteľ Má doplnok pre Google Chrome.

http://spyonweb.com/ je výskumný nástroj, ktorý umožňuje hĺbkovú analýzu akéhokoľvek internetového zdroja.

http://bigvisor.ru/ – služba vám umožňuje sledovať reklamné kampane pre určité segmenty tovarov a služieb alebo konkrétne organizácie.

http://www.itsec.pro/2013/09/microsoft-word.html – návod na použitie od Artema Ageeva programy Windows pre potreby konkurenčného spravodajstva.

http://granoproject.org/ je nástroj s otvoreným zdrojom pre výskumníkov, ktorí sledujú siete prepojení medzi jednotlivcami a organizáciami v politike, ekonomike, kriminalite atď. Umožňuje vám prepojiť, analyzovať a vizualizovať informácie získané z rôznych zdrojov, ako aj ukázať významné súvislosti.

http://imgops.com/ – služba na extrakciu metadát z grafické súbory a prácu s nimi.

http://sergeybelove.ru/tools/one-button-scan/ – malý online skener na kontrolu bezpečnostných dier na webových stránkach a iných zdrojoch.

http://isce-library.net/epi.aspx – služba na vyhľadávanie primárnych zdrojov pomocou fragmentu textu v angličtine

https://www.rivaliq.com/ je efektívnym nástrojom na vykonávanie konkurenčného spravodajstva na západných, predovšetkým európskych a amerických trhoch tovarov a služieb.

http://watchthatpage.com/ je služba, ktorá vám umožňuje automaticky zbierať nové informácie z monitorovaných internetových zdrojov. Služba je bezplatná.

http://falcon.io/ je druh programu Rapportive for the Web. Nie je náhradou za Rapportive, ale poskytuje ďalšie nástroje. Oproti tomu Rapportive poskytuje všeobecný profil človeka, akoby zlepený z údajov zo sociálnych sietí a zmienok na webe.http://watchthatpage.com/ - služba, ktorá umožňuje automaticky zbierať nové informácie zo sledovaných zdrojov na internetu. Služba je bezplatná.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – doplnok pre Firefox. Monitoruje aktualizácie webových stránok. Užitočné pre webové stránky, ktoré nemajú spravodajské kanály (Atom alebo RSS).

http://agregator.pro/ – agregátor spravodajských a mediálnych portálov. Používajú ho marketéri, analytici atď. analyzovať toky správ o určitých témach.

http://price.apisshops.com/ – automatizovaná webová služba na sledovanie cien vybraných skupín produktov, konkrétnych internetových obchodov a ďalších parametrov.

http://www.la0.ru/ je pohodlná a relevantná služba na analýzu odkazov a spätných odkazov na internetový zdroj.

www.recordedfuture.com je výkonný nástroj na analýzu a vizualizáciu údajov implementovaný ako online služba postavená na cloud computingu.

http://advse.ru/ je služba so sloganom „Zistite všetko o svojich konkurentoch“. Umožňuje vám získať webové stránky konkurentov v súlade s vyhľadávacími dopytmi a analyzovať reklamné kampane konkurentov v službách Google a Yandex.

http://spyonweb.com/ – služba vám umožňuje identifikovať stránky s rovnakými charakteristikami, vrátane tých, ktoré používajú rovnaké identifikátory štatistickej služby Google Analytics, IP adresy atď.

http://www.connotate.com/solutions – rad produktov pre konkurenčné spravodajstvo, riadenie informačných tokov a konverziu informácií na informačné aktíva. Zahŕňa komplexné platformy aj jednoduché, lacné služby, ktoré umožňujú efektívne monitorovanie spolu s kompresiou informácií a získavaním len nevyhnutných výsledkov.

http://www.clearci.com/ - platforma konkurenčného spravodajstva pre podniky rôznych veľkostí od start-upov a malých spoločností až po spoločnosti Fortune 500. Riešené ako saas.

http://startingpage.com/ je doplnok Google, ktorý vám umožňuje vyhľadávať na Google bez zaznamenávania vašej IP adresy. Plne podporuje všetky možnosti vyhľadávania Google vrátane ruštiny.

http://newspapermap.com/ je jedinečná služba, ktorá je veľmi užitočná pre dôstojníka konkurenčného spravodajstva. Spája geolokáciu s online vyhľadávačom médií. Tie. vyberiete si región, ktorý vás zaujíma, prípadne aj mesto, či jazyk, zobrazíte si miesto na mape a zoznam online verzií novín a časopisov, kliknete na príslušné tlačidlo a čítate. Podporuje ruský jazyk, veľmi užívateľsky prívetivé rozhranie.

http://infostream.com.ua/ je veľmi pohodlný systém na monitorovanie správ „Infostream“, ktorý sa vyznačuje prvotriednym výberom a je celkom dostupný pre každú peňaženku, od jednej z klasikov internetového vyhľadávania, D.V. Lande.

http://www.instapaper.com/ je veľmi jednoduchý a efektívny nástroj na ukladanie potrebných webových stránok. Dá sa použiť na počítačoch, iPhonoch, iPadoch atď.

http://screen-scraper.com/ – umožňuje automaticky extrahovať všetky informácie z webových stránok, sťahovať veľkú väčšinu formátov súborov a automaticky zadávať údaje do rôznych formulárov. Ukladá stiahnuté súbory a stránky do databáz, vykonáva mnoho ďalších extrémne užitočné funkcie. Funguje na všetkých hlavných platformách, má plne funkčné bezplatné a veľmi výkonné profesionálne verzie.

http://www.mozenda.com/ - má niekoľko tarifné plány a webová služba multifunkčného sledovania webu a doručovania informácií potrebných pre používateľa z vybraných stránok, dostupná aj malým podnikom.

http://www.recipdonor.com/ - služba vám umožňuje automaticky sledovať všetko, čo sa deje na webových stránkach konkurentov.

http://www.spyfu.com/ – a to v prípade, že vaši konkurenti sú zahraniční.

www.webground.su je služba na monitorovanie Runet vytvorená profesionálmi na vyhľadávanie na internete, ktorá zahŕňa všetkých hlavných poskytovateľov informácií, správ atď., a je schopná individuálneho nastavenia monitorovania podľa potrieb používateľa.

VYHĽADÁVAČE

https://www.idmarch.org/ je z hľadiska kvality najlepší vyhľadávač svetového archívu pdf dokumentov. V súčasnosti bolo indexovaných viac ako 18 miliónov pdf dokumentov, od kníh až po tajné správy.

http://www.marketvisual.com/ je jedinečný vyhľadávací nástroj, ktorý vám umožňuje vyhľadávať vlastníkov a vrcholový manažment podľa celého mena, názvu spoločnosti, pozície alebo ich kombinácie. Výsledky vyhľadávania obsahujú nielen objekty, ktoré hľadáte, ale aj ich súvislosti. Určené predovšetkým pre anglicky hovoriace krajiny.

http://worldc.am/ je vyhľadávač voľne prístupných fotografií spojených s geolokáciou.

https://app.echosec.net/ je verejný vyhľadávač, ktorý sa označuje ako najpokročilejší analytický nástroj pre odborníkov v oblasti presadzovania práva a bezpečnosti a spravodajstva. Umožňuje vyhľadávať fotografie zverejnené na rôznych stránkach, sociálnych platformách a sociálnych sieťach vo vzťahu ku konkrétnym súradniciam geolokácie. V súčasnosti je pripojených sedem zdrojov údajov. Do konca roka ich počet presiahne 450. Dementy ďakujeme za tip.

http://www.quandl.com/ je vyhľadávač siedmich miliónov finančných, ekonomických a sociálnych databáz.

http://bitzakaz.ru/ – vyhľadávač tendrov a vládnych zákaziek s ďalšími platenými funkciami

Website-Finder – umožňuje nájsť stránky, ktoré Google neindexuje dobre. Jediným obmedzením je, že pre každého kľúčové slovo prehľadáva iba 30 webových stránok. Program sa ľahko používa.

http://www.dtsearch.com/ je výkonný vyhľadávací nástroj, ktorý vám umožňuje spracovávať terabajty textu. Funguje na desktope, webe a intranete. Podporuje statické aj dynamické údaje. Umožňuje vyhľadávanie vo všetkých programoch balíka MS Office. Vyhľadávanie sa vykonáva pomocou fráz, slov, značiek, indexov a oveľa viac. Jediný dostupný federatívny vyhľadávač. Má platené aj bezplatné verzie.

http://www.strategator.com/ – vyhľadáva, filtruje a zhromažďuje informácie o spoločnosti z desiatok tisíc webových zdrojov. Vyhľadáva v USA, Veľkej Británii, hlavných krajinách EHS. Je vysoko relevantný, užívateľsky prívetivý a má bezplatné a platené možnosti (14 USD mesačne).

http://www.shodanhq.com/ je nezvyčajný vyhľadávací nástroj. Hneď po svojom vystúpení dostal prezývku „Google pre hackerov“. Nehľadá stránky, ale zisťuje IP adresy, typy smerovačov, počítačov, serverov a pracovných staníc umiestnených na konkrétnej adrese, sleduje reťazce DNS serverov a umožňuje implementovať mnoho ďalších zaujímavých funkcií pre konkurenčné spravodajstvo.

http://search.usa.gov/ je vyhľadávací nástroj pre webové stránky a otvorené databázy všetkých vládnych agentúr USA. Databázy obsahujú veľa praktických informácií užitočná informácia, vrátane použitia v našej krajine.

http://visual.ly/ – dnes sa na prezentáciu dát čoraz viac využíva vizualizácia. Toto je prvý vyhľadávač infografiky na webe. Spolu s vyhľadávačom má portál výkonné nástroje na vizualizáciu dát, ktoré nevyžadujú programátorské znalosti.

http://go.mail.ru/realtime – vyhľadávanie diskusií o témach, udalostiach, objektoch, predmetoch v reálnom alebo prispôsobiteľnom čase. Predtým veľmi kritizované vyhľadávanie na Mail.ru funguje veľmi efektívne a poskytuje zaujímavé a relevantné výsledky.

Zanran je práve spustený, ale už funguje skvele, prvý a jediný vyhľadávač údajov, z ktorého ich získava PDF súbory, EXCEL tabuľky, dáta na HTML stránkach.

http://www.ciradar.com/Competitive-Analysis.aspx je jedným z najlepších svetových systémov na vyhľadávanie informácií pre konkurenčné spravodajstvo na hlbokom webe. Načítava takmer všetky typy súborov vo všetkých formátoch na tému záujmu. Implementované ako webová služba. Ceny sú viac ako rozumné.

http://public.ru/ – Efektívne vyhľadávanie a profesionálna analýza informácií, archív médií od roku 1990. Online mediálna knižnica ponúka širokú škálu informačných služieb: od prístupu k elektronickým archívom mediálnych publikácií v ruskom jazyku a hotových tematických prehľadov tlače až po individuálne monitorovanie a exkluzívny analytický výskum na základe tlačových materiálov.

Cluuz je mladý vyhľadávač s bohatými príležitosťami pre konkurenčné spravodajstvo, najmä na internete v anglickom jazyku. Umožňuje nielen nájsť, ale aj vizualizovať a nadviazať spojenie medzi ľuďmi, firmami, doménami, e-mailami, adresami atď.

www.wolframalpha.com – vyhľadávač zajtrajška. V reakcii na požiadavku na vyhľadávanie poskytuje štatistické a faktické informácie dostupné o objekte požiadavky vrátane vizualizovaných informácií.

www.ist-budget.ru – univerzálne vyhľadávanie v databázach vládnych zákaziek, tendrov, aukcií atď.


Hovorte o tom, čo v našej dobe informačných technológií a nekonečný rast objemu dát, ktoré má jednotlivec aj spoločnosť k dispozícii, je veľa problémov so spracovaním informácií a ich vyhľadávaním - to už je rúhanie. Kto nenastolí túto tému? A aby som vás nezaťažoval subjektívnymi a čiastočne aj objektívnymi úsudkami vyvodenými z rôznych informačných zdrojov ohľadom problému, prejdem priamo k jeho riešeniu. Dnes si povieme niečo o vyhľadávaní. Teda o programoch a serióznych informačných systémoch, ktoré vyhľadávajú dokumenty a dáta, ktoré potrebujeme.

Inovujte "priame vyhľadávanie"

Nie je to tak dávno, keď boli stromy veľké a ani v lokálnej sieti podniku nebolo veľa informácií, akékoľvek vyhľadávanie sa vykonávalo jednoduchým prehľadávaním niekoľkých dostupné súbory a dôslednú kontrolu ich názvov a obsahu. Takéto vyhľadávanie sa nazýva priame a programy (utility) využívajúce technológiu priameho vyhľadávania sú tradične prítomné vo všetkých operačné systémy a balíky nástrojov. Ale aj moc moderné počítače nestačí na rýchle a primerané vyhľadávanie v gigantických objemoch dát pri priamom vyhľadávaní. Prehľadávať niekoľko stoviek dokumentov na disku a prehľadávať obrovskú knižnicu a niekoľko desiatok poštových schránok sú dve rôzne veci. Preto programy na priame vyhľadávanie dnes jednoznačne ustupujú do úzadia – pokiaľ ide o univerzálne nástroje.

Samozrejme, že tento typ vyhľadávania nie je vo firemnom sektore už dlho žiadaný. Objemy nie sú rovnaké. A preto už mnoho rokov a v V poslednej dobe Je zrejmé, že technológie schopné rýchlo a presne vyhľadávať dokumenty rôznych formátov az rôznych zdrojov sú viac ako relevantné. Nie je to tak dávno, čo „otec“ Microsoftu Bill Gates, ktorý zjavne závidel fenomenálny úspech internetového vyhľadávača Google, na jednej z tlačových konferencií oznámil túžbu softvérového priemyslu (nielen) prispieť všetkými možnými spôsobmi, rozvíjať a prehlbovať tvorbu vyhľadávačov a technológií. Je však príliš skoro na vytvorenie akéhokoľvek fenomenálne fungujúceho programu od spoločnosti Microsoft alebo konkurenčného servera na internete (MSN stále nedosahuje Google). Obráťme sa preto na existujúci vývoj. Index, dopyt, relevantnosť

Moderné technológie sú založené na dvoch základných procesoch. V prvom rade ide o indexovanie dostupných informácií a spracovanie požiadavky s následným výstupom výsledkov. Pokiaľ ide o prvý, akýkoľvek program (či už ide o vyhľadávací nástroj na počítači, podnikový Informačný systém alebo internetový vyhľadávač) vytvára vlastnú oblasť vyhľadávania. To znamená, že spracováva dokumenty a generuje index týchto dokumentov (organizovaná štruktúra, ktorá obsahuje informácie o spracovávaných údajoch). V budúcnosti je to vytvorený index, ktorý slúži na prácu - rýchle získanie zoznamu potrebných dokumentov podľa požiadavky. To, čo nasleduje, aj keď z hľadiska technológie nie je vôbec jednoduché, je pre bežného používateľa celkom pochopiteľné. Program spracuje požiadavku (pomocou kľúčového slovného spojenia) a zobrazí zoznam dokumentov, ktoré túto kľúčovú frázu obsahujú. Keďže informácie sú obsiahnuté v štruktúrovanom indexe, spracovanie dopytu je oveľa rýchlejšie (desiatky a stovky!) ako v prípade priameho vyhľadávania (výber dokumentov sa nevykonáva enumeráciou súborov, ale analýzou textových informácií v index).

Nájdené dokumenty program zobrazí vo výslednom zozname podľa relevantnosti - zhody dokumentu s textom dopytu. V rôznych technológiách, samozrejme, existujú rôzne metódy na vyhľadávanie a určenie relevantnosti dokumentu (počet „výskytov“ slova a jeho frekvencia zmien v dokumente, pomer týchto parametrov k celkovému počtu slov v dokumente, vzdialenosť medzi slovami dopytovej frázy vo vyhľadávaných súboroch atď.). Na základe týchto parametrov sa určí „váha“ dokumentu a v závislosti od nej sa konkrétny súbor objaví v zozname výsledkov na určitej pozícii. V prípade internetového vyhľadávania je situácia ešte komplikovanejšia. Veď v v tomto prípade je potrebné vziať do úvahy mnoho ďalších faktorov (príkladom je hodnotenie stránky Google). Ale toto je téma na samostatný článok, takže sa nedotkneme internetu. Recenzia vyhľadávačov

IN tento materiál Zohľadňujú sa možnosti niekoľkých populárnych vyhľadávacích programov, ktoré sa môžu pochváliť slušnou rýchlosťou a dobrou funkčnosťou. Ale predvádzať sa v brožúrach je jedna vec, no stáť pod pohľadom odborníka je vec druhá. A nebolo viac odborníkov, o nič menej kancelária plná ľudí, ktorí sa radi hrali so softvérom pre jeho použiteľnosť. Na experimentálnom počítači (Athlon 2,2 MHz, s 1 GB RAM, 160 GB pevným diskom Seagate IDE pri 7200 ot./min a systém Windows XP) bola nainštalovaná sada programov: dtSearch Desktop, Bloodhound Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Pre testy bola zostavená textová databáza dokumentov vo formátoch doc, txt a html s celkovou veľkosťou ani viac, ani menej, ale 20 gigabajtov. Skupina súdruhov pod vedením vášho skromného sluhu testovala, porovnávala a zdieľala svoje subjektívne dojmy z každého softvéru. Prečítajte si zhrnutie zistení nižšie. dtSearch Desktop

Program, ktorý podľa vývojárov tvrdí, že je najrýchlejší, najpohodlnejší a najlepší vyhľadávač. Ako vo všeobecnosti všetci ostatní z túto recenziu. Rozhranie dtSearch je pomerne jednoduché, ale niektoré okná alebo karty sú trochu preťažené prvkami, čo sťažuje používanie. V skutočnosti však neexistujú žiadne zvláštne ťažkosti. Jediným skutočne nepríjemným bodom je nedostatočná podpora softvéru pre ruský jazyk (napriek tomu, že program dokáže vyhľadávať dokumenty vo viacerých jazykoch, jeho rozhranie je výlučne anglické).

Ale dtSearch je jedným z mála programov, ktoré dokážu indexovať webové stránky do užívateľom zadanej „hĺbky“ (hoci s prihliadnutím na „dokúpenie“ prídavnej súpravy dtSearch Spider). To je okrem podpory súborov na disku rôznych textové formáty A e-maily od poštová schránka Outlook. Program zároveň nevie pracovať s databázami, ktoré sú pre vyhľadávače takým chutným sústom pre veľké objemy informácií v nich obsiahnutých a ich široké rozšírenie vo firmách, a teda v podnikových sieťach. Rýchlosť indexovania dokumentov dtSearch sa ukázala byť na správnej úrovni. Pri pohľade do budúcnosti poviem, že tento program si s indexovaním daného množstva informácií poradil na úrovni s iným konkurentom – iSYS – a delil sa s ním o druhé miesto v rebríčku najrýchlejších systémov. dtSearch indexovalo testovacích 20 gigabajtov informácií za 6 hodín a 13 minút, čím vytvorilo index 7,9 GB pre potreby následného vyhľadávania.

Pokiaľ ide o možnosti vyhľadávania, tu sú na správnej úrovni. Po prvé, dtSearch má morfologické vyhľadávanie (hľadanie slova vo všetkých jeho morfologických formách). Použitím túto príležitosť, oslobodíte sa, povedzme, od myšlienok ako „v akom prípade bolo v dokumente, ktorý som potreboval, použité určité slovo?“ Použitie morfologického vyhľadávania je takmer vždy opodstatnené, preto by malo byť prítomné v každom profesionálnom vyhľadávači.

Vyhľadávanie podľa zvuku je neštandardná funkcia aj pre profesionálne vyhľadávače. Jeho podstatou je, že program vyhľadá slová, ktoré znejú rovnako ako slovo, ktoré ste zadali. A najlepšie na tom je, že táto funkcia funguje aj pre ruský jazyk! Napríklad, keď do vyhľadávacieho dopytu zadáte slovo „ear“, uvidíte ako výsledok nielen slová „ear“, ale aj „ear“.

Veľmi dôležitou funkciou je vyhľadávanie s opravou chýb. Používa sa na vyhľadávanie slov obsahujúcich syntaktické chyby – môžu to byť buď preklepy alebo chyby v dokumentoch získaných napríklad pomocou systémov rozpoznávania znakov. Jednoduchý príklad – hľadáte slovo klávesnica. Niektorý dokument obsahuje slovo „klávesnica“, je zrejmé, že v skutočnosti ide o slovo „klávesnica“, človek len urobil preklep pri písaní. Takže vyhľadávanie opravy chýb zistí a zahrnie do výsledku dokument so slovom „klávesnica“. V dtSearch je tiež nastavenie, ktoré umožňuje určiť mieru možných chybných znakov.

Hľadajte pomocou synoným. Táto funkcia používa zoznam synoným pre rôzne slová. Napríklad zadaním slova „rýchlo“ program nájde aj slová „vysokorýchlostný“ a ďalšie, ktoré sú synonymami slova „rýchly“, ak sa samozrejme nachádzajú v zozname synoným. . K programu dtSearch nie je dodávaný hotový zoznam synoným, je však možné použiť zoznamy na internete (podľa toho je potrebné pripojenie, čo nie je vždy vhodné), alebo si môžete vytvoriť vlastný zoznam synoným .

Okrem uvedených možností môže dtSearch vyhľadávať pomocou fráz pozostávajúcich zo slov spojených logickými operáciami. Každému slovu v dotaze možno priradiť vlastnú „váhu“, teda význam. Užitočnou možnosťou je použiť slovník pozostávajúci z zmysluplné slová aby ste ich nebrali do úvahy pri vyhľadávaní, aj tento slovník je však prázdny a budete si ho musieť vyplniť sami.

Ďalej sa pozrime na možnosti programu pri práci v sieti. V skutočnosti dtSearch neponúka žiadne špecifické možnosti pre prácu so sieťou. Je však celkom možné ho použiť online. Prípadne môžete vytvoriť nejaký druh indexu a vložiť ho do verejného (zdieľaného) priečinka. Samotný program je možné nainštalovať na počítač každého používateľa alebo ho možno umiestniť aj do priečinka, ktorý je otvorený verejný prístup a vytvorte skratky špeciálnym spôsobom pre každého používateľa zvlášť pomocou parametrov príkazového riadku, ktorých účel je popísaný v súbore pomocníka dodanom s programom. Tiež je tu možnosť automatická inštalácia programov do siete pomocou súbor MSI. Toto zohľadní nastavenia pre každého pripojeného používateľa.

Vo všeobecnosti je to dobrý program z kategórie profesionálnych vyhľadávačov. Môže sa kvalifikovať na dobré hodnotenie, ale získanie dôvery a rešpektu od používateľov nemusí byť pre dtSearch ľahké kvôli určitým faktorom (nie všetko je s rozhraním hladké, ruskí používatelia sú zbavení, neexistujú žiadne jasné funkcie pre prácu so sieťou) . Čo sa týka priameho vyhľadávania dokumentov, program nemal problémy s ruským textom. Keďže neboli žiadne s deklarovanou morfológiou, alebo s fuzzy vyhľadávaním. Systém celkom adekvátne nájdený potrebné dokumenty a jednoduchou požiadavkou jedným slovom a použitím niekoľkých odsekov alebo dokumentu ako kľúčovej frázy.

Oficiálna stránka:
Veľkosť distribúcie: 23 Mb Bloodhound Prof Deluxe

Podľa názvu môžete uhádnuť, že v tomto programe je podpora ruského jazyka. Toto je už pekné. Pokiaľ ide o rozhranie, vo všeobecnosti je trochu nezvyčajné, ale vzhľadom je veľmi atraktívne. Ďalšia vec je pohodlie. Veľmi kontroverzné kritérium, ale pravdepodobne riešenie s viacerými oknami nie je najúspešnejšou možnosťou (požiadavka sa zadá v jednom okne, výsledok sa zobrazí v inom a podobne).

Snoop používa rovnaké indexy na rýchle vyhľadávanie, ale indexovanie je oveľa pomalšie ako iné programy. Je to veľmi zvláštne, najmä ak vezmeme do úvahy, že jeho možnosti spracovania vyhľadávacích dopytov sú veľmi slabé, a preto štruktúra indexu nie je zložitá. S najväčšou pravdepodobnosťou je to spôsobené neoptimalizovanými algoritmami. Tento program sa ukázal byť jasným outsiderom v indexovaní a rýchlosti vyhľadávania: čas strávený vytvorením indexu je šesťkrát dlhší ako pri dtSearch a iSYS. Indexovanie 20 gigabajtov textov pre bloodhounda znamenalo 38 hodín a 46 minút práce. A vytvorená „oblasť vyhľadávania“ zabrala na pevnom disku rovnakú veľkosť ako pôvodné údaje s malým mínusom - 19 gigabajtov.

Bloodhound môže byť prezentovaný ako alternatíva k štandardnému vyhľadávaniu v systéme Windows; je nepravdepodobné, že bude schopný viac. O tom, že na prvom mieste je Bloodhound jednoduché vyhľadávanie súborov je indikovaný nielen malým počtom funkcií na analýzu textu vyhľadávacích dopytov a pokročilým vyhľadávaním podľa atribútov súborov, ale dokonca aj oknom s výsledkami, ktoré poskytuje priame odkazy na nájdené súbory, ako aj na priečinky obsahujúce tieto súbory. Okno s výsledkami nie je príliš informatívne v tom zmysle, že celý nájdený súbor si môžete prečítať iba spustením, to znamená, že nemá zabudovaný prehliadač súborov. Ale je zobrazený úryvok zo súboru, kde bolo nájdené hľadané slovo, vo všeobecnosti táto schéma zobrazenia veľmi pripomína internetové vyhľadávače.

Keď už hovoríme o špecifických možnostiach spracovania vyhľadávacích dopytov, stojí za zmienku, že neexistuje nič také ako „hľadaný text“; maximum, ktoré možno vyhľadávať, je fráza, už len preto, že neexistuje viacriadkové pole na zadávanie textu. Môžete však tiež analyzovať zadanú frázu a Snoop nám tu ponúka štandardnú sadu vyhľadávania: logické operácie, vyhľadávanie masky a vyhľadávanie citácií... nie veľa. Program obsahuje niektoré základy morfologického vyhľadávania, ale je pravdepodobne taký hrubý, že s najväčšou pravdepodobnosťou narúša správne fungovanie (počas testov bolo zaznamenaných veľa chýb s nesprávnym použitím morfológie).

Program však umožňuje pri vyhľadávaní špecifikovať atribúty súboru (dátum dokumentu, názov súboru, názov priečinka) a v týchto dotazoch môžete použiť aj rovnakú sadu vyhľadávania. Písmená môžete vyhľadávať aj zadaním parametrov (Od, Predmet... atď.).

Prišli sme teda na samotné hľadanie, čo je ešte zaujímavé na programe, za ktorý dostal podľa informácií z oficiálnej stránky toľko ocenení? Je ťažké povedať, čo je na ňom také zvláštne; s najväčšou pravdepodobnosťou je rozhranie Bloodhound atraktívne (presne vo vzhľade, nehovoriac o použiteľnosti).

Operácie s indexmi sú veľmi štandardné, príjemnou funkciou je možnosť aktualizovať indexy podľa plánu. Okrem toho je možné indexy používať aj online. Odteraz potrebujeme ďalšie podrobnosti.

Napriek primitívnosti vyhľadávacích dopytov je možné program použiť na vyhľadávanie súborov, takže jeho použitie môže byť opodstatnené v sieťach. Aj keď je to zdĺhavé, pretože vo veľkej sieti je prioritou rýchle vyhľadávanie údajov pomocou zložitých vyhľadávacích dopytov kvôli veľkému množstvu informácií - a sú tu jednoznačne problémy s rýchlosťou vyhľadávania a programu. Musím povedať, že práca so sieťou v Izhishika je premyslená tak, ako má. Špeciálne na to je navrhnutá samostatná aplikácia - Bloodhound Server. Funguje to rovnako ako jednoducho Snooper (majú rovnaký vyhľadávací nástroj), len pre dokumenty hosťované na centrálnom serveri alebo na zdieľaných zdrojoch v firemná sieť. Snooper Server vytvára nové indexy na zdieľaných zdrojoch alebo používa predtým vytvorené indexy. Každý používateľ podnikovej siete sa môže pripojiť k vyhľadávaciemu serveru a použiť ho na prístup k akémukoľvek dokumentu (umiestnenému v aktuálnom indexe) pomocou internetového prehliadača. Súhlasíte, táto schéma je mimoriadne pohodlná: ukazuje sa, že súbory vo vašej vlastnej sieti je možné vyhľadávať rovnakým spôsobom ako informácie na internete, napríklad cez Google.

Po zhodnotení všetkých výhod a nevýhod tohto programu záver naznačuje, že jeho schopnosti s najväčšou pravdepodobnosťou nestačia pre podnikové siete (napriek dobrej organizácii práce so sieťou), ale pre domáci počítač alebo dokonca pre domácu sieť áno. , v zásade môže prísť. Hoci ani rýchlosť práce, ani možnosti vyhľadávania nevzbudzujú optimizmus...

Oficiálna webová stránka v ruštine:
Veľkosť distribúcie: 6 MbGoogle Desktop Search + GDS Enterprise

Samozrejme, nemohli sme ignorovať takého slávneho vývojára. Už názov Google hovorí veľa. Ľudia, ktorí už roky používajú najvýkonnejší internetový vyhľadávač, sa určite bez jedinej pochybnosti rozhodnú nainštalovať si tento konkrétny vyhľadávač do svojho počítača. Len si pomyslite: Google na vašom domácom počítači! Bez toho, aby sme sa však vzdali provokácií so široko propagovanou značkou, skúsme triezvo, a čo je najdôležitejšie, objektívne zvážiť možnosti „desktopového“ vyhľadávača od Google.

Prvá vec, ktorá vás upúta, je nedostatok vlastného shellu pre program. Google Desktop Search sa stále nachádza v okne prehliadača, respektíve celé rozhranie desktopovej verzie bolo zdedené zo softvéru od staršieho internetového brata. Či je to dobré alebo zlé, je sporný bod: niekomu sa páči minimalizmus v dizajne tohto vyhľadávača, zatiaľ čo iní chcú vidieť plnohodnotnú aplikáciu naplnenú všetkými druhmi tlačidiel atď.

Čo vám padne do oka hneď po dizajne? A skutočnosť, že to isté vyhľadávanie Google Desktop začne indexovať všetko v počítači bez akéhokoľvek dopytu! A čo je najzaujímavejšie, keď si vyberiete cesty indexovania Pomocník Google Vyhľadávanie na pracovnej ploche nie je možné. Budete si musieť stiahnuť samostatný program (TweakGDS), ktorý vám umožní mierne rozšírenie Nastavenia Google Pracovná plocha vrátane určenia miest potrebných na indexovanie. Hoci v čase, keď toto všetko zistíte, bude už indexovať štandardný pevný disk, takže toto nastavenie bude pravdepodobnejšie potrebné pri práci s veľkým množstvom údajov, čo je veľmi dôležité pri použití v podnikových sieťach (verzie Enterprise). . Nie je však pravdou, že po stiahnutí TweakGDS budú vaše problémy vyriešené. Koniec koncov, potrebuje Microsoft, aby fungovala. Internetová sieť a Microsoft Scripting Runtime. Áno... inštalácia, ako aj prístup k nastaveniam mohli byť jednoduchšie, aj keď vývojári asi chápu: načo písať niečo nové, keď existuje hotový vyhľadávač, portovaný na lokálny počítač a nech si používateľ „užije“ a nech slávne meno z „tohoto“ urobí ďalšie majstrovské dielo. Poďme, ukončíme túto lyrickú odbočku a prejdeme k hľadaniu.

Čo sa týka analýzy vyhľadávacích dopytov a poskytovania výsledkov, všetko je tu úplne identické s Google na internete: rovnaký systém zobrazovania výsledkov, rovnaký štandardný súbor logických operácií pre vyhľadávacie dopyty. Vo všeobecnosti je Google Desktop Search, podobne ako predchádzajúci program, určený výhradne na vyhľadávanie súborov – samozrejme nemá interný prehliadač týchto súborov. Počet formátov súborov, ktoré Google Desktop Search podporuje, je úplne dostatočný a príjemné je aj to, že prehľadáva navštívené internetové stránky, pričom dáta berie z vyrovnávacej pamäte. Rýchlosti vyhľadávania a indexovania sú celkom prijateľné. Pravda, pre domáce použitie. S pôsobivými 20 gigabajtmi Texty Google Desktop Search dokončil úlohu za 8 hodín a 17 minút. Stráviť niekoľko dní spracovávaním informácií z podnikovej siete veľkého podniku nie je niečo, čo by chcel robiť žiadny správca systému. Pozitívom je, že veľkosť vytvoreného indexu bola na rovnakej úrovni (4,5 GB) ako iný vyhľadávač testovaný v tejto recenzii – SearchInform.

Veľkou výhodou (alebo nevýhodou – posúďte sami) Google Desktop Search je, že podporuje pluginy, ktoré môžu veľa zmeniť k lepšiemu. Ďalšia vec je, že pripojenie pluginov a ich nastavenie komplikuje úlohu inštalácie vyhľadávača natoľko, že sa začnete pýtať, či je to všetko potrebné, keď môžete nainštalovať normálny. plnohodnotný program, v ktorej už bude všetko prítomné. Koniec koncov, na používanie každej funkcie budete musieť nainštalovať nový doplnok. Dokonca aj na to, aby program plne pracoval s archívmi, je potrebný samostatný modul gadget. Je fascinujúce a zvodné, že všetky tieto dodatočné moduly sú zadarmo. Ak však neberiete do úvahy počítačovú verziu vyhľadávacieho nástroja, kompetentná konfigurácia GDS Enterprise nemusí byť vo vašich silách - koniec koncov, nie nadarmo ponúkajú špecialisti zo spoločnosti Google svoje služby na nastavenie vlastného softvér pre vašu sieť len za 10 000 USD.

Ak prejdete procesom nastavenia a inštalácie (alebo zaplatíte 10 000 USD tímu rýchlej reakcie od spoločnosti Google), pochopíte, že zložitosť inštalácie je viac než kompenzovaná veľmi flexibilnými nastaveniami pri použití v podnikových sieťach. Dôležitý bod Google funguje Používa sa desktop v podnikovej sieti skupinové politiky, ktorý umožňuje nastaviť nastavenia pre každého používateľa.

Aby som to zhrnul, najrozumnejšie využitie tohto programu je domáci alebo pracovný počítač. Predsa pre bežný počítač Stačí si nainštalovať program - zvyšok urobí sám (ani sa vás nebude nič pýtať).

Služba Google Desktop Search Enterprise však bude prijateľná v prípadoch, keď je naliehavá potreba flexibilnej konfigurácie sieťovej politiky na používanie vyhľadávacieho nástroja, pričom schopnosť spracovávať vyhľadávacie dopyty bude na druhom mieste dôležitosti a čas (alebo peniaze) ) vynaložené na nastavenie programu budú na prvom mieste.

Oficiálna stránka:
Veľkosť distribúcie vrátane TweakGDS: 1,2 MbCopernic Desktop Search

Pre zväčšenie kliknite na obrázok

Rozhranie programu vyvoláva mimoriadne pozitívne emócie - všetko sa robí v súlade so všeobecne uznávanými normami, nič zbytočné, jedným slovom príjemný dizajn. Pre začiatočníkov bude pochopenie rozhrania Copernic Desktop Search veľmi jednoduché. Aj keď je trochu mätúce, že dizajnéri jasne vytvorili rozhranie programu s ohľadom na skutočnosť, že program bude fungovať v štandardnej téme Windows XP. Pri použití klasickej témy program nevyzerá tak pekne. Ale to je skôr vec vkusu.

Pri prvom spustení vás program vyzve na vytvorenie indexov na vyhľadávanie. Zdalo sa trochu nezvyčajné, že po výbere priečinkov na indexovanie program neponúkol stlačiť žiadne tlačidlo, ako napríklad „Spustiť indexovanie“, a indexovanie sa nespustilo automaticky, až potom sa zistilo, že Copernic sa pokúšal spustiť indexovanie, zatiaľ čo počítač bol nečinný. Ak chcete všetko správne nakonfigurovať, budete musieť trochu hlbšie preskúmať možnosti programu. Treba poznamenať, že existujú pomerne široké možnosti nastavenia automatického vytvárania indexov: vstavaný plánovač, možnosť indexovania, keď je počítač nečinný, na pozadí, s nízkou prioritou. Indexovanie nebolo príliš rýchle – 10 hodín 51 minút – to je pomalšie ako v iných vyhľadávačoch (okrem Isle of Bloodhound, ale Copernic je stále rádovo rýchlejší ako vývoj iSleuthHound Technologies.

Teraz o štruktúre indexu. Vo všeobecnosti na tom nie je nič zvláštne. Je možné vybrať typy súborov vo všeobecnej aj podrobnej forme. To znamená, že na začiatku si môžete vybrať, čo chcete indexovať – Dokumenty, Obrázky, Videá, Hudba. Na druhej karte okna možností budete môcť vybrať konkrétne typy súborov podľa prípony. Okrem toho môžete index nakonfigurovať tak, aby sa napríklad neindexovali obrázky menšie ako 16 x 16 alebo sa neindexovali zvukové súbory kratšie ako 10 sekúnd. Okrem indexovania súborov z priečinkov dokáže Copernic pracovať s e-mailami a kontaktmi z adresára Microsoft Outlook a Microsoft Outlook Express, je možné indexovanie obľúbených položiek a histórie z programu Internet Explorer.

Pokiaľ ide o možnosti vyhľadávania, sú tu veľmi slabé. Počas testov sa dokonca ukázalo, že program nevyhľadáva dokumenty vo formátoch txt a html v ruštine, čo vám umožňuje nájsť ich iba podľa názvov a nie podľa obsahu. Jediná vec, ktorú program poskytuje na zlepšenie efektívnosti vyhľadávania, je použitie štandardnej sady logických operácií, a dokonca aj vtedy bola táto funkcia objavená experimentálne, pretože nebola zdokumentovaná. Mimochodom, ani s pomocou programu nie je všetko v poriadku - je k dispozícii iba cez internet, čo je, ako vidíte, veľmi nepohodlné a dokonca aj na internete referenčné informácie nie príliš veľa. Vývojári sa zjavne rozhodli, že jednoduché rozhranie programu neznamená prítomnosť bežnej pomoci. V konverzácii o možnostiach vyhľadávania je potrebné poznamenať, že napriek slabej analýze dopytov poskytuje program zaujímavý vyhľadávací systém - používateľ si môže vybrať typ súborov (obrázky, videá, hudba atď.), zadať vyhľadávanie dotaz a vyberte atribúty špecifické pre vybraný typ súboru. Napríklad pri zvukových súboroch to môžu byť hodnoty zo značiek mp3 (interpret, album, dátum atď.), pri obrázkoch si napríklad môžete vybrať ich veľkosť (podľa rozlíšenia), vo všeobecnosti má každý typ svoju vlastné nastavenia. Po vyhľadaní konkrétneho typu súboru program zobrazí v okne výsledkov veľmi informatívny zoznam a ak vaša požiadavka obsahuje súbory iného typu, môžete ich otvoriť kliknutím na konkrétny odkaz.

Samostatne stojí za zmienku okno na zobrazenie výsledkov. Pod zoznamom nájdených súborov sa zobrazuje obsah týchto súborov (podobná schéma sa často používa v poštových klientov). Je pravda, že prezeranie textu je možné iba v natívnom formáte a neexistuje režim zobrazenia obyčajného textu, čo nie je vždy vhodné, pretože otvorenie dokumentu v tomto prípade trvá dlhšie. Ale vzhľadom na to, že Copernic dokáže vyhľadávať obrázky a hudbu, je možné si tieto multimediálne súbory prezerať.

Základné princípy fungovania tohto programu sú popísané, teraz sa pozrime, čo nám Copernic Desktop Search môže ponúknuť za prácu so sieťou... V princípe sa dá pozerať veľmi dlho, ale sotva niečo uvidíte . Inými slovami, tento program nebol zamýšľaný ako sieťový. Copernic Desktop Search je výlučne domáci vyhľadávací nástroj.

Je zrejmé, že jedinou (najlogickejšou) aplikáciou tohto programu je domáci počítač. Tu si plne poradí so všetkými jednoduchými používateľskými vyhľadávacími dopytmi zloženými z jedného alebo dvoch slov, nájde potrebné informácie a rozdelenie vyhľadávania podľa typu súboru a podpora multimediálnych súborov spolu s indexovaním na pozadí v režime nízkej priority, spojené s príjemným rozhranie, len dať programu silu získať dôveru medzi neskúsenými používateľmi.

Oficiálna stránka
Veľkosť distribúcie: 2,6 MbISYS Desktop

Pre zväčšenie kliknite na obrázok

Veľmi výkonný program. Svojou úrovňou vybavenia všemožnými funkciami je niekde blízko ďalšiemu vyhľadávaciemu systému SearchInform v zozname. Zároveň veľkosť inštalačný súbor viac ako 40 Mb! Ťažko povedať, čo by sa dalo vtesnať do takýchto rozmerov, pretože rovnaký SearchInform s podobnou funkcionalitou zaberá 15 Mb.

Inštalačný proces tu tiež nie je veľmi príjemný, alebo skôr ani proces inštalácie. Ešte pred stiahnutím programu budete vyzvaní na registráciu, inak sa nedá. Ďalej rozhranie. Je spracovaný veľmi pekne, nič zbytočné nebije do očí, ale to sú dojmy človeka, ktorý je už tak trochu zvyknutý. Pre začiatočníka nebude ľahké zistiť, kde a čo sa nachádza, kam kliknúť a kde nakoniec hľadať. Pred začatím práce sa odporúča prečítať si nápovedu - ušetríte si veľa nervov a času. Ku všetkému ostatnému sa pridáva úplná absencia podpory ruského jazyka v programe. Nie dobré. Okná tu navyše nie sú preťažené ovládacími prvkami, ale za to sme museli zaplatiť multimodulmi a použitím prídavných okien. Napríklad vyhľadávacie dotazy sa zadávajú spustením jedného programu a správa indexov sa vykonáva pomocou iného programu. Vyhľadávacie dopyty sa tu zadávajú aj v samostatných kontextových oknách. Ťažko povedať, čo je lepšie – preťažené rozhranie alebo všadeprítomné viaceré okná; skôr je to vec vkusu.

Pokiaľ ide o vytváranie indexov, program poskytuje funkcie na zjednodušenie procesu nastavenia možností pre nový index. Tieto funkcie zahŕňajú niekoľko hotové šablóny vytvoriť indexy pre priečinok „Moje dokumenty“, „Pošta“, „Pošta a dokumenty“, „Špecifický priečinok“, „Priečinok s výberom typov súborov“ atď. Takéto šablóny zjednodušujú vytváranie indexov v prvej fáze. Pomôcka na prácu s indexmi nemá veľmi dobré rozhranie, čo je zastrašujúce s určitou zložitosťou (toto je veľmi subjektívne hodnotenie, aby som bol úprimný), ale ak sa na to pozriete, poskytuje veľa užitočných možností a vo všeobecnosti , jeho použitie nespôsobuje veľké ťažkosti. ISYS Desktop dokáže indexovať údaje z rôznych zdrojov údajov a tiež poskytuje mnoho flexibilných nastavení pre takéto indexovanie. Medzi pridané vlastnosti pre indexovanie: podpora pre SQL, FTP, TRIM Context, WORLDOX 2002, skripty. Ak ste pri vytváraní indexu vybrali položku „Priečinok s výberom typov súborov“, máte možnosť vybrať typy súborov na indexovanie manuálne (podľa prípony). Treba povedať, že jednoducho existuje obrovské množstvo podporovaných typov súborov, ale pridajte si svoj vlastný typ (príponu). existujúci zoznam nebude to fungovať. Môžete si tiež všimnúť prítomnosť plánovača indexovania. Vytvorenie indexu a spracovanie 20 gigabajtov informácií trvalo ISYS Desktopu 6 hodín a 13 minút, v konečnom dôsledku ukázalo dobrý čas a veľkosť vytvoreného súboru – 7,9 GB.

Možnosti vyhľadávania tohto programu sú celkom dobré. To, čo sa používa v ISYS, je oveľa výkonnejšie ako konvenčná podpora logických operácií. Spomedzi pokročilých možností vyhľadávania program ponúka použitie synoným a triediaci filter (podľa cesty, názvu a dátumu vytvorenia súboru). Súprava logické operátory o niečo širší ako štandardná sada. Okrem logických operácií vám program umožňuje pracovať s mnohými ďalšími operátormi, ktoré v princípe môžu nahradiť niektoré typy vyhľadávania, napríklad vyhľadávanie s parsovaním je možné úplne nahradiť použitím špeciálnych operátorov. Veľmi ma prekvapilo, že program nemá vyhľadávanie pomocou morfológie. Toto je vážne opomenutie, pretože pri použití morfologickej analýzy sa výrazne zlepší efektivita vyhľadávania. Okrem toho neexistuje zoznam významných slov, ale existuje rozsiahly zoznam nepodstatných slov. Oznámené sú aj vyhľadávacie funkcie ako „približné vyhľadávanie“ a „heuristická analýza“.

ISYS poskytuje na výber niekoľko typov vyhľadávacích dopytov, a to vizuálnych. Robí sa to pomocou rôznych typov okien na zadávanie vyhľadávacích dopytov, v skutočnosti však ani jedno okno neumožňuje použitie iných technológií ako tých, ktoré sú uvedené vyššie.

Výsledky vyhľadávania sú veľmi informatívne a zobrazujú sa ako zoznam dokumentov zoradených podľa relevantnosti. Ukážka vybraného dokumentu sa zobrazí nižšie. Na rozdiel od Copernic Desktop Search je tu náhľad k dispozícii iba vo forme obyčajného textu, nebolo možné zobraziť dokumenty v ich pôvodnom formáte, či už je to Word, Html alebo PDF, aj keď to v zásade nie je príliš kritické. Program umožňuje rozdeliť nájdené dokumenty do skupín podľa určitých kritérií (štandardne sú rozdelené podľa relevantnosti). Už nájdené dokumenty si môžete prezerať aj výberom jednotlivých priečinkov (toto je výhodné, keď výsledkom je veľké množstvo dokumentov).

Používanie programu v podnikovej sieti je tiež veľmi opodstatnené, pretože poskytuje dobré príležitosti na organizáciu vyhľadávania v sieti. Vyhľadávací systém je založený na vytvorení verejného indexu, ktorý obsahuje indexované údaje z verejne dostupných online zdrojov.

V skutočnosti je program od ISYS hodný pozornosti, aspoň sa s ním zoznámiť. Tento program je vyspelý projekt s obrovským množstvom funkcií (nie vždy a nie každý ich samozrejme potrebuje, ale predsa). Šanca, že sa program dočká nejakých vylepšení v oblasti spracovania vyhľadávacích dopytov, nie je známa, no momentálne ho možno odporučiť na takmer univerzálne použitie. A vzhľadom na to, že pre domáce systémy je stále príliš ťažký, hlavnými miestami jeho inštalácie sú podnikové siete.

Oficiálna stránka:
Veľkosť distribúcie: 40 MbSearchInform

Pre zväčšenie kliknite na obrázok

Pravdepodobne sa neoplatí začať hneď s popisom rozhrania SearchInform. Najprv by sme mali opísať proces inštalácie, alebo skôr jeden z jeho detailov: program nemôžete nainštalovať bez internetového pripojenia. Faktom je, že pred prvým spustením program vyžaduje registráciu používateľa (zadarmo) a odosiela všetky zadané údaje na server. Očividne museli vývojári prijať takéto opatrenia v boji proti pirátstvu, čo však nemalo pozitívny vplyv na jednoduchosť inštalácie.

Rozhranie programu je navrhnuté v súlade so všetkými všeobecne uznávanými pravidlami, ale na prvý pohľad je trochu ťažkopádne. Pri prvom použití programu sa zdá, že je príliš komplikovaný, niekedy nie je ľahké zapamätať si, v ktorej ponuke alebo na ktorej karte sa nachádza požadovaná možnosť, avšak pri dlhšom používaní sa rozhranie už nezdá tak strašne zložité . Hlavná vec je najprv si prečítať certifikát.

Keď trochu porozumiete rozhraniu, môžete začať vytvárať index. Samotný proces je veľmi jednoduchý a rýchlosť indexovania, aj na pohľad, je výrazne vyššia ako u všetkých ostatných vyhľadávačov v recenzii. Jasné čísla testov ukazujú, že SearchInform je dvakrát rýchlejší ako dtSearch a iSYS, pokiaľ ide o rýchlosť indexovania! Poskytnuté dáta v objeme 20 gigabajtov program indexoval v rekordnom čase 3 hodiny 17 minút. A veľkosť vytvoreného indexu sa ukázala ako najmenšia 4,4 GB - o 100 megabajtov menej ako vyhľadávanie Google Desktop.

Program podporuje okrem bežných súborov a priečinkov aj indexovanie emailov, pripájanie a indexovanie databáz (!) a iné externých zdrojov(DMS, CRM), ihneď počas indexovania môžete zadať slovník na vykonávanie morfologického vyhľadávania a indexovať všetky atribúty súborov. Po vytvorení indexu, keď sa pokúšate vykonať prvé testovacie vyhľadávanie dokumentov, môžete byť trochu zmätení: „Sú tu dva typy vyhľadávania, ale ktorý z nich potrebujem?“ Ako už bolo spomenuté, hlavnou vecou je prečítať si pomoc, potom bude všetko jasné. Program môže v skutočnosti vykonávať dva typy vyhľadávania - vyhľadávanie fráz a vyhľadávanie dokumentov podobných obsahu ako text dopytu.

Popis všetkých hlavných funkcií na analýzu vyhľadávacieho dopytu bol uvedený vyššie, takže teraz uvedieme iba možnosti vyhľadávania, ktoré tento program poskytuje. Začnime s vyhľadávaním fráz: samozrejme, morfologické vyhľadávanie, vyhľadávanie citácií, logické operácie, vyhľadávanie s parsovaním slov (hľadanie na začiatku slova, na konci, v strednej časti alebo úplná zhoda), zmiešané vyhľadávanie citácií ( keď sa v dokumente musia nachádzať všetky slová z dopytu, ale nie nevyhnutne v zadanom poradí), vyhľadávanie s opravou chýb, používanie synoným, „takmer vyhľadávanie citácií“ (hľadanie zadanej frázy ako citácie, ale môžu byť aj iné slová byť prítomný medzi zadanými slovami) atď. Niektoré z uvedených možností majú svoje vlastné špecifické nastavenia. Okrem toho je možné použiť slovník nedôležitých slov, pričom program má už pripravený zoznam týchto slov, na vyhľadávanie môžete použiť aj slovník prioritných slov (samozrejme ho budete musieť vyplniť seba).

Tu sme v zásade stručne zhodnotili všetky hlavné funkcie vyhľadávania fráz.

Prejdime k zváženiu funkcií tohto programu - vyhľadávanie podobných dokumentov. Vývojári tvrdia, že to v žiadnom prípade nie je jednoduché textové vyhľadávanie, je to presne „hľadanie podobných“ - presne tak je to všade opísané, ale dobre, môžete to nazvať ako chcete - hlavným bodom je . Rýchle vyhľadávanie na internete môže rýchlo odhaliť, že takzvané „podobné vyhľadávanie“ je novinkou v oblasti analýzy textu. Tento systém vám umožňuje nájsť texty, ktoré majú podobný sémantický obsah. Najpríjemnejšie bolo, že po vykonaní testovacích vyhľadávacích dopytov sa ukázalo, že teória sa celkom dobre zhoduje s praxou! Program skutočne vyhľadá dokumenty s podobným obsahom a zobrazí ich v zozname, pričom ich zoradí podľa percent podobnosti.

Ďalej sa pozrime na to, čo SearchInform (konkrétne jeho firemná verzia SearchInform Corporate) ponúka pre prácu v podnikovej sieti. Existujú dva typy aplikácií: strana servera a strana používateľa. Serverová časť nezávisle spracováva zadané indexy a používatelia ich môžu použiť na vyhľadávanie v závislosti od priradených prístupových práv. Používatelia môžu byť automaticky nakonfigurovaní pomocou účty Windows (odborne, SearchInform používa NTFS Windows autentifikáciu) a manuálne (používatelia budú musieť byť pridaní samostatne). Každému používateľovi je možné povoliť alebo zakázať prístup k určitým indexom a používateľov možno tiež spájať do skupín. Vo všeobecnosti sú nastavenia SearchInform pre prácu v sieti pred Google z hľadiska flexibility a Ishhound Server z hľadiska pohodlia a jednoduchosti.

Oficiálna stránka:
Veľkosť distribúcie: 14,7 Mb Porovnanie rýchlostí indexovania

Vyhľadávací systémČas indexovaniaVeľkosť indexu
Bloodhound Prof Deluxe 4.538 hodín 46 minút19 GB
Isys Desktop 7.06 hodín 13 minút7,9 GB
DtSearch 7.06 hodín 3 minúty8,6 GB
Google Desktop Search Enterprise8 hodín 17 minút4,5 GB
Copernic Desktop Search *10 hodín 51 minút7 GB
SearchInform 1.5.023 hodiny 17 minút4,4 GB

* Väčšinu dokumentov.html a .txt obsahujúcich ruský text, hoci boli indexované, nebolo možné nájsť okrem ich názvov.

Všetky programy si zaslúžia pozornosť.

Na základe testov a dôkladného preskúmania každého programu prezentovaného v prehľade možno vyvodiť určité závery. Vyhľadávanie pomocou programu Google Desktop Search Copernic Desktop Search je teda celkom vhodné pre neskúsených používateľov ako systém domáceho vyhľadávania informácií. Dobre si poradia s jednoduchými dopytmi, nezaťažujú používateľa nastaveniami a navyše sú úplne zadarmo. Pokus Google vstúpiť na trh firemných vyhľadávačov zatiaľ nie je veľmi opodstatnený: pre plnohodnotnú prácu program je potrebné aktualizovať prídavné moduly a jeho nastavenie nie je ani zďaleka jednoduché. Samovysvetľujúce názvy Desktop Search, Copernic a Google si preto vyhradzujú miesto medzi „desktopovými“ vyhľadávačmi.

Pravda, výkonnejšie riešenia – dtSearch, iSYS a SearchInform tiež nie sú spoľahlivé a ponúkajú používateľom svoje „desktopové“ verzie. Ale za rozumnú cenu, na rozdiel od bezplatného softvéru od Google a Copernic. Za výkon, rýchlosť a funkčnosť si samozrejme musíte zaplatiť. Hlavným zameraním vývojárov dtSearch, iSYS a SearchInform je však samozrejme podnikový sektor. Sieť, funkčnosť, indexovanie a rýchlosť vyhľadávania sú to, čo odlišuje tieto produkty od ich „konkurentov“. Na základe výsledkov testov bol identifikovaný favorit - SearchInform. Program poskytuje možnosť vyhľadávať podobné dokumenty, má najrýchlejšiu rýchlosť indexovania a vyhľadávania a má dobrú sadu funkcií.