Programy pro vyhledávání informací v počítači. Software a služby pro profesionální vyhledávání. Rychle najděte soubory v počítači Všechno

Je to nepříjemný pocit, když můžete najít soubor na internetu rychleji než na svém počítači... Na pozadí rychlého pokroku internetových vyhledávačů vypadá žánr vyhledávání na ploše jako tichá, zarostlá louže okřehku. Dříve existující nabídky od velkých účastníků trhu, a zde najednou byly zaznamenány jak Google, tak Yandex, nebyly roky aktualizovány, korporace považovaly tento směr za neperspektivní a ztratily o něj zájem. Problém ale nezmizel. Nativní vyhledávání ve Windows je dobré, ale k dokonalosti má daleko. Dobrý doplněk přidají se k němu hrdinové naší recenze.

Pro začátek se pojďme rychle podívat na možnosti, které nám nabízí. standardní systém Windows vyhledávání 8. Jak víte, můžete tam vyhledávat přímo z úvodní obrazovky Metro. Stačí začít psát text, automaticky se otevře vyhledávací panel, který zobrazí výsledky vyhledávání pro nainstalované programy, soubory a složky. Méně známý je režim vyhledávání systému Nastavení Windows, ale skutečně to šetří čas, který byste strávili procházením mnoha matoucích nabídek. Mimochodem, pomocí klávesových zkratek můžete rychle vstupovat do různých režimů vyhledávání. Win+F otevře panel v režimu hledání souborů a Win+Q otevře programy. Kombinace Win+W vyhledá systémové parametry.

Při vyhledávání přímo z Průzkumník Windows všechny další parametry jsou umístěny na samostatné nástrojové liště, která se užitečně otevře, když začneme něco zadávat do vyhledávacího pole. V souladu s tím se navrhuje skládat složité dotazy pomocí přepínačů. Na jednu stranu je to přehledné a celkem jednoduché. Na druhou stranu při pokusu o vytvoření složitějších dotazů začínají potíže. Chcete-li například určit přesné časové období pro vytvoření požadovaného souboru, budete muset napoprvé hodně makat. Aby další funkce fungovaly, je nutné, aby byl požadovaný zdroj samostatně předindexován. Odpovídající možnost naleznete ve vlastnostech logické disky systémy. Rychlost práce není příliš vysoká. Částečně je to dáno tím, že při vyhledávání systém produkuje ve výsledcích velký informační šum. Ve výchozím nastavení Windows Search hledá zadané znaky i ve fragmentech názvů souborů, přičemž původní požadavek zpracovává zcela volně. Tento druh nezávislosti má smysl u poměrně vágních dotazů, ale když potřebujete najít něco konkrétního, toto chování je prostě k vzteku, protože se nakonec musíte podívat na dlouhé seznamy všemožných nepotřebných maličkostí, jejichž název obsahuje několik znaků ve stejném pořadí jako v daném požadavku. To vše nechává prostor pro řešení třetích stran. Zaměřme se na bezplatné aplikace.

Aniž bychom zacházeli do technických podrobností, existují dva hlavní způsoby vyhledávání souborů Prostředí Windows. První je sekvenční prohlížení struktura souboru. Pro urychlení vyhledávání mohou programy vytvářet své vlastní pomocné indexové databáze. Nevýhodou této metody je relativní nízká rychlost. Výhody - možnost současného indexování a vyhledávání podle obsahu souborů a dostupnost v souvislosti s tím další možnosti. Druhým způsobem je použití existujících protokolů systému souborů NTFS. Jeho výhodou je velmi vysoká rychlost, ale jeho nevýhodou je možnost vyhledávání pouze podle názvů souborů.

Zdá se, že kombinace těchto přístupů v jednom programu je nejzřetelnějším krokem, který vám umožní získat to nejlepší z obou. Ale i ten nejzajímavější nápad může zhatit nedostatečně kvalitní realizace. Proto zde bohužel zatím neexistuje žádný univerzální šampion, který by vyhovoval našim požadavkům. Zaznamenám pouze jednu vysoce kvalitní komerční aplikaci - Ultra File Search. Proto má smysl poznat nejlepší zástupce specializovaných vyhledávačů z každého tábora.

Začněme Listary (www.listary.com), který se integruje přímo do rozhraní Průzkumníka Windows, takže při jeho spuštění není třeba se šťourat s novými okny. Software vyvoláte dvojklikem v Průzkumníku nebo jedním kliknutím prostředním tlačítkem myši, což se mi osobně líbí víc. Pokud se zaměříte na metodu založenou na klávesnici, je lepší použít k volání kombinaci kláves. Můžete si jej přiřadit sami při prvním spuštění aplikace. Tak či onak se otevře malý vyskakovací panel, ve kterém se při psaní dotazu zobrazují relevantní výsledky. Program používá protokoly NTFS, takže tato aplikace pracuje pouze s názvy souborů. Výhody oproti standardnímu vyhledávání ve Windows – vysoká rychlost a striktní dodržení zadaného požadavku.

Listary má poměrně flexibilní nastavení, ve kterém můžete doladit jak chování programu, tak jeho vzhled. Existuje také doplňkové funkce v duchu vaší vlastní historie vyhledávání, oblíbených položek a příkazů.

Pokud jde o samostatné vyhledávací aplikace, které spoléhají na možnosti NTFS, jednou z nejznámějších je Search Everything (www.voidtools.com). Zpočátku je přenosný a nevyžaduje instalaci. Jedinou výhradou je, že aplikace může vyžadovat další práva ke spuštění, což poněkud omezuje její použití v přenosné podobě. S největší pravděpodobností je to způsobeno přidáním vlastních vestavěných serverů HTTP a FTP/ETP. Při prvním spuštění si program vytvoří vlastní indexovou databázi, kterou následně automaticky aktualizuje. Vyhledávání je rychlé a celkem přesné. Rozhraní softwaru je jednoduché. Podporuje použití plné regulární výrazy. Z užitečných maličkostí bych rád zmínil podporu práce od příkazový řádek– k tomu si budete muset stáhnout příslušný modul.

Vývojář programu má ve zvyku na dlouhou dobu vypadávat z našeho hříšného světa, takže jeho vývoj probíhá nerovnoměrně. Pokud se tedy objeví dotazy nebo problémy, je lepší počítat s podporou ostatních uživatelů softwaru na fóru. Kromě samotného programu nabízí vlastní SDK, takže aplikace má již řadu doplňků a rozšíření.

Dobrou alternativou k tomuto programu je aplikace FileSearchy (www.filesearchy.com). Za prvé, byl přeložen do ruštiny. Za druhé, software se může pochlubit rozhraním postaveným na záložkách, takže můžete provádět několik vyhledávání najednou a přistupovat k nim podle potřeby. Výsledky vyhledávání se načtou okamžitě, vše se děje velmi rychle a pohodlně.

Zajímavostí programu je, že pokud se najdou adresáře a soubory, jejichž názvy jsou téměř stejné (to se může stát např. u adresářů s hudbou nebo obrázky), zobrazí se v seznamu výsledků pouze ikony adresářů. To se mi zdálo výhodné, protože stránka s výsledky není přeplněná zbytečnými prvky a z výsledků pravděpodobně přejdeme do katalogu.

Podporovány jsou všechny klasické možnosti dotazu: vyhledávání podle přesné fráze, fragmentu (substituce) i použití regulárních výrazů. Neexistuje žádná úprava pro správu seznamu nalezených položek, kromě třídění podle různých kritérií. Režim zobrazení: pouze seznam prostého textu. To není příliš výhodné, pokud je cílem vyhledávání obrázek. Většina obrázků ve skutečných archivech na našich počítačích má vygenerovaná jména, která při hledání málo pomáhají, nejedná se o grafickou miniaturu.

Program SearchMyFiles (www.nirsoft.net/utils/search_my_files.html) pracuje v souladu s jiným modelem organizace vyhledávání a dokáže vyhledávat nejen podle názvů, ale také podle obsahu souborů. Zpočátku je přenosný, takže ke spuštění aplikace stačí stažený archiv rozbalit. Chcete-li rozhraní rusifikovat, budete si muset stáhnout a zkopírovat soubor ruského překladu, který je k dispozici na jeho webových stránkách, do adresáře programu. Není třeba měnit žádná nastavení, při příštím spuštění SearchMyFiles vás uvítá ruské rozhraní. Standardní režim vyhledávání je rozšířený. Dost podrobné možnosti shromážděné v jednom dialogovém okně, pomocí kterého můžete vytvářet poměrně sofistikované dotazy. Atributy souboru lze také použít jako funkce vyhledávání. Je podporováno vyhledávání podle masek. Osobně se mi velmi líbí možnost vyhledávat několik rozsahů dat vytvoření souboru najednou - v některých případech to opravdu pomohlo a ušetřilo spoustu času. V souborech můžete vyhledávat nejen text, ale také libovolná data. Je velmi výhodné, že ve fulltextovém režimu můžete používat logické operátory vyloučení. Kromě jednoduchého vyhledávání tato aplikace lze také použít k identifikaci duplicitních souborů.

Program pro rychlé vyhledávání souborů v zadané složky jak podle názvu souboru, tak podle jeho obsahu. Na rozdíl od standardní vyhledávací funkce Windows vysoká rychlost a provozní efektivitu, stejně jako schopnost najít soubory i uvnitř archivů!

Galerie snímků obrazovky

Práce na počítači, tak či onak, zahrnuje práci s různými textovými daty. Ať už hledáme informace na internetu, píšeme výroční zprávu nebo jen čteme knihu, všude, kam jdeme, se setkáváme s textem!

Obvykle víme, kde se nacházejí všechny naše pracovní soubory, protože je otevíráme téměř každý den. Občas ale nastanou situace, kdy si vzpomeneme, že jsme někde měli dokument s potřebnými informacemi, ale zapomněli jsme, kde je a jak se jmenoval.

Máme dvě možnosti: můžeme se buď ručně pokusit najít soubor, který potřebujeme, otevřením a kontrolou všech našich pracovních složek, nebo můžeme použít funkci Windows k vyhledání slova nebo fráze.

Pokud však máme mnoho složek a souborů, pak je ruční hledání čehokoli téměř nemožné a vestavěný vyhledávací nástroj dokáže vyhledávat pouze uvnitř běžných textové soubory(Windows 7 však již umí hledat v DOC).

V tomto případě pouze software třetích stran, který má pokročilé možnosti vyhledávání. Všechny programy tohoto druhu lze rozdělit do dvou kategorií: ty, které využívají mechanismus indexování, a ty, které jej nepoužívají.

Ty aplikace, které při skenování nepoužívají indexování, ve skutečnosti pokaždé kontrolují všechny soubory na přítomnost vyhledávacího řetězce, to znamená, že automaticky implementují mechanismus podobný ručnímu vyhledávání.

Zvýšení rychlosti ve srovnání s standardní prostředky vyhledávání, se získává především díky lepší paralelizaci dotazů na souborový systém, ale přesto to může trvat poměrně dlouho.

Princip indexování souborů na lokálním PC je v podstatě stejný jako na internetu. Program předem naskenuje zadanou jednotku nebo složku a vytvoří databázi souborů se schopností rychle detekovat jejich obsah. Díky tomu probíhá hledání během několika sekund!

Nevýhodou tohoto druhu programů je jejich výhoda - nutnost indexovat soubory, což trvá poměrně dlouho :(. Jinak je podle mého názoru tato třída programů lepší a funkčnější než její protějšky, které pracují bez indexu, takže vám doporučuji seznámit se s jedním z nejlepších bezplatných programů tohoto druhu - DocFetcher.

Dnes existuje poměrně dost programů pro lokální indexování a vyhledávání souborů, ale ne všechny mají stejné možnosti. Z hlediska šíře funkčnosti lze DocFetcher srovnat s populárním placeným indexovacím systémem Archivarius 3000.

Srovnání s placeným analogem

Z porovnání je zřejmé, že se programy od sebe liší jen málo (snad kromě rozhraní). Oba programy pracují téměř se všemi typy souborů a oba umožňují používat složité dotazy obsahující vyhledávací masky.

Jedinou výhodou Archivistu je, že pro indexování používá trvalou databázi, která vám umožňuje prohlížet obsah, který není dostupný v tento moment vzdálené složky a vyměnitelná média.

I když skutečnost, že DocFetcher používá dynamickou databázi, není takové mínus, protože automaticky indexuje přidané a smazané soubory, což umožňuje mít vždy po ruce nejaktuálnější verzi seznamu všech pracovních souborů.

Příprava na práci s programem

Další výhodou DocFetcheru je přítomnost přenosné verze, kterou doporučují používat samotní vývojáři (i když je také dostupná). Vývojáři doporučují používat přenosnou verzi ze dvou důvodů:

  1. Přenosná verze může běžet na každém populární systémy, protože je napsán v jazyce JAVA nezávislém na platformě a obsahuje spustitelné soubory všech aktuálně oblíbených operačních systémů (Windows, UNIX a Mac OS).
  2. Pokud jste zvyklí nosit všechny své pracovní soubory s sebou na flash disku nebo externím pevném disku, pak přenosná verze umí indexovat soubory i na odnímatelné zařízení, který vám umožní najít potřebné soubory stejně rychle jako na PC. Opět platí, že flash disk lze připojit k jakémukoli počítači s jakýmkoli operačním systémem a všude budeme moci rychle vyhledávat!

Dodám, že přenosná verze funguje o něco rychleji (nevím proč) než instalační verze, takže ji také doporučuji používat!

V archivu staženém z našeho webu najdete přesně přenosná verze programy. Aby to fungovalo, stačí rozbalit složku "DocFetcher 1.1.9" do libovolného umístění v počítači (kromě složky Program Files).

Budete také potřebovat sadu knihoven Java Runtime Environment (JRE) nainstalovanou na vašem počítači, verze 1.6.0 nebo vyšší (aktuálně verze 7.40). Obvykle je JAVA již nainstalována na všech moderní systémy, ale pro jistotu to zkontrolujte ;)

Když je vše připraveno, můžete spustit DocFetcher.

Rozhraní programu

Po spuštění spustitelný soubor DocFetcher.exe uvidíme pracovní okno programu:

Pokud je váš systém v ruštině, jazyk rozhraní programu bude automaticky ruština, takže nemusíte nic měnit!

Samotné rozhraní se skládá ze čtyř částí, které lze skrýt/zobrazit pomocí tlačítek s černými šipkami:

  1. V levém horním rohu je sekce možností vyhledávání. Zde můžete nastavit minimální a maximální velikost soubor, který hledáte, a také uveďte jeho příponu (ve výchozím nastavení jsou všechny přípony aktivní);
  2. V pravém horním rohu okna je vyhledávací lišta s výstupním polem výsledků. Zde napravo od vyhledávací lišty vidíte další tlačítka, která vyvolávají nápovědu, nastavení a skrývají okno programu v zásobníku.
  3. Oblast hledání se nachází v levém dolním rohu. V této sekci se zobrazí všechny indexované složky s našimi pracovními soubory.
  4. V pravém dolním rohu je okno náhledu vybraného souboru. Toto okno standardně zobrazuje readme programu, ale jakmile vybereme soubor, okamžitě se zde zobrazí jeho obsah a hledaná fráze nebo slovo se barevně zvýrazní!

Mechanismus indexování složek

Pokud se právě teď pokusíte něco najít pomocí DocFetcher, neuspějete, protože aby mohl program hledat, musí nejprve indexovat složky se soubory, které potřebujeme!

K tomu musíme vyvolat kontextovou nabídku oblasti hledání a najet myší na jedinou aktivní položku „Vytvořit index z“:

Například budu indexovat svou pracovní složku s články výběrem položky „Folder“. Kromě složek však může DocFetcher indexovat archivy, soubory úložiště e-mailů aplikace Outlook a z nějakého důvodu i schránku.

Po výběru režimu indexování budeme požádáni o zadání složky ke kontrole a poté se nám zobrazí následující okno:

Zde můžeme nastavit parametry indexování, jako jsou:

  • speciální pokyny pro zpracování určitých typů souborů;
  • vyloučení určitých souborů z indexu podle přípony nebo typu MIME (jsou podporovány regulární výrazy);
  • další doplňková nastavení.

Pokud jste běžný uživatel, pak zde nemusíte nic měnit. Pokud jste vývojář, doporučuji vám zadat soubory obsahující váš kód jako textové soubory v části „Přípony souborů“.

To je nezbytné, aby DocFetcher hledal potřebné výrazy uvnitř kódu (ve výchozím nastavení se například soubory PHP zpracovávají jako HTML, to znamená, že vyhledávání probíhá pouze podle textu viditelného v prohlížeči!).

Pokud jste se všemi nastaveními spokojeni, klikněte na tlačítko „Spustit“ a počkejte na dokončení indexování:

Programu trvá skenování malých složek s malým počtem souborů pouze několik sekund. Pokud jsou však složky velké a mají složitou strukturu příloh s archivy a obrázky, může indexování chvíli trvat.

Jak můžete vidět ze snímku obrazovky, DocFetcher zpracovával moji pracovní složku o hmotnosti 3,6 gigabajtů, která, jak skener tvrdí, obsahovala téměř 46 tisíc souborů (včetně archivů) téměř půl hodiny! Docela dlouho, ale stojí to za to!

Ano! Nedoporučuji indexovat systémové složky (a obecně jednotku C), protože to za prvé zpomalí program a za druhé může vést k „ modrá obrazovka smrt“ kvůli častým změnám obsahu...

A ještě jedna věc... Čím více souborů v indexované složce, tím více paměť s náhodným přístupem budou spotřebovány programem na podporu činnosti indexu. Mých 46 tisíc souborů například v klidovém režimu „pohltí“ až 200 megabajtů RAM a až 20 % procesoru! A v režimu vyhledávání se stává, že jsou využity všechny zdroje (hledání naštěstí trvá jen pár sekund).

No, teď se zdá, že víte všechno - pojďme k zábavnější části.

Jednoduché vyhledávání souborů v DocFetcher

Po zavření okna skenování se opět vrátíme do hlavního okna, ale nyní budeme mít v oblasti hledání indexovanou složku:

Kliknutím na znaménko plus vlevo od názvu složky rozbalíme její strukturu a budeme moci vidět adresářový strom. Strom navíc kromě běžných složek obsahuje i archivy, jejichž strukturu příloh si také můžeme prohlédnout!

Ve výchozím nastavení jsou všechny složky v indexovaném adresáři označeny pro hledání. Vždy však můžeme zúžit vyhledávací pole tím, že zaškrtneme pouze potřebné adresáře nebo archivy.

Necháme vybranou celou složku a zkusme nastavit první slovo k hledání. Budiž například slovo "instalátor". Zadejte slovo do vyhledávacího pole a klikněte na tlačítko „Hledat“:

Program 3 sekundy přemýšlel a pak vytvořil seznam 180 (viz levý dolní roh pro „Výsledky“) souborů, ve kterých se hledané slovo vyskytuje ve stejném tvaru, jaký jsme zadali.

Všechny soubory jsou standardně seřazeny podle indikátoru „Hit“, který vyjadřuje v procentech míru relevance každého souboru k zadanému dotazu. V našem příkladu bylo maximální procento shody - 22 % - přiřazeno souboru, ve kterém se hledané slovo vyskytuje dvakrát (a ve stejném odstavci).

Pokud vyberete tento soubor v seznamu hledání, jeho obsah se zobrazí v okně náhledu a první nalezená shoda bude zvýrazněna modře (jako běžný výběr). Následující shody budou zvýrazněny žlutě a můžete k nim rychle přejít pomocí tlačítek se šipkami nahoru a dolů na panelu nástrojů výřezu.

Na stejném panelu pro běžné textové soubory jsou další dvě tlačítka, která umožňují vypnout zvýrazňování výsledků vyhledávání a aktivovat/deaktivovat režim zobrazení HTML (pokud je k dispozici pro tohoto typu soubor).

A ještě poslední věc. Libovolný soubor v seznamu nalezených lze otevřít běžným dvojklikem nebo pomocí kontextového menu. Ten také obsahuje položky, které umožňují otevřít nadřazenou složku souboru nebo zkopírovat samotný soubor do schránky.

Použití vyhledávacích masek

Pokročilí (a někdy ne tak pokročilí) uživatelé vědí, že v internetových vyhledávačích můžete vyhledávat nejen pomocí jednoduchých dotazů, ale také pomocí různých speciálních funkcí, které umožňují zahrnout/vyloučit určitá slova do/z výsledků vyhledávání, hledat nepřesné zápalky atd. .P.

DocFetcher, protože je v podstatě stejný vyhledávač, ale místní, to umí taky :). Na rozdíl od konvenčních vyhledávacích robotů však ve výchozím nastavení hledá pouze přesné shody s dotazem. Chcete-li obejít toto omezení, musíte použít speciální znaky «?» A «*» . Dovolte mi to vysvětlit na příkladu s již zmíněným slovem výše "instalátor":

Speciální znak "?" nahrazuje kterékoli písmeno. To znamená, že pokud jej dáme na konec hledaného slova, můžeme najít soubory, ve kterých jsou různé formy tohoto slova, ve kterých se mění pouze poslední písmeno (viz screenshot výše: „installer“, „installer“ , atd.) . Pamatujte však, že při takovém hledání nebudou nalezeny soubory s hlavním tvarem hledaného slova!

Pro flexibilnější vyhledávání použijte speciální znak „*“:

Tento symbol vám umožňuje najít výsledky, které jsou zcela ekvivalentní dotazu nebo které mají různé konce, které se nemusí skládat z jednoho písmene, jako v předchozím případě (například soubory se slovy „installer“, „installers“, „instalátory“ a dokonce „instalátor“).

Vždy používejte hvězdičku, když chcete pro dotaz zadat nepřesnou shodu!

Mimochodem, na výše uvedeném snímku obrazovky můžeme vidět aktivaci funkce zpracování HTML kódu. V tento režim okno náhledu se změní na mini-prohlížeč s navigačními tlačítky, vyhledávací lišta a všechny požadované atributy. Do režimu prohlížení kódu můžete přepnout pomocí krajního tlačítka vpravo.

Kromě použití výše uvedených speciálních znaků podporuje DocFetcher některé další vyhledávací funkce:

  • Booleovské operátory „AND“, „OR“ a „NOT“ (podobně jako „&&“, „||“ a „-“) pro vyhledávání, které obsahuje dvě klíčová slova současně, jedno z klíčových slov nebo vylučuje jedno z slova. Například: „kočka && pes“ – budou nalezeny všechny dokumenty, ve kterých se vyskytují slova „kočka“ a „pes“, „kočka OR pes“ – dokumenty, kde je nalezeno alespoň jedno ze slov, „kočka – pes“ - dokumenty, kde je pouze slovo "kočka", bez uvedení slova "pes". Můžete kombinovat více operátorů, například dotaz „(kočka OR pes) AND myš“ vrátí všechny dokumenty, které obsahují slovo „kočka“ nebo „pes“ a také slovo „myš“.
  • Frázové speciální znaky. To zahrnuje uvozovky a znaménko „+“. Například fráze umístěná v uvozovkách bude prohledávána v nezměněné podobě (v té, ve které jste ji napsali). Tato funkce je podobná funkci přesného vyhledávání v běžných vyhledávačích. Znak „+“ znamená, že jím označené slovo má prioritu, zatímco zbývající slova dotazu nemusí být přítomna. Například požadavek „+kočka pes“ nám nejprve poskytne všechny soubory, které obsahují obě klíčová slova, a poté ty, které obsahují pouze slovo „kočka“. Pokud ke všem dotazovaným slovům přidáte „+“, výsledek bude ekvivalentní použití operátoru „AND“.
  • Hledejte podobná slova. Pomocí DocFetcher můžeme vyhledávat soubory obsahující slova podobná klíčovému slovu. K tomu použijte speciální znak „~“ na konci klíčového slova. Například dotaz „cat~“ může vrátit slova „kód“, „to“, „potit“ atd. Navíc můžeme určit stupeň podobnosti v rozsahu od „0“ do „1“. Ve výchozím nastavení (pokud jsme nezadali hodnotu) je tento stupeň "0,5" (ekvivalent dotazu "cat ~0,5").
  • Vyhledávání podle atributů souboru. V praxi je často nutné hledat soubory nejen (a ne tolik) podle obsahu, ale také podle určitých atributů. Chceme například najít všechny dopisy od Vasyi Pupkina. K tomu můžete použít následující požadavek: „odesílatel:„Vasya Pupkin““. Vyhledávání atributů je bohužel dostupné pouze pro textové soubory (atributy: název, název souboru a autor) a e-mailové soubory (atributy: předmět, odesílatel a příjemci).

Existují také některé další specifické vyhledávací funkce, ale protože nejsou příliš žádané, nebudeme je uvažovat (pokud chcete, můžete si o nich přečíst v anglické příručce k programu v části „Syntaxe dotazu“).

Kontextová nabídka vyhledávací oblasti

Dlouho jsem přemýšlel, zda má cenu zaměřit se na kontextové menu, ale nakonec, abych si obraz takříkajíc dokreslil, jsem se rozhodl přeci jen přestat :). Pokud si pamatujete, na samém začátku zde byla aktivní pouze první položka - „Vytvořit index z“. Nyní, po indexování složky, máme k dispozici všechny ostatní možnosti:

Pokud nebereme v úvahu zřejmé funkce jako „Aktualizovat index“ nebo „Vymazat „mrtvé“ indexy, pak nás bude zajímat pouze poslední položka kontextového menu – „Seznam dokumentů“. Jeho aktivací obdržíme do pole výsledků hledání nikoli výsledek žádného dotazu, ale seznam všech souborů ve složce, pro kterou byla funkce zobrazení seznamu dokumentů volána. Někdy bude taková příležitost užitečná a dokonce pohodlná!

Nastavení DocFetcher

Do několika nastavení programu se dostanete kliknutím na druhé tlačítko napravo od vyhledávacího řádku:

Zde by měly být všechny parametry jasné a bez dalších vysvětlení. Jediná věc, které byste měli věnovat pozornost, je odkaz "Pokročilá nastavení" v levém dolním rohu. Kliknutím na něj se otevře textová zpráva konfigurační soubor, ve kterém můžete provést drobné úpravy.

Bohužel, komentáře k nastavení (a ony samotné) jsou v angličtině, takže vám doporučuji cokoli změnit, pouze pokud jasně rozumíte tomu, co vybraný parametr ovlivní!

Výhody a nevýhody programu

  • téměř okamžité vyhledávání podle názvů souborů a obsahu;
  • schopnost vytvářet složité dotazy;
  • řazení výsledků vyhledávání podle relevance;
  • vyhledávání v archivech;
  • náhled obsahu souboru se zvýrazněním dotazu.
  • potřeba předběžné indexace souborů;
  • standardně se hledá přesná shoda s požadavkem, což není vždy vhodné;
  • vysoká spotřeba prostředků při indexování velkého počtu souborů.

závěry

DocFetcher není jediným programem svého druhu, ale jedním z nejfunkčnějších, a to i ve srovnání s placeným softwarem.

Jediným vážnějším nedostatkem je dle mého názoru fakt, že aplikace je napsána v JAVA, což přes všechna tvrzení vývojářů značně zatěžuje systém. U moderních vícejádrových počítačů to samozřejmě není problém, ale na starších strojích lze někdy pozorovat „brzdy“.

Jinak je DocFetcher výborný vyhledávač, který každý najde během pár chvil. důležitý soubor jen jedno slovo, které obsahoval. Program bude také nepostradatelný pro vývojáře, protože umožňuje vyhledávat jakékoli složité struktury kódu.

P.S. Je povoleno volně kopírovat a citovat tento článek za předpokladu, že je uveden otevřený aktivní odkaz na zdroj a je zachováno autorství Ruslana Tertyshného.

Každým dnem se zvyšuje objem informací ze sítě, a tedy i z počítačů uživatelů. Na pevné disky Pro běžného uživatele může počet souborů dosáhnout několika stovek a najít v celkovém množství ten, který potřebujete, není vůbec snadné. Standardní vyhledávač Windows nefunguje vždy rychle a má velmi omezenou funkčnost, takže má smysl používat programy třetích stran.

V této recenzi se podíváme na několik programů, které vám pomohou najít potřebná data ve vašem počítači.

Tento program je snad nejmocnějším nástrojem pro vyhledávání disků PC. Má hodně jemné úpravy, filtry a funkce. Distribuce také obsahuje další nástroje pro interakci se systémem souborů.

Jednou z charakteristických vlastností Search My Files je schopnost úplné odstranění soubory jejich přepsáním nulami nebo náhodnými daty.

SearchMyFiles

Search My Files je často zaměňován s předchozím softwarem kvůli jeho podobnému názvu. Tento program se liší tím, že se snáze ovládá, ale zároveň postrádá některé funkce, například vyhledávání na síťových discích.

Všechno

Jednoduchý vyhledávací program s vlastními funkcemi. Vše umí vyhledávat data nejen na lokálním počítači, ale i na ETP a FTP servery. Od ostatních zástupců podobného softwaru se odlišuje tím, že vám umožňuje sledovat změny v souborovém systému počítače.

Efektivní vyhledávání souborů

Další velmi snadno nastavitelný a použitelný software. V absolutně malá velikost má dostatečné množství funkcí, je schopen exportovat výsledky do textových a tabulkových souborů a lze jej nainstalovat na flash disk.

UltraSearch

UltraSearch dokáže najít nejen soubory a složky, ale také vyhledávat informace v obsahu dokumentů podle klíčové fráze nebo slova. Domov charakteristický rys Program má automaticky inicializovat připojená média.

R.E.M.

REM má přátelštější rozhraní než předchozí účastníci. Principem programu je vytvoření zón, ve kterých jsou soubory automaticky indexovány, což může výrazně urychlit proces vyhledávání. Zóny lze vytvářet nejen na lokálním počítači, ale také na discích v síti.

Vyhledávání Google Desktop

Google Desktop Search, vyvinutý světoznámou společností, je malý místní vyhledávač. S jeho pomocí můžete vyhledávat informace jak na domácím PC, tak na internetu. Kromě hlavní funkce program umožňuje použití informačních bloků - miniaplikací pro pracovní plochu.

Všechny programy uvedené v tento seznam, jsou skvělé pro nahrazení nativního vyhledávání Windows. Vyberte si sami: nainstalujte si jednodušší software, ale s menší sadou funkcí, nebo celý vyhledávač se schopností zpracovávat soubory. Pokud pracujete se složkami a jednotkami v lokální síť, pak jsou pro vás vhodné REM a Vše, a pokud plánujete „nosit program s sebou“, věnujte pozornost Efektivnímu vyhledávání souborů nebo Vyhledávání v mých souborech.

Pro profesionální vyhledávání Internet vyžaduje specializovaný software, stejně jako specializované vyhledávače a vyhledávací služby.

PROGRAMY

http://dr-watson.wix.com/home – program je určen pro zkoumání polí textové informace za účelem identifikace entit a spojení mezi nimi. Výsledkem práce je zpráva o zkoumaném objektu.

http://www.fmsasg.com/ - jeden z nejlepších programů na světě pro vizualizaci spojení a vztahů Sentinel Vizualizer. Společnost zcela rusifikovala své produkty a propojila se horká linka v Rusku.

http://www.newprosoft.com/ – „Web Content Extractor“ je nejvýkonnější a snadno použitelný software pro extrahování dat z webových stránek. Má také efektivní Visual Web spider.

SiteSputnik softwarový balík, který nemá na světě obdoby, umožňující vyhledávat a zpracovávat jeho výsledky na viditelném i neviditelném internetu pomocí všech pro uživatele nezbytných vyhledávačů.

WebSite-Watcher – umožňuje sledovat webové stránky, včetně heslem chráněných, monitorovací fóra, RSS kanály, diskusní skupiny, místní soubory. Má výkonný filtrační systém. Monitorování probíhá automaticky a je dodáváno uživatelsky přívětivou formou. Program s pokročilými funkcemi stojí 50 eur. Neustále aktualizováno.

http://www.scribd.com/ je nejpopulárnější platforma na světě a v Rusku se stále více používá pro odesílání různých druhů dokumentů, knih atd. pro bezplatný přístup pomocí velmi pohodlného vyhledávače titulů, témat atd.

http://www.atlasti.com/ je nejvýkonnější a nejefektivnější nástroj pro kvalitativní analýzu informací dostupný jednotlivým uživatelům, malým a dokonce i středním podnikům. Program je multifunkční, a proto užitečný. Kombinuje schopnost vytvářet jednotné informační prostředí pro práci s různými textovými, tabulkovými, zvukovými a video soubory jako jedním celkem a také nástroje pro kvalitativní analýzu a vizualizaci.

Ashampoo ClipFinder HD – stále větší podíl toku informací pochází z videa. Důstojníci konkurenčního zpravodajství proto potřebují nástroje, které jim umožní pracovat s tímto formátem. Jedním z takových produktů je bezplatný nástroj, který představujeme. Umožňuje vám vyhledávat videa na základě zadaných kritérií na stránkách pro ukládání video souborů, jako je YouTube. Program se snadno používá, zobrazuje všechny výsledky vyhledávání na jedné stránce s podrobnými informacemi, názvy, trváním, časem, kdy bylo video nahráno do úložiště atd. Existuje ruské rozhraní.

http://www.advego.ru/plagiatus/ – program je vytvořen SEO optimalizátory, ale je docela vhodný jako internetový zpravodajský nástroj. Plagiátorství ukazuje míru jedinečnosti textu, zdroje textu a procento shody textu. Program také kontroluje jedinečnost zadané URL. Program je zdarma.

http://neiron.ru/toolbar/ – obsahuje doplněk pro kombinování Google vyhledávání a Yandex a také vám to umožňuje konkurenční analýza, na základě posouzení účinnosti stránek a kontextová reklama. Implementováno jako plugin pro FF a GC.

http://web-data-extractor.net/ je univerzální řešení pro získávání jakýchkoliv dat dostupných na internetu. Nastavení řezných dat z libovolné stránky se provádí několika kliknutími myši. Stačí vybrat datovou oblast, kterou chcete uložit, a Datacol automaticky vybere vzorec pro vyříznutí tohoto bloku.

CaptureSaver je profesionální internetový výzkumný nástroj. Jednoduše nenahraditelné pracovní program, která vám umožní zachytit, uložit a exportovat jakékoli internetové informace, včetně nejen webové stránky, blogy, ale také RSS novinky, e-mail, obrázky a mnoho dalšího. Má nejširší funkčnost, intuitivní rozhraní a směšnou cenu.

http://www.orbiscope.net/en/software.html – webový monitorovací systém za více než přijatelné ceny.

http://www.kbcrawl.co.uk/ – software pro práci včetně „neviditelného internetu“.

http://www.copernic.com/en/products/agent/index.html – program umožňuje vyhledávat pomocí více než 90 vyhledávačů pomocí více než 10 parametrů. Umožňuje kombinovat výsledky, eliminovat duplicity, blokovat nefunkční odkazy a zobrazovat nejrelevantnější výsledky. Dodává se v bezplatné, osobní a profesionální verzi. Používá více než 20 milionů uživatelů.

Maltego je zásadně nový software, který vám umožňuje navázat vztah subjektů, událostí a objektů v reálném životě a na internetu.

SLUŽBY

new je účinný agregátor vyhledávačů pro hledání lidí v hlavní ruštině v sociálních sítích.

https://hunter.io/ je efektivní služba pro detekci a kontrolu e-mailů.

https://www.whatruns.com/ je snadno použitelný, ale účinný skener, který odhalí, co na webu funguje a co nefunguje a jaké jsou jeho bezpečnostní díry. Také implementováno jako plugin pro Chrom.

https://www.crayon.co/ je americká rozpočtová platforma pro tržní a konkurenční zpravodajství na internetu.

http://www.cs.cornell.edu/~bwong/octant/ – identifikátor hostitele.

https://iplogger.ru/ – jednoduchá a pohodlná služba pro určení IP někoho jiného.

http://linkurio.us/ je výkonný nový produkt pro pracovníky ekonomické bezpečnosti a vyšetřovatele korupce. Zpracovává a vizualizuje obrovské množství nestrukturovaných informací z finančních zdrojů.

http://www.intelsuite.com/en – anglická online platforma pro konkurenční zpravodajství a monitorování.

http://yewno.com/about/ je první operační systém pro převod informací do znalostí a vizualizaci nestrukturovaných informací. V současné době podporuje angličtinu, francouzštinu, němčinu, španělštinu a portugalštinu.

https://start.avalancheonline.ru/landing/?next=%2F – prognostické a analytické služby Andrey Masalovich.

https://www.outwit.com/products/hub/ – kompletní sada samostatných programů pro profesionální práci na webu 1.

https://github.com/search?q=user%3Acmlh+maltego – rozšíření pro Maltego.

http://www.whoishostingthis.com/ – vyhledávač hostingu, IP adres atd.

http://appfollow.ru/ – analýza aplikací na základě recenzí, optimalizace ASO, pozice v top a výsledky vyhledávání pro App Store, Google Play a Windows Phone Store.

http://spiraldb.com/ je služba implementovaná jako plugin pro Chrom, která vám umožňuje získat mnoho cenných informací o jakémkoli elektronickém zdroji.

https://millie.northernlight.com/dashboard.php?id=93 - bezplatná služba, která shromažďuje a strukturuje klíčové informace o průmyslových odvětvích a společnostech. Je možné využít informační panely založené na analýze textu.

http://byratino.info/ – sběr faktických údajů z veřejně dostupných zdrojů na internetu.

http://www.datafox.co/ – Platforma CI shromažďuje a analyzuje informace o společnostech, které zajímají klienty. Existuje demo.

https://unwiredlabs.com/home - specializovaná aplikace s API pro vyhledávání podle geolokace libovolného zařízení připojeného k internetu.

http://visualping.io/ – služba pro monitorování stránek a především fotografií a obrázků na nich dostupných. I kdyby se fotka na vteřinu objevila, bude e-mailem odběratel Má plugin pro Google Chrome.

http://spyonweb.com/ je výzkumný nástroj, který umožňuje hloubkovou analýzu jakéhokoli internetového zdroje.

http://bigvisor.ru/ – služba vám umožňuje sledovat reklamní kampaně pro určité segmenty zboží a služeb nebo konkrétní organizace.

http://www.itsec.pro/2013/09/microsoft-word.html – návod k použití od Artema Ageeva programy pro Windows pro potřeby konkurenčního zpravodajství.

http://granoproject.org/ je nástroj s otevřeným zdrojovým kódem zdrojový kód pro výzkumníky, kteří sledují sítě spojení mezi jednotlivci a organizacemi v politice, ekonomice, kriminalitě atd. Umožňuje propojovat, analyzovat a vizualizovat informace získané z různých zdrojů a také ukázat významné souvislosti.

http://imgops.com/ – služba pro extrakci metadat z grafické soubory a práci s nimi.

http://sergeybelove.ru/tools/one-button-scan/ – malý online skener pro kontrolu bezpečnostních děr na webových stránkách a dalších zdrojích.

http://isce-library.net/epi.aspx – služba pro vyhledávání primárních zdrojů pomocí fragmentu textu v angličtině

https://www.rivaliq.com/ je účinný nástroj pro provádění konkurenčního zpravodajství na západních, především evropských a amerických trzích zboží a služeb.

http://watchthatpage.com/ je služba, která vám umožňuje automaticky shromažďovat nové informace z monitorovaných internetových zdrojů. Služba je zdarma.

http://falcon.io/ je druh programu Rapportive for the Web. Nenahrazuje Rapportive, ale poskytuje další nástroje. Oproti tomu Rapportive poskytuje obecný profil člověka jakoby slepený z dat ze sociálních sítí a zmínek na webu http://watchthatpage.com/ - služba, která umožňuje automaticky sbírat nové informace ze sledovaných zdrojů na internetu. Služba je zdarma.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – doplněk pro Firefox. Sleduje aktualizace webových stránek. Užitečné pro webové stránky, které nemají zpravodajské kanály (Atom nebo RSS).

http://agregator.pro/ – agregátor zpravodajských a mediálních portálů. Používají marketéři, analytici atd. analyzovat toky zpráv o určitých tématech.

http://price.apisshops.com/ – automatizovaná webová služba pro sledování cen u vybraných produktových skupin, konkrétních internetových obchodů a dalších parametrů.

http://www.la0.ru/ je pohodlná a relevantní služba pro analýzu odkazů a zpětných odkazů na internetový zdroj.

www.recordedfuture.com je výkonný nástroj pro analýzu a vizualizaci dat implementovaný jako online služba postavená na cloud computingu.

http://advse.ru/ je služba se sloganem „Zjistěte vše o vašich konkurentech“. Umožňuje vám získat webové stránky konkurentů v souladu s vyhledávacími dotazy a analyzovat reklamní kampaně konkurentů ve službách Google a Yandex.

http://spyonweb.com/ – služba vám umožňuje identifikovat stránky se stejnými charakteristikami, včetně těch, které používají stejné identifikátory statistické služby Google Analytics, IP adresy atd.

http://www.connotate.com/solutions – řada produktů pro konkurenční zpravodajství, řízení informačních toků a přeměnu informací na informační aktiva. Zahrnuje jak komplexní platformy, tak jednoduché, levné služby, které umožňují efektivní monitorování spolu s kompresí informací a získáváním pouze nezbytných výsledků.

http://www.clearci.com/ - platforma konkurenčního zpravodajství pro podniky různých velikostí od začínajících a malých společností až po společnosti Fortune 500. Řešeno jako saas.

http://startingpage.com/ je doplněk Google, který vám umožňuje vyhledávat na Googlu bez zaznamenávání vaší IP adresy. Plně podporuje všechny možnosti vyhledávání Google, včetně ruštiny.

http://newspapermap.com/ je jedinečná služba, která je velmi užitečná pro důstojníka konkurenčního zpravodajství. Propojuje geolokaci s online vyhledávačem médií. Tito. vyberete si region, který vás zajímá, případně i město, či jazyk, zobrazíte si místo na mapě a seznam online verzí novin a časopisů, kliknete na příslušné tlačítko a čtete. Podporuje ruský jazyk, velmi uživatelsky přívětivé rozhraní.

http://infostream.com.ua/ je velmi pohodlný systém sledování zpráv „Infostream“, který se vyznačuje prvotřídním výběrem a je docela dostupný pro každou peněženku, od jednoho z klasiků internetového vyhledávání, D.V. Lande.

http://www.instapaper.com/ je velmi jednoduchý a efektivní nástroj pro uložení potřebných webových stránek. Lze použít na počítačích, iPhonech, iPadech atd.

http://screen-scraper.com/ – umožňuje automaticky extrahovat veškeré informace z webových stránek, stahovat drtivou většinu formátů souborů a automaticky zadávat data do různých formulářů. Ukládá stažené soubory a stránky do databází, provádí mnoho dalších extrémně užitečné funkce. Funguje na všech hlavních platformách, má plně funkční bezplatné a velmi výkonné profesionální verze.

http://www.mozenda.com/ – má několik tarifní plány a webová služba multifunkčního sledování webu a doručování informací potřebných pro uživatele z vybraných stránek, dostupná i malým firmám.

http://www.recipdonor.com/ - služba umožňuje automaticky sledovat vše, co se děje na webových stránkách konkurence.

http://www.spyfu.com/ – a to v případě, že vaši konkurenti jsou zahraniční.

www.webground.su je služba pro monitorování Runet vytvořená profesionály na vyhledávání na internetu, která zahrnuje všechny hlavní poskytovatele informací, zpráv atd. a je schopna individuálního nastavení monitorování tak, aby vyhovovala potřebám uživatele.

VYHLEDÁVAČE

https://www.idmarch.org/ je z hlediska kvality nejlepší vyhledávač pro světový archiv pdf dokumentů. V současné době bylo indexováno více než 18 milionů pdf dokumentů, od knih po tajné zprávy.

http://www.marketvisual.com/ je unikátní vyhledávač, který umožňuje vyhledávat vlastníky a top management podle celého jména, názvu společnosti, pozice nebo jejich kombinace. Výsledky hledání obsahují nejen hledané objekty, ale i jejich souvislosti. Určeno především pro anglicky mluvící země.

http://worldc.am/ je vyhledávač volně přístupných fotografií spojených s geolokací.

https://app.echosec.net/ je veřejný vyhledávač, který se popisuje jako nejpokročilejší analytický nástroj pro profesionály v oblasti vymáhání práva a bezpečnosti a zpravodajství. Umožňuje vyhledávat fotografie zveřejněné na různých webech, sociálních platformách a sociálních sítích ve vztahu ke konkrétním geolokačním souřadnicím. Aktuálně je připojeno sedm datových zdrojů. Do konce roku bude jejich počet více než 450. Díky Dementy za tip.

http://www.quandl.com/ je vyhledávač sedmi milionů finančních, ekonomických a sociálních databází.

http://bitzakaz.ru/ – vyhledávač výběrových řízení a vládních zakázek s dalšími placenými funkcemi

Website-Finder – umožňuje najít stránky, které Google špatně indexuje. Jediným omezením je, že pro každého klíčové slovo prohledává pouze 30 webových stránek. Program se snadno používá.

http://www.dtsearch.com/ je výkonný vyhledávač, který umožňuje zpracovávat terabajty textu. Funguje na desktopu, webu a intranetu. Podporuje statická i dynamická data. Umožňuje vyhledávat ve všech programech MS Office. Vyhledávání se provádí pomocí frází, slov, značek, indexů a mnoha dalších. Jediný dostupný federovaný vyhledávač. Má placenou i bezplatnou verzi.

http://www.strategator.com/ – vyhledává, filtruje a shromažďuje informace o společnosti z desítek tisíc webových zdrojů. Vyhledávání v USA, Velké Británii, hlavních zemích EHS. Je vysoce relevantní, uživatelsky přívětivý a má bezplatné a placené možnosti (14 $ měsíčně).

http://www.shodanhq.com/ je neobvyklý vyhledávač. Ihned poté, co se objevil, dostal přezdívku „Google pro hackery“. Nevyhledává stránky, ale zjišťuje IP adresy, typy routerů, počítačů, serverů a pracovních stanic umístěných na konkrétní adrese, sleduje řetězce DNS serverů a umožňuje implementovat mnoho dalších zajímavých funkcí pro konkurenční zpravodajství.

http://search.usa.gov/ je vyhledávač pro webové stránky a otevřené databáze všech vládních agentur USA. Databáze obsahují mnoho praktických užitečné informace, včetně použití v naší zemi.

http://visual.ly/ – dnes se k prezentaci dat stále častěji používá vizualizace. Toto je první vyhledávač infografiky na webu. Spolu s vyhledávačem má portál výkonné nástroje pro vizualizaci dat, které nevyžadují znalosti programování.

http://go.mail.ru/realtime – vyhledávání diskusí o tématech, událostech, objektech, předmětech v reálném nebo přizpůsobitelném čase. Dříve velmi kritizované vyhledávání na Mail.ru funguje velmi efektivně a poskytuje zajímavé, relevantní výsledky.

Zanran je právě spuštěn, ale již funguje skvěle, první a jediný vyhledávač dat, ze kterého je získává soubory PDF, EXCEL tabulky, data na HTML stránkách.

http://www.ciradar.com/Competitive-Analysis.aspx je jedním z nejlepších světových systémů pro vyhledávání informací pro konkurenční zpravodajství na hlubokém webu. Načte téměř všechny typy souborů ve všech formátech na téma zájmu. Implementováno jako webová služba. Ceny jsou více než rozumné.

http://public.ru/ – Efektivní vyhledávání a profesionální analýza informací, archiv médií od roku 1990. Online knihovna médií nabízí širokou škálu informačních služeb: od přístupu k elektronickým archivům ruskojazyčných mediálních publikací a hotových tematických tiskových recenzí až po individuální monitorování a exkluzivní analytický výzkum založený na tiskových materiálech.

Cluuz je mladý vyhledávač s bohatými příležitostmi pro konkurenční zpravodajství, zejména na anglicky psaném internetu. Umožňuje nejen vyhledávat, ale také vizualizovat a navazovat spojení mezi lidmi, společnostmi, doménami, e-maily, adresami atd.

www.wolframalpha.com – vyhledávač zítřka. V reakci na požadavek na vyhledávání poskytuje statistické a faktické informace dostupné o objektu požadavku, včetně vizualizovaných informací.

www.ist-budget.ru – univerzální vyhledávání v databázích vládních zakázek, výběrových řízení, aukcí atd.


Mluvte o tom, co v naší době informační technologie a nekonečný růst objemu dat dostupných pro jednotlivce i společnost, je mnoho problémů se zpracováním informací a jejich vyhledáváním - to už je rouhání. Kdo toto téma nenastoluje? A abych vás nezatěžoval subjektivními a částečně i objektivními soudy vyvozenými z různých informačních zdrojů ohledně problému, přejdu přímo k jeho řešení. Dnes si povíme něco o hledání. Tedy o programech a seriózních informačních systémech, které vyhledávají dokumenty a data, která potřebujeme.

Upgradujte "přímé vyhledávání"

Není to tak dávno, kdy byly stromy velké a ani v místní síti podniku nebylo mnoho informací, jakékoli vyhledávání se provádělo pouhým prohledáváním několika dostupné soubory a důslednou kontrolu jejich názvů a obsahu. Takové vyhledávání se nazývá přímé a programy (utility) využívající technologii přímého vyhledávání jsou tradičně přítomny ve všech operační systémy a balíčky nástrojů. Ale i ta síla moderní počítače nestačí pro rychlé a adekvátní vyhledávání v gigantických objemech dat při přímém vyhledávání. Prohledat několik stovek dokumentů na disku a prohledat obrovskou knihovnu a několik desítek poštovních schránek jsou dvě různé věci. Proto programy pro přímé vyhledávání dnes jednoznačně ustupují do pozadí – pokud jde o univerzální nástroje.

Samozřejmě, že tento typ vyhledávání není ve firemním sektoru dlouho žádaný. Objemy nejsou stejné. A proto již mnoho let a dále Nedávno Je zřejmé, že technologie schopné rychle a přesně vyhledávat dokumenty různých formátů az různých zdrojů jsou více než relevantní. Není to tak dávno, co „otec“ Microsoftu Bill Gates, který zjevně záviděl fenomenální úspěch internetovému vyhledávači Google, na jedné z tiskových konferencí oznámil touhu softwarového průmyslu (nejen) přispět všemi možnými způsoby, rozvíjet a prohlubovat tvorbu vyhledávačů a technologií. Na vytvoření fenomenálně fungujícího programu od Microsoftu nebo konkurenčního serveru na internetu je ale příliš brzy (MSN se stále nedostalo k Googlu). Vraťme se proto ke stávajícímu vývoji. Index, dotaz, relevance

Moderní technologie jsou založeny na dvou základních procesech. Za prvé je to indexace dostupných informací a zpracování požadavku s následným výstupem výsledků. Pokud jde o první, jakýkoli program (ať už je to počítačový vyhledávač, firemní Informační systém nebo internetový vyhledávač) vytváří vlastní vyhledávací oblast. To znamená, že zpracovává dokumenty a generuje index těchto dokumentů (organizovaná struktura, která obsahuje informace o zpracovávaných datech). Do budoucna je to právě vytvořený index, který slouží k práci – rychlému získání seznamu potřebných dokumentů dle požadavku. To, co následuje, byť po technologické stránce nijak jednoduché, je běžnému uživateli celkem srozumitelné. Program zpracuje požadavek (pomocí klíčového sousloví) a zobrazí seznam dokumentů, které tuto klíčovou frázi obsahují. Vzhledem k tomu, že informace jsou obsaženy ve strukturovaném indexu, je zpracování dotazu mnohem rychlejší (desítky i stovkykrát!) než v případě přímého vyhledávání (výběr dokumentů se neprovádí výčtem souborů, ale analýzou textových informací v index).

Program zobrazí nalezené dokumenty ve výsledném seznamu podle relevance - souladu dokumentu s textem dotazu. V různých technologiích samozřejmě existují různé metody pro vyhledávání a určování relevance dokumentu (počet „výskytů“ slova a jeho četnost zmínky v dokumentu, poměr těchto parametrů k celkovému počtu slov v dokumentu vzdálenost mezi slovy dotazované fráze ve vyhledaných souborech atd.). Na základě těchto parametrů se určí „váha“ dokumentu a v závislosti na ní se konkrétní soubor objeví v seznamu výsledků na určité pozici. V případě vyhledávání na internetu je situace ještě složitější. V tomto případě je skutečně třeba vzít v úvahu mnoho dalších faktorů (příkladem je hodnocení stránky Google). Ale to je téma na samostatný článek, takže se internetu nedotkneme. Recenze vyhledávačů

V tento materiál Zvažují se možnosti několika populárních vyhledávacích programů, které se mohou pochlubit slušnou rychlostí a dobrou funkčností. Ale předvádět se v brožurách je jedna věc, ale stát pod pohledem odborníka je věc druhá. A nebylo více odborníků, o nic méně kancelář plná lidí, kteří se rádi vrtali v softwaru pro jeho použitelnost. Na experimentálním počítači (Athlon 2,2 MHz, s 1 GB RAM, 160GB pevným diskem Seagate IDE při 7200 ot./min a systém Windows XP) byla nainstalována sada programů: dtSearch Desktop, Bloodhound Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Pro testy byla sestavena textová databáze dokumentů ve formátech doc, txt a html o celkové velikosti ani větší ani menší, ale 20 gigabajtů. Skupina soudruhů pod vedením vašeho skromného sluhy testovala, porovnávala a sdílela své subjektivní dojmy z každého softwaru. Přečtěte si shrnutí zjištění níže. dtSearch Desktop

Program, který podle vývojářů tvrdí, že je nejrychlejší, nejpohodlnější a nejlepší vyhledávač. Jako obecně všichni ostatní z tato recenze. Rozhraní dtSearch je poměrně jednoduché, ale některá okna nebo karty jsou poněkud přeplněné prvky, což ztěžuje použití. Ale ve skutečnosti neexistují žádné zvláštní potíže. Jediným opravdu nepříjemným bodem je nedostatek podpory softwaru pro ruský jazyk (navzdory skutečnosti, že program může vyhledávat dokumenty v několika jazycích, jeho rozhraní je výhradně anglické).

Ale dtSearch je jedním z mála programů, které mohou indexovat webové stránky do uživatelsky zadané „hloubky“ (i když s přihlédnutím k „dokoupení“ doplňkové sady dtSearch Spider). To je kromě podpory souborů na disku různých textových formátů a e-maily z poštovní schránka Výhled. Program zároveň neumí pracovat s databázemi, které jsou pro vyhledávače tak chutným soustem kvůli velkému objemu informací v nich obsažených a jejich širokému rozšíření ve firmách, potažmo v podnikových sítích. Rychlost indexování dokumentů dtSearch se ukázala být na správné úrovni. Výhledově řeknu, že tento program si s indexováním daného množství informací poradil na úrovni s dalším konkurentem - iSYS - a dělil se s ním o druhé místo v žebříčku nejrychlejších systémů. dtSearch indexovalo testovacích 20 gigabajtů informací za 6 hodin a 13 minut a vytvořilo index 7,9 GB pro potřeby následného vyhledávání.

Pokud jde o možnosti vyhledávání, zde jsou na správné úrovni. Za prvé, dtSearch má morfologické vyhledávání (hledání slova ve všech jeho morfologických formách). Použitím tato příležitost, osvobodíte se řekněme od takových myšlenek jako „v jakém případě bylo určité slovo použito v dokumentu, který jsem potřeboval?“ Použití morfologického vyhledávání je téměř vždy opodstatněné, proto by mělo být přítomno v každém profesionálním vyhledávači.

Vyhledávání podle zvuku je nestandardní funkce i pro profesionální vyhledávače. Jeho podstatou je, že program bude hledat slova, která znějí stejně jako slovo, které jste zadali. A nejlepší na tom je, že tato funkce funguje i pro ruský jazyk! Když například do vyhledávacího dotazu napíšete slovo „ucho“, uvidíte ve výsledku nejen slova „ucho“, ale také „ucho“.

Vyhledávání s opravou chyb je velmi důležitá funkce. Slouží k vyhledávání slov obsahujících syntaktické chyby – mohou to být buď překlepy, nebo chyby v dokumentech získaných například pomocí systémů rozpoznávání znaků. Jednoduchý příklad – hledáte slovo klávesnice. Některý dokument obsahuje slovo „klávesnice“, je zřejmé, že se ve skutečnosti jedná o slovo „klávesnice“, člověk jen udělal při psaní překlep. Hledání opravy chyb tedy detekuje a zahrne dokument se slovem „klávesnice“ do výsledku. V dtSearch je také nastavení, které umožňuje určit míru možných chybných znaků.

Hledejte pomocí synonym. Tato funkce používá seznam synonym pro různá slova. Například zadáním slova „rychlý“ program najde také slova „vysokorychlostní“ a další, která jsou synonymem pro slovo „rychlý“, pokud jsou samozřejmě přítomna v seznamu synonym . Hotový seznam synonym není součástí programu dtSearch, je však možné použít seznamy na internetu (podle toho je nutné připojení, což není vždy vhodné), nebo si můžete vytvořit vlastní seznam synonym .

Kromě uvedených schopností může dtSearch vyhledávat pomocí frází složených ze slov spojených logickými operacemi. Každému slovu v dotazu lze přiřadit vlastní „váhu“, tedy význam. Užitečnou možností je použití slovníku skládajícího se z nedůležitých slov, abyste je nebrali v úvahu při vyhledávání, ale i tento slovník je prázdný a budete si ho muset vyplnit sami.

Dále se podíváme na možnosti programu při práci v síti. Ve skutečnosti dtSearch nenabízí žádné specifické možnosti pro práci se sítí. Je však docela možné jej použít online. Případně můžete vytvořit nějaký druh indexu a vložit jej do veřejné (sdílené) složky. Samotný program lze nainstalovat na počítač každého uživatele nebo jej lze také umístit do otevřené složky veřejný přístup a vytvářet zástupce speciálním způsobem pro každého uživatele zvlášť pomocí parametrů příkazového řádku, jejichž účel je popsán v souboru nápovědy dodaném s programem. Také existuje možnost automatická instalace programů do sítě pomocí soubor MSI. Tím se zohlední nastavení pro každého připojeného uživatele.

Obecně je to dobrý program z kategorie profesionálních vyhledávačů. Může mít dobré hodnocení, ale získání důvěry a respektu od uživatelů nemusí být pro dtSearch kvůli určitým faktorům snadné (ne vše je s rozhraním hladké, ruští uživatelé jsou ochuzeni, neexistují žádné jasné funkce pro práci se sítí) . Pokud jde o přímé vyhledávání dokumentů, program neměl problémy s ruským textem. Protože nebyly žádné s deklarovanou morfologií nebo s fuzzy vyhledáváním. Systém celkem adekvátně našel potřebné dokumenty a jednoduchou žádostí jedním slovem a použitím několika odstavců nebo dokumentu jako klíčové fráze.

Oficiální stránka:
Velikost distribuce: 23 Mb Bloodhound Prof Deluxe

Podle názvu můžete odhadnout, že v tomto programu je podpora ruského jazyka. To už je pěkné. Pokud jde o rozhraní, obecně je poněkud neobvyklé, ale vzhledově je velmi atraktivní. Další věcí je pohodlí. Velmi kontroverzní kritérium, ale stále pravděpodobně není řešení s více okny nejúspěšnější možností (v jednom okně se zadá požadavek, v jiném se zobrazí výsledek a podobně).

Snoop používá stejné indexy k provedení rychlého vyhledávání, ale indexování je mnohem pomalejší než jiné programy. To je velmi zvláštní, zvláště vezmeme-li v úvahu, že jeho schopnosti pro zpracování vyhledávacích dotazů jsou velmi slabé, a proto struktura indexu není složitá. S největší pravděpodobností je to způsobeno neoptimalizovanými algoritmy. Tento program se ukázal jako jasný outsider v indexování a rychlosti vyhledávání: čas strávený vytvářením indexu je šestkrát delší než u dtSearch a iSYS. Indexování 20 gigabajtů textů pro bloodhounda znamenalo 38 hodin a 46 minut práce. A vytvořená „vyhledávací oblast“ zabrala na pevném disku stejnou velikost jako původní data s malým mínusem – 19 gigabajtů.

Bloodhound může být prezentován jako alternativa ke standardnímu vyhledávání ve Windows; je nepravděpodobné, že bude schopen více. O tom, že Bloodhound má na prvním místě jednoduché vyhledávání souborů se vyznačuje nejen malým počtem funkcí pro analýzu textu vyhledávacích dotazů a pokročilým vyhledáváním podle atributů souborů, ale dokonce i oknem s výsledky, které poskytuje přímé odkazy na nalezené soubory a také na složky obsahující tyto soubory. Okno výsledků není příliš informativní v tom smyslu, že celý nalezený soubor můžete přečíst pouze jeho spuštěním, to znamená, že nemá vestavěný prohlížeč souborů. Zobrazí se ale úryvek ze souboru, kde bylo hledané slovo nalezeno, obecně toto schéma zobrazení velmi připomíná internetové vyhledávače.

Když už mluvíme o specifických schopnostech zpracování vyhledávacích dotazů, stojí za zmínku, že neexistuje nic jako „hledaný text“; maximum, které lze prohledávat, je fráze, už jen proto, že neexistuje víceřádkové pole pro zadávání textu. Zadanou frázi však můžete také analyzovat a Snoop nám zde nabízí standardní vyhledávací sadu: logické operace, vyhledávání masky a vyhledávání nabídek... nic moc. Program obsahuje některé základy morfologického vyhledávání, ale je pravděpodobně tak hrubý, že s největší pravděpodobností narušuje správné fungování (během testů bylo zaznamenáno mnoho chyb s nesprávným použitím morfologie).

Program ale umožňuje při vyhledávání specifikovat atributy souboru (datum dokumentu, název souboru, název složky) a v těchto dotazech můžete také použít stejnou vyhledávací sadu. Můžete také vyhledávat písmena zadáním parametrů (Od, Předmět... atd.).

Na samotné hledání jsme tedy přišli, co dalšího je na programu, za který získal tolik ocenění, podle informací z oficiálního webu zajímavého? Těžko říct, co je na něm tak zvláštního; s největší pravděpodobností je rozhraní Bloodhound atraktivní (přesně vzhledově, nemluvě o použitelnosti).

Operace s indexy jsou velmi standardní, příjemnou funkcí je možnost aktualizovat indexy podle plánu. Kromě toho lze indexy používat také online. Od této chvíle potřebujeme další podrobnosti.

Přes primitivnost vyhledávacích dotazů lze s programem vyhledávat soubory, takže jeho použití lze v sítích ospravedlnit. I když je to zdlouhavé, protože ve velké síti je prioritou rychlé vyhledávání dat pomocí složitých vyhledávacích dotazů kvůli obrovskému množství informací - a zde jsou zjevně problémy s rychlostí vyhledávání a programem. Musím říct, že práce se sítí v Izhishika je promyšlená tak, jak má. Speciálně pro to je navržena samostatná aplikace - Bloodhound Server. Funguje to stejně jako jednoduše Snooper (mají stejný vyhledávač), pouze pro dokumenty hostované na centrálním serveru nebo na sdílených zdrojích v firemní síť. Snooper Server vytváří nové indexy na sdílených prostředcích nebo používá dříve vytvořené. Každý uživatel podnikové sítě se může připojit k vyhledávacímu serveru a použít jej k přístupu k libovolnému dokumentu (umístěnému v aktuálním indexu) pomocí internetového prohlížeče. Souhlasíte, toto schéma je velmi pohodlné: ukazuje se, že soubory ve vaší vlastní síti lze vyhledávat stejným způsobem jako informace na internetu například prostřednictvím Google.

Po zhodnocení všech výhod a nevýhod tohoto programu závěr sám napovídá, že jeho schopnosti s největší pravděpodobností nestačí pro podnikové sítě (i přes dobrou organizaci práce se sítí), ale pro domácí počítač nebo dokonce pro domácí síť ano. v zásadě by to mohlo přijít. I když ani rychlost práce, ani možnosti vyhledávání nevzbuzují optimismus...

Oficiální stránky v ruštině:
Velikost distribuce: 6 MbGoogle Desktop Search + GDS Enterprise

Samozřejmě jsme nemohli ignorovat tak slavného vývojáře. Již název Google mnohé napovídá. Lidé, kteří již léta používají nejvýkonnější internetový vyhledávač, se jistě bez jediné pochybnosti rozhodnou nainstalovat si tento konkrétní vyhledávač do svého počítače. Jen si pomyslete: Google na vašem domácím počítači! Aniž bychom však podlehli provokacím se široce propagovanou značkou, zkusme střízlivě a hlavně objektivně zvážit možnosti „desktopového“ vyhledávače od Googlu.

První věc, která vás upoutá, je nedostatek vlastního shellu pro program. Google Desktop Search je stále umístěn v okně prohlížeče, respektive celé rozhraní desktopové verze bylo zděděno ze softwaru od svého staršího internetového bratříčka. Zda je to dobře nebo špatně, je diskutabilní: někomu se líbí minimalismus v designu tohoto vyhledávače, zatímco jiní chtějí vidět plnohodnotnou aplikaci plnou všech druhů tlačítek a tak dále.

Co vám padne do oka hned po návrhu? A skutečnost, že stejný nástroj Google Desktop Search začne indexovat vše v počítači bez jakéhokoli požadavku! A co je nejzajímavější, je zvolit cesty indexování, kdy Nápověda Google Vyhledávání na ploše není možné. Budete si muset stáhnout samostatný program (TweakGDS), který vám umožní mírné rozšíření Nastavení Google Desktop, včetně určení míst potřebných pro indexování. Ačkoli v době, kdy to všechno zjistíte, bude již indexovat standardní pevný disk, takže toto nastavení bude pravděpodobně potřeba při práci s velkým množstvím dat, což je velmi důležité při použití v podnikových sítích (verze Enterprise) . Není však pravda, že po stažení TweakGDS budou vaše problémy vyřešeny. Koneckonců potřebuje Microsoft, aby fungovala. NET Framework a Microsoft Scripting Runtime. Jo... instalace, stejně jako přístup do nastavení, mohla být jednodušší, i když vývojáři asi chápou: proč psát něco nového, když existuje hotový vyhledávač, portovaný na místní počítač a nechte uživatele „užít si“ a nechejte slavné jméno, aby z „tohoto“ vytvořilo další mistrovské dílo. Pojďte, ukončíme tuto lyrickou odbočku a přejdeme k hledání.

Pokud jde o analýzu vyhledávacích dotazů a poskytování výsledků, je zde vše naprosto identické s Googlem na internetu: stejný systém pro zobrazování výsledků, stejná standardní sada logických operací pro vyhledávací dotazy. Obecně platí, že Google Desktop Search je stejně jako předchozí program určen výhradně pro vyhledávání souborů – pro tyto soubory samozřejmě nemá interní prohlížeč. Počet formátů souborů, které Google Desktop Search podporuje, je zcela dostatečný a příjemné je i to, že prohledává navštívené internetové stránky, přičemž data bere z mezipaměti. Rychlosti vyhledávání a indexování jsou celkem přijatelné. Pravda, pro domácí použití. Google Desktop Search si poradil s působivými 20 gigabajty textů za 8 hodin a 17 minut. Strávit několik dní zpracováváním informací z podnikové sítě velkého podniku není něco, co by chtěl dělat žádný systémový administrátor. Pozitivní je, že velikost vytvořeného indexu byla na stejné úrovni (4,5 GB) jako jiný vyhledávač testovaný v této recenzi – SearchInform.

Velkou výhodou (nebo nevýhodou – rozhodnete se vy) Google Desktop Search je, že podporuje pluginy, které mohou mnohé změnit k lepšímu. Další věc je, že připojení pluginů a jejich nastavení komplikuje instalaci vyhledávače natolik, že se začnete ptát, zda je to všechno nutné, když můžete nainstalovat normální. plnohodnotný program, ve kterém již bude vše přítomno. Koneckonců, abyste mohli používat každou funkci, budete muset nainstalovat nový plugin. I k tomu, aby program mohl plně pracovat s archivy, je potřeba samostatná vychytávka. Je fascinující a svůdné, že všechny tyto dodatečné moduly jsou zdarma. Pokud však neberete v úvahu desktopovou verzi vyhledávače, pak kompetentní konfigurace GDS Enterprise nemusí být ve vašich silách - koneckonců ne nadarmo nabízejí své služby specialisté z Google pro nastavení vlastního software pro vaši síť za pouhých 10 000 $.

Pokud projdete procesem nastavení a instalace (nebo zaplatíte 10 000 $ týmu rychlé reakce od společnosti Google), pochopíte, že složitost instalace je více než kompenzována velmi flexibilním nastavením při použití v podnikových sítích. Důležitý bod Google funguje Desktop v podnikové síti je k použití skupinové zásady, který umožňuje nastavit nastavení pro každého uživatele.

Abychom to shrnuli, nejrozumnějším využitím tohoto programu je domácí nebo pracovní počítač. Přece pro běžný počítač Stačí si program nainstalovat - zbytek udělá sám (ani se vás na nic neptá).

Google Desktop Search Enterprise však bude přijatelný v případech, kdy je naléhavá potřeba flexibilní konfigurace síťových zásad pro použití vyhledávače, zatímco schopnost zpracovávat vyhledávací dotazy bude až na druhém místě důležitosti a čas (nebo peníze) ) vynaložené na nastavení programu budou na prvním místě.

Oficiální stránka:
Velikost distribuce včetně TweakGDS: 1,2 MbCopernic Desktop Search

Pro zvětšení klikněte na obrázek

Rozhraní programu vyvolává extrémně pozitivní emoce - vše je provedeno v souladu s obecně uznávanými standardy, nic zbytečného, ​​jedním slovem příjemný design. Pro začátečníky bude pochopení rozhraní Copernic Desktop Search velmi snadné. I když je poněkud matoucí, že designéři jasně vytvořili rozhraní programu s ohledem na skutečnost, že program bude fungovat ve standardním motivu Windows XP. Při použití klasického motivu program nevypadá tak hezky. Ale to je spíše otázka vkusu.

Při prvním spuštění vás program vyzve k vytvoření indexů pro vyhledávání. Poněkud nezvykle se zdálo, že po výběru složek pro indexování program nenabídl ke stisknutí žádného tlačítka, jako například „Zahájit indexování“, a indexování se nespustilo automaticky, teprve pak bylo zaznamenáno, že se Copernic pokouší spustit indexování, zatímco počítač byl nečinný. Abyste vše správně nakonfigurovali, budete se muset trochu hlouběji ponořit do možností programu. Je třeba poznamenat, že existují poměrně široké možnosti pro nastavení automatického vytváření indexů: vestavěný plánovač, možnost indexovat, když je počítač nečinný, na pozadí, s nízkou prioritou. Indexování nebylo příliš rychlé – 10 hodin 51 minut – to je pomalejší než u jiných vyhledávačů (s výjimkou Isle of Bloodhound, ale Copernic je stále řádově rychlejší než vývoj iSleuthHound Technologies.

Nyní o struktuře indexu. Obecně na tom není nic zvláštního. Je možné vybrat typy souborů v obecné i podrobné podobě. To znamená, že zpočátku si můžete vybrat, co chcete indexovat – Dokumenty, Obrázky, Videa, Hudba. Na druhé kartě okna možností budete moci vybrat konkrétní typy souborů podle přípony. Kromě toho můžete index nakonfigurovat tak, aby například obrázky menší než 16x16 nebyly indexovány nebo zvukové soubory kratší než 10 sekund nebyly indexovány. Kromě indexování souborů ze složek může Copernic pracovat s e-maily a kontakty z adresáře Microsoft Outlook a Microsoft Outlook Express a je možné indexovat oblíbené položky a historii z Internet Exploreru.

Pokud jde o možnosti vyhledávání, jsou zde velmi slabé. Během testů se dokonce ukázalo, že program nevyhledává dokumenty ve formátech txt a html v ruštině, takže je můžete najít pouze podle názvů, nikoli podle obsahu. Jediná věc, kterou program poskytuje pro zlepšení efektivity vyhledávání, je použití standardní sady logických operací, a dokonce i tehdy byla tato funkce objevena experimentálně, protože nebyla zdokumentována. Mimochodem, ani s pomocí programu není vše v pořádku - je k dispozici pouze přes internet, což, jak vidíte, je velmi nepohodlné, a dokonce i na internetu referenční informace ne příliš mnoho. Vývojáři se zjevně rozhodli, že jednoduché rozhraní programu neznamená přítomnost normální nápovědy. V konverzaci o možnostech vyhledávání je třeba poznamenat, že i přes slabou analýzu dotazů poskytuje program zajímavý vyhledávací systém - uživatel si může vybrat typ souborů (obrázky, videa, hudba atd.), zadat vyhledávání dotaz a vyberte atributy specifické pro vybraný typ souboru. Například u zvukových souborů to mohou být hodnoty z mp3 tagů (interpret, album, datum atd.), u obrázků si například můžete vybrat jejich velikost (podle rozlišení), obecně má každý typ svůj vlastní nastavení. Po vyhledání konkrétního typu souboru program zobrazí v okně výsledků velmi informativní seznam a pokud váš požadavek obsahuje soubory jiných typů, můžete je otevřít kliknutím na konkrétní odkaz.

Samostatně stojí za zmínku okno pro zobrazení výsledků. Pod seznamem nalezených souborů je zobrazen obsah těchto souborů (podobné schéma se často používá v poštovní klienti). Je pravda, že zobrazení textu lze provést pouze v nativním formátu a neexistuje režim zobrazení prostého textu, což není vždy vhodné, protože otevření dokumentu v tomto případě trvá déle. Ale vzhledem k tomu, že Copernic umí vyhledávat obrázky a hudbu, je možné tyto multimediální soubory prohlížet.

Jsou popsány základní principy fungování tohoto programu, nyní se pojďme podívat, co nám Copernic Desktop Search může nabídnout pro práci se sítí... V zásadě se můžete dívat velmi dlouho, ale téměř nic neuvidíte . Jinými slovy, tento program nebyl zamýšlen jako síťový. Copernic Desktop Search je výhradně domácí vyhledávač.

Je zřejmé, že jedinou (nejlogičtější) aplikací tohoto programu je domácí počítač. Zde si plně poradí se všemi jednoduchými uživatelskými vyhledávacími dotazy skládajícími se z jednoho či dvou slov, najde potřebné informace a rozdělení vyhledávání podle typu souboru a podpora multimediálních souborů spolu s indexací na pozadí v režimu nízké priority, spojený s příjemným rozhraní, pouze dát programu sílu získat důvěru mezi nezkušenými uživateli.

Oficiální stránka
Velikost distribuce: 2,6 MbISYS Desktop

Pro zvětšení klikněte na obrázek

Velmi výkonný program. Svým stupněm výbavy všemožnými funkcemi se v seznamu blíží dalšímu vyhledávacímu systému SearchInform. Zároveň velikost instalační soubor více než 40 Mb! Těžko říct, co by se dalo do takových rozměrů vtěsnat, protože stejný SearchInform s podobnou funkčností zabírá 15 Mb.

Proces instalace zde také není příliš příjemný, respektive ani proces instalace. Ještě před stažením programu budete vyzváni k registraci, jinak to nejde. Dále rozhraní. Je to udělané moc pěkně, nic zbytečného nebije do očí, nicméně to jsou dojmy člověka, který je už tak trochu zvyklý. Pro začátečníka nebude snadné zjistit, kde a co se nachází, kam kliknout a kde nakonec hledat. Důrazně se doporučuje přečíst si nápovědu před zahájením práce – ušetříte si spoustu nervů a času. Ke všemu ostatnímu se přidává naprostá absence podpory ruského jazyka v programu. Špatný. Okna zde navíc nejsou přetížená ovládacími prvky, ale za to jsme museli zaplatit multimoduly a použitím dalších oken. Například vyhledávací dotazy se zadávají spuštěním jednoho programu a správa indexů se provádí pomocí jiného programu. Vyhledávací dotazy se zde také zadávají v samostatných vyskakovacích oknech. Těžko říct, co je lepší – přetížené rozhraní nebo všudypřítomná více oken; spíše je to věc vkusu.

Pokud jde o vytváření indexů, program poskytuje funkce pro zjednodušení procesu nastavení možností pro nový index. Tyto funkce zahrnují několik hotové šablony k vytváření rejstříků pro složku „Dokumenty“, „Pošta“, „Pošta a dokumenty“, „Konkrétní složka“, „Složka s výběrem typů souborů“ atd. Tyto šablony v první fázi zjednodušují vytváření rejstříků. Nástroj pro práci s indexy nemá příliš dobré rozhraní, což je zastrašující s určitou složitostí (upřímně řečeno, toto je velmi subjektivní hodnocení), ale pokud se na něj podíváte, poskytuje mnoho užitečných možností a obecně , jeho použití nezpůsobuje velké potíže. ISYS Desktop může indexovat data z různých zdrojů dat a také poskytuje mnoho flexibilních nastavení pro takové indexování. Mezi další funkce pro indexování: podpora pro SQL, FTP, TRIM Context, WORLDOX 2002, skripty. Pokud jste při vytváření indexu vybrali položku "Složka s výběrem typů souborů", máte možnost vybrat typy souborů pro indexování ručně (podle přípony). Je třeba říci, že podporovaných typů souborů je prostě obrovské množství, ale přidejte si svůj vlastní typ (příponu). existující seznam nebude to fungovat. Můžete si také všimnout přítomnosti plánovače indexování. Vytvoření indexu a zpracování 20 gigabajtů informací trvalo ISYS Desktopu 6 hodin a 13 minut, což nakonec ukázalo dobrý čas a velikost vytvořeného souboru – 7,9 GB.

Možnosti vyhledávání tohoto programu jsou docela dobré. To, co se používá v ISYS, je mnohem výkonnější než konvenční podpora logických operací. Mezi pokročilé možnosti vyhledávání program nabízí použití synonym a třídicí filtr (podle cesty, názvu a data vytvoření souboru). Kit logické operátory poněkud širší než standardní sada. Kromě logických operací umožňuje program pracovat s mnoha dalšími operátory, které v zásadě mohou nahradit některé typy vyhledávání, například vyhledávání s parsováním lze zcela nahradit použitím speciální operátoři. Velmi mě překvapilo, že program nemá vyhledávání pomocí morfologie. To je vážné opomenutí, protože při použití morfologické analýzy se výrazně zlepší efektivita vyhledávání. Kromě toho neexistuje seznam významných slov, ale existuje rozsáhlý seznam nevýznamných slov. Ohlášeny jsou také vyhledávací funkce jako „přibližné vyhledávání“ a „heuristická analýza“.

ISYS poskytuje výběr z několika typů vyhledávacích dotazů, jmenovitě vizuálních typů. Děje se tak pomocí různých typů oken pro zadávání vyhledávacích dotazů, nicméně ve skutečnosti ani jedno okno neumožňuje použití jiných technologií než výše uvedených.

Výsledky vyhledávání jsou velmi informativní a zobrazují se jako seznam dokumentů seřazených podle relevance. Níže se zobrazí náhled vybraného dokumentu. Na rozdíl od Copernic Desktop Search je zde náhled k dispozici pouze ve formě prostého textu, nebylo možné zobrazit dokumenty v jejich nativním formátu, ať už Word, Html nebo PDF, i když to v zásadě není příliš kritické. Program umožňuje rozdělit nalezené dokumenty do skupin podle určitých kritérií (standardně jsou rozděleny podle relevance). Můžete také zobrazit již nalezené dokumenty výběrem jednotlivých složek (to je výhodné, když výsledkem je velké množství dokumentů).

Použití programu v podnikové síti je také velmi oprávněné, protože poskytuje dobré příležitosti pro organizaci vyhledávání v síti. Vyhledávací systém je založen na vytvoření veřejného indexu, který obsahuje indexovaná data z veřejně dostupných online zdrojů.

Ve skutečnosti je program od ISYS hodný pozornosti, alespoň se s ním seznámit. Tento program je vyzrálý projekt s velkým množstvím funkcí (ne vždy a ne každý je samozřejmě potřebuje, ale přesto). Šance, že se program dočká nějakých vylepšení z hlediska zpracování vyhledávacích dotazů, není známa, ale v tuto chvíli jej lze doporučit pro téměř univerzální použití. A vzhledem k tomu, že je pro domácí systémy stále příliš těžký, jsou hlavními místy jeho instalace podnikové sítě.

Oficiální stránka:
Velikost distribuce: 40 MbSearchInform

Pro zvětšení klikněte na obrázek

Pravděpodobně nemá cenu začít hned popisem rozhraní SearchInform. Nejprve bychom měli popsat proces instalace, nebo spíše jeden z jeho detailů: program nelze nainstalovat bez připojení k internetu. Faktem je, že před prvním spuštěním program vyžaduje registraci uživatele (zdarma) a odesílá všechna zadaná data na server. Podle všeho museli vývojáři taková opatření v boji proti pirátství přijmout, ale na jednoduchosti instalace se to nijak pozitivně neprojevilo.

Rozhraní programu je navrženo v souladu se všemi obecně uznávanými pravidly, na první pohled je však poněkud těžkopádné. Při prvním použití programu se zdá, že je příliš komplikovaný, někdy není snadné si zapamatovat, ve kterém menu nebo na které záložce se požadovaná možnost nachází, nicméně při delším používání se rozhraní již nezdá tak strašně složité . Hlavní je si nejprve přečíst certifikát.

Jakmile trochu porozumíte rozhraní, můžete začít vytvářet index. Samotný proces je velmi jednoduchý a rychlost indexování i na pohled je výrazně vyšší než u všech ostatních vyhledávačů v recenzi. Jasná testovací čísla ukazují, že SearchInform je dvakrát rychlejší než dtSearch a iSYS, pokud jde o rychlost indexování! Poskytnutá data v objemu 20 gigabajtů program indexoval v rekordním čase 3 hodiny 17 minut. A velikost vytvořeného indexu se ukázala jako nejmenší 4,4 GB - o 100 megabajtů méně než Google Desktop Search.

Program podporuje kromě běžných souborů a složek také indexování emailů, připojování a indexování databází (!) a další externí zdroje(DMS, CRM), ihned během indexování můžete určit slovník pro provádění morfologického vyhledávání a indexovat všechny atributy souborů. Po vytvoření indexu, když se pokusíte provést první testovací vyhledávání dokumentů, můžete být poněkud zmateni: „Jsou zde dva typy vyhledávání, ale který z nich potřebuji?“ Jak již bylo zmíněno dříve, hlavní věcí je přečíst si certifikát, pak bude vše jasné. Program může ve skutečnosti provádět dva typy vyhledávání - vyhledávání frází a vyhledávání dokumentů obsahově podobných textu dotazu.

Popis všech hlavních funkcí pro analýzu vyhledávacího dotazu byl uveden výše, takže nyní uvedeme pouze možnosti vyhledávání, které tento program poskytuje. Začněme hledáním frází: samozřejmě morfologické hledání, hledání citací, logické operace, hledání s parsováním slova (hledání na začátku slova, na konci, ve střední části nebo úplná shoda), smíšené hledání citací ( kdy v dokumentu musí být přítomna všechna slova z dotazu, ale ne nutně v zadaném pořadí), vyhledávání s opravou chyb, používání synonym, „hledání téměř citací“ (hledání zadané fráze jako citace, ale mohou být i jiná slova být přítomen mezi zadanými slovy) atd. Některé z uvedených možností mají svá vlastní specifická nastavení. Navíc je možné použít slovník nedůležitých slov a program má již připravený seznam těchto slov, pro vyhledávání můžete použít i slovník prioritních slov (samozřejmě jej budete muset vyplnit vy sám).

Zde jsme v zásadě stručně zhodnotili všechny hlavní rysy vyhledávání frází.

Přejděme k úvahám o vlastnostech tohoto programu – vyhledávání podobných dokumentů. Vývojáři tvrdí, že se v žádném případě nejedná o jednoduché textové vyhledávání, jde přesně o „hledání podobných“ – přesně tak se to všude popisuje, ale ouha, můžete si to říkat, jak chcete – hlavním bodem je . Rychlé vyhledávání na internetu může rychle odhalit, že takzvané „podobné vyhledávání“ je novinkou v oblasti analýzy textu. Tento systém umožňuje vyhledávat texty, které jsou sémantickým obsahem podobné. Nejpříjemnější bylo, že po provedení testovacích vyhledávacích dotazů se ukázalo, že teorie se docela shoduje s praxí! Program skutečně vyhledá dokumenty s podobným obsahem a zobrazí je v seznamu a seřadí je podle procenta podobnosti.

Dále se podívejme, co SearchInform (zejména jeho firemní verze SearchInform Corporate) nabízí pro práci v podnikové síti. Existují dva typy aplikací: strana serveru a strana uživatele. Serverová část nezávisle zpracovává zadané indexy a uživatelé je mohou používat k vyhledávání v závislosti na přidělených přístupových právech. Uživatelé mohou být konfigurováni automaticky pomocí Účty Windows (odborně, SearchInform používá NTFS Windows ověřování), a ručně (uživatelé budou muset být přidáni samostatně). Každému uživateli lze povolit nebo zakázat přístup k určitým indexům a uživatele lze také spojovat do skupin. Obecně platí, že nastavení SearchInform pro práci v síti předčí Google z hlediska flexibility a Ishhound Server z hlediska pohodlí a jednoduchosti.

Oficiální stránka:
Velikost distribuce: 14,7 Mb Porovnání rychlostí indexování

Vyhledávací systémČas indexováníVelikost indexu
Bloodhound Prof Deluxe 4.538 hodin 46 minut19 GB
Isys Desktop 7.06 hodin 13 minut7,9 GB
DtSearch 7.06 hodin 3 minuty8,6 GB
Google Desktop Search Enterprise8 hodin 17 minut4,5 GB
Copernic Desktop Search *10 hodin 51 minut7 GB
SearchInform 1.5.023 hodiny 17 minut4,4 GB

* Většinu dokumentů.html a .txt obsahujících ruský text, přestože byly indexovány, nebylo možné najít jinak než podle jejich názvů.

Všechny programy stojí za pozornost.

Na základě testů a pečlivého zkoumání každého programu prezentovaného v recenzi lze vyvodit určité závěry. Google Desktop Search Copernic Desktop Search je tedy docela vhodný pro nezkušené uživatele jako domácí informační vyhledávací systém. Dobře si poradí s jednoduchými dotazy, nezatěžují uživatele nastavením a navíc jsou zcela zdarma. Pokus Googlu vstoupit na trh firemních vyhledávačů zatím není příliš oprávněný: pro plnohodnotnou práci program je potřeba aktualizovat přídavné moduly a jeho nastavení není zdaleka snadné. Samovysvětlující názvy Desktop Search, Copernic a Google si proto za sebou rezervují výklenek „desktopových“ vyhledávačů.

Pravda, výkonnější řešení – dtSearch, iSYS a SearchInform také nejsou spolehlivé a nabízejí uživatelům své „desktopové“ verze. Ale za rozumnou cenu, na rozdíl od svobodného softwaru od Google a Copernic. Za výkon, rychlost a funkčnost si samozřejmě musíte zaplatit. Hlavní pozornost vývojářů dtSearch, iSYS a SearchInform je ale samozřejmě zaměřena na firemní sektor. Síť, funkčnost, indexování a rychlost vyhledávání jsou to, co odlišuje tyto produkty od jejich „konkurentů“. Na základě výsledků testu byl identifikován favorit - SearchInform. Program poskytuje možnost vyhledávat podobné dokumenty, má nejvyšší rychlost indexování a vyhledávání a má dobrou sadu funkcí.