Programul motorului de căutare. Motoare de căutare rusești și motoare de căutare de top pe Internet


A spune că în vremea noastră de tehnologie a informației și de creșterea nesfârșită a volumului de date disponibile atât pentru un individ, cât și pentru societate, există multe probleme cu prelucrarea informațiilor și căutarea acesteia este deja o blasfemie. Cine nu ridică acest subiect? Și pentru a nu vă împovăra cu judecăți subiective și, parțial, obiective extrase din diverse surse de informare cu privire la problemă, voi trece direct la rezolvarea acesteia. Astăzi vom vorbi despre căutare. Adică despre programe și sisteme informatice serioase care caută documentele și datele de care avem nevoie.

Actualizați „căutarea directă”

Nu cu mult timp în urmă, când copacii erau mari și nu existau prea multe informații chiar și în rețeaua locală a întreprinderii, orice căutare era efectuată prin simpla căutare într-o mână de fișiere disponibile și verificarea succesivă a numelor și conținutului acestora. O astfel de căutare se numește directă, iar programele (utilitățile) care utilizează tehnologia de căutare directă sunt prezente în mod tradițional în toate sistemele de operare și pachetele de instrumente. Dar nici puterea computerelor moderne nu este suficientă pentru o căutare rapidă și adecvată în volume gigantice de date în timpul căutării directe. Căutarea în câteva sute de documente de pe un disc și căutarea într-o bibliotecă imensă și în câteva zeci de cutii poștale sunt două lucruri diferite. Prin urmare, programele de căutare directă astăzi trec în mod clar în fundal - când vine vorba de instrumente universale.

Desigur, acest tip de căutare nu a fost solicitat de mult timp în sectorul corporativ. Volumele nu sunt aceleași. Și, prin urmare, de mulți ani, și recent în mod clar, tehnologiile capabile să caute rapid și precis documente de diverse formate și din diverse surse sunt mai mult decât relevante. Nu cu mult timp în urmă, „părintele” Microsoft, Bill Gates, aparent invidios pe succesul fenomenal al motorului de căutare pe internet Google, a anunțat la una dintre conferințele de presă dorința industriei software (și nu numai) de a contribui în toate modurile posibile, dezvoltarea și aprofundarea creării de motoare și tehnologii de căutare. Dar este prea devreme pentru a crea vreun program care funcționează fenomenal de la Microsoft sau un server competitiv pe Internet (MSN încă nu ajunge la Google). Prin urmare, să ne întoarcem la evoluțiile existente. Index, interogare, relevanță

Tehnologiile moderne se bazează pe două procese fundamentale. În primul rând, indexează informațiile disponibile și procesează cererea cu rezultatul ulterioar. În ceea ce privește primul, orice program (fie el un motor de căutare desktop, un sistem de informații corporative sau un motor de căutare pe Internet) își creează propria zonă de căutare. Adică prelucrează documente și generează un index al acestor documente (o structură organizată care conține informații despre datele prelucrate). În viitor, indexul creat este folosit pentru lucru - obținând rapid o listă de documente necesare conform solicitării. Ceea ce urmează, deși deloc simplu din punct de vedere tehnologic, este destul de înțeles de utilizatorul obișnuit. Programul procesează cererea (folosind o expresie cheie) și afișează o listă de documente care conțin această expresie cheie. Întrucât informația este conținută într-un index structurat, procesarea interogărilor este mult mai rapidă (de zeci și sute de ori!) decât în ​​cazul căutării directe (selectarea documentelor se realizează nu prin enumerarea fișierelor, ci prin analiza informațiilor text în index).

Programul afișează documentele găsite în lista rezultată în funcție de relevanță - conformitatea documentului cu textul de interogare. În diferite tehnologii, desigur, există diferite metode pentru căutarea și determinarea relevanței unui document (numărul de „apariții” unui cuvânt și frecvența de menționare a acestuia în document, raportul dintre acești parametri și numărul total de cuvinte în document, distanța dintre cuvintele expresiei de interogare din fișierele căutate și așa mai departe). Pe baza acestor parametri, se determină „greutatea” documentului și, în funcție de aceasta, un anumit fișier apare în lista de rezultate la o anumită poziție. În cazul căutării pe Internet, situația este și mai complicată. Într-adevăr, în acest caz, trebuie luați în considerare mulți alți factori (page Rank-ul Google este un exemplu în acest sens). Dar acesta este un subiect pentru un articol separat, așa că nu vom atinge Internetul

Acest material examinează capacitățile mai multor programe de căutare populare care se laudă atât cu viteze decente, cât și cu funcționalitate bună. Dar să te arăți în broșuri este una, dar să stai sub privirea unui expert este cu totul altceva. Și nu mai existau experți, nici un birou plin de oameni cărora le plăcea să joace software-ul pentru uzabilitate. Pe computerul experimental a fost instalat un set de programe (Athlon 2,2 MHz, cu RAM 1 GB, 160 GB hard disk IDE Seagate 7200 rpm și Windows XP): dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform , Copernic Desktop Search, Desktop ISYS. Pentru teste, a fost compilată o bază de date text de documente în formate doc, txt și html cu o dimensiune totală nici mai mult, nici mai mică, ci de 20 gigaocteți. Un grup de camarazi sub conducerea umilului tău servitor a testat, comparat și împărtășit impresiile lor subiective despre fiecare software. Citiți mai jos un rezumat al constatărilor. dtSearch Desktop

Un program care, potrivit dezvoltatorilor, se pretinde a fi cel mai rapid, mai convenabil și cel mai bun motor de căutare. Ca, în general, toți ceilalți din această recenzie. Interfața dtSearch este destul de simplă, dar unele ferestre sau file sunt oarecum supraîncărcate cu elemente, ceea ce face să pară dificil de utilizat. Dar, în realitate, nu există dificultăți deosebite. Singurul punct cu adevărat neplăcut este lipsa de suport a software-ului pentru limba rusă (în ciuda faptului că programul poate căuta documente în mai multe limbi, interfața sa este exclusiv engleză).

Dar dtSearch este unul dintre puținele programe care pot indexa paginile web la o „adâncime” specificată de utilizator (deși, ținând cont de „cumpărarea suplimentară” a kit-ului de completare dtSearch Spider). Acest lucru este în plus față de suportul fișierelor de disc de diferite formate de text și e-mailuri din cutia poștală Outlook. În același timp, programul nu poate funcționa cu baze de date, care sunt o bucată atât de gustoasă pentru motoarele de căutare din cauza volumelor mari de informații conținute în ele și a distribuției lor largi în companii și, prin urmare, în rețelele corporative. Viteza de indexare a documentelor dtSearch s-a dovedit a fi la nivelul potrivit. Privind în viitor, voi spune că acest program a făcut față indexării unei cantități date de informații la un nivel cu un alt concurent - iSYS - și a împărtășit cu acesta locul doi în lista celor mai rapide sisteme. dtSearch a indexat un test de 20 gigaocteți de informații în 6 ore și 13 minute, creând un index de 7,9 GB pentru nevoile ulterioare de căutare.

În ceea ce privește capacitățile de căutare, aici sunt la nivelul potrivit. În primul rând, dtSearch are o căutare morfologică (căutarea unui cuvânt în toate formele sale morfologice). Folosind această oportunitate, te eliberezi de, să zicem, gânduri precum „în ce caz a fost folosit un anumit cuvânt în documentul de care aveam nevoie?” Utilizarea căutării morfologice este aproape întotdeauna justificată, așa că ar trebui să fie prezentă în orice motor de căutare profesional.

Căutarea după sunet este o caracteristică non-standard chiar și pentru motoarele de căutare profesionale. Esența sa este că programul va căuta cuvinte care sună la fel cu cuvântul introdus. Și cea mai bună parte este că această funcție funcționează și pentru limba rusă! De exemplu, când tastați cuvântul „ureche” într-o interogare de căutare, veți vedea nu numai cuvintele „ureche”, ci și „ureche” ca rezultat.

Căutarea cu corectarea erorilor este o funcție foarte importantă. Este folosit pentru a căuta cuvinte care conțin erori sintactice - acestea pot fi fie greșeli de scriere, fie erori în documente obținute folosind sisteme de recunoaștere a caracterelor, de exemplu. Un exemplu simplu - căutați cuvântul tastatură. Unele documente conțin cuvântul „tastatură”, este evident că, de fapt, acesta este cuvântul „tastatură”, persoana tocmai a făcut o greșeală de tipar când a tastat. Deci, o căutare de corectare a erorilor va detecta și include un document cu cuvântul „tastatură” în rezultat. Există, de asemenea, o setare în dtSearch care vă permite să determinați gradul de posibile caractere eronate.

Căutați folosind sinonime. Această caracteristică folosește o listă de sinonime pentru diferite cuvinte. Deci, de exemplu, introducând cuvântul „rapid”, programul va găsi și cuvintele „de mare viteză” și altele care sunt sinonime pentru cuvântul „rapid”, dacă, desigur, sunt prezente în lista de sinonime. . O listă gata făcută de sinonime nu este furnizată cu programul dtSearch, cu toate acestea, este posibil să utilizați liste pe Internet (în consecință, este necesară o conexiune, ceea ce nu este întotdeauna convenabil) sau vă puteți crea propria listă de sinonime .

În plus față de capabilitățile enumerate, dtSearch poate căuta folosind expresii formate din cuvinte conectate prin operații logice. Fiecărui cuvânt dintr-o interogare i se poate atribui propria „greutate”, adică semnificația. O opțiune utilă este să folosești un dicționar format din cuvinte neimportante pentru a nu ține cont de ele la căutare, dar și acest dicționar este gol și va trebui să-l completezi singur.

În continuare, să ne uităm la capacitățile programului atunci când lucrați în rețea. De fapt, dtSearch nu oferă capabilități specifice pentru lucrul cu rețeaua. Cu toate acestea, este foarte posibil să îl utilizați online. Alternativ, puteți crea un fel de index și îl puteți pune într-un folder public (partajat). Programul în sine poate fi instalat pe computerul fiecărui utilizator sau poate fi, de asemenea, plasat într-un folder deschis pentru acces public, iar comenzile rapide pot fi create într-un mod special pentru fiecare utilizator separat, folosind parametrii de linie de comandă, al căror scop este descris în fișierul de ajutor furnizat împreună cu programul. De asemenea, este posibil să instalați automat programul în rețea folosind un fișier MSI. Aceasta va lua în considerare setările pentru fiecare utilizator conectat.

În general, este un program bun din categoria motoarelor de căutare profesionale. Se poate califica pentru o evaluare bună, dar câștigarea încrederii și a respectului din partea utilizatorilor poate să nu fie ușor pentru dtSearch din cauza anumitor factori (nu totul este bine cu interfața, utilizatorii ruși sunt defavorizați, nu există caracteristici strălucitoare pentru lucrul cu rețeaua) . În ceea ce privește căutarea directă a documentelor, programul nu a avut probleme cu textul rusesc. Deoarece nu existau nici unul cu morfologia declarată, sau cu o căutare neclară. Sistemul a găsit în mod destul de adecvat documentele necesare atât printr-o simplă interogare de un cuvânt, cât și folosind câteva paragrafe sau un document ca frază cheie.

Site-ul oficial:
Dimensiunea distribuției: 23 Mb Bloodhound Prof Deluxe

Pe baza numelui, puteți ghici că există suport pentru limba rusă în acest program. Acest lucru este deja frumos. În ceea ce privește interfața, în general, este oarecum neobișnuită, dar în aparență este foarte atractivă. Un alt lucru este comoditatea. Un criteriu foarte controversat, dar totuși, probabil, o soluție cu mai multe ferestre nu este cea mai de succes opțiune (solicitarea este introdusă într-o fereastră, rezultatul este afișat în alta și altele asemenea).

Snoop folosește aceiași indexuri pentru a efectua o căutare rapidă, dar indexarea este mult mai lentă decât alte programe. Acest lucru este foarte ciudat, mai ales având în vedere că capabilitățile sale de procesare a interogărilor de căutare sunt foarte slabe și, prin urmare, structura indexului nu este complexă. Cel mai probabil, acest lucru se datorează unor algoritmi neoptimizați. Acest program sa dovedit a fi un outsider clar în ceea ce privește viteza de indexare și căutare: timpul petrecut pentru crearea unui index este de șase ori mai mare decât cel al dtSearch și iSYS. Indexarea a 20 de gigaocteți de texte pentru câine a dus la 38 de ore și 46 de minute de lucru. Și „zona de căutare” creată a ocupat aceeași dimensiune pe hard disk ca și datele originale, cu un mic minus - 19 gigaocteți.

Bloodhound poate fi prezentat ca o alternativă la căutarea standard în Windows, este puțin probabil să fie capabil de mai mult. Faptul că sarcina principală a lui Snooper este cea mai simplă căutare a fișierelor este indicat nu numai de numărul mic de funcții de analiză a textului interogărilor de căutare și de o căutare avansată după atributele fișierului, ci chiar și de o fereastră de rezultate care oferă legături directe către fișierele găsite, precum și către folderele care conțin aceste fișiere. Fereastra de rezultate nu este foarte informativă în sensul că puteți citi întregul fișier găsit doar rulându-l, adică nu are un vizualizator de fișiere încorporat. Dar este afișat un fragment din fișierul în care a fost găsit cuvântul căutat, această schemă de afișare amintește foarte mult de motoarele de căutare de pe Internet;

Vorbind despre capabilitățile specifice de procesare a interogărilor de căutare, este de remarcat faptul că nu există un „text de căutare” maxim care poate fi căutat este o frază, chiar dacă nu există un câmp de introducere a textului cu mai multe linii. Cu toate acestea, puteți analiza fraza introdusă, iar Snoop ne oferă aici un set de căutare standard: operații logice, căutare cu mască și căutare citate... nu foarte mult. Programul conține câteva rudimente de căutare morfologică, dar probabil că este atât de grosier încât cel mai probabil interferează cu funcționarea corectă (în timpul testelor, au fost observate multe erori cu utilizarea incorectă a morfologiei).

Dar programul vă permite să specificați atributele fișierului atunci când căutați (data documentului, numele fișierului, numele folderului), iar în aceste interogări puteți utiliza și același set de căutare. De asemenea, puteți căuta litere specificând parametrii (De la, Subiect... etc.).

Deci, ne-am dat seama de căutarea în sine, ce mai este interesant despre program, pentru care a primit atât de multe premii, conform informațiilor de pe site-ul oficial? Este greu de spus ce este atât de special la ea, cel mai probabil, interfața Bloodhound este atractivă (exact ca aspect, ca să nu mai vorbim de utilizare).

Operațiunile cu indici sunt foarte standard; În plus, indexurile pot fi utilizate și online. De acum încolo avem nevoie de mai multe detalii.

În ciuda caracterului primitiv al interogărilor de căutare, programul poate fi folosit pentru a căuta fișiere, astfel încât utilizarea sa poate fi justificată în rețele. Deși aceasta este o întindere, deoarece într-o rețea mare, prioritatea este căutarea rapidă a datelor folosind interogări de căutare complexe din cauza cantității uriașe de informații - și există în mod clar probleme cu viteza de căutare și program. Trebuie să spun că munca cu rețeaua de la Izhishika este gândită așa cum ar trebui. O aplicație separată este concepută special pentru aceasta - Bloodhound Server. Funcționează la fel ca și simplu Snooper (au un singur motor de căutare), doar pentru documentele aflate pe un server central sau pe resurse partajate în rețeaua corporativă. Snooper Server creează noi indecși pe resursele partajate sau le folosește pe cele create anterior. Orice utilizator al rețelei corporative se poate conecta la Serverul de căutare și îl poate folosi pentru a accesa orice document (situat în indexul curent) folosind un browser de Internet. De acord, această schemă este extrem de convenabilă: se dovedește că fișierele din propria rețea pot fi căutate în același mod ca și informațiile de pe Internet, de exemplu, prin Google.

Evaluând toate avantajele și dezavantajele acestui program, concluzia sugerează că capabilitățile sale nu sunt, cel mai probabil, suficiente pentru rețelele corporative (în ciuda organizării bune a lucrului cu rețeaua), dar pentru un computer de acasă sau chiar pentru o rețea de acasă este , în principiu, poate apărea. Deși nici viteza de lucru și nici capacitățile de căutare nu inspiră optimism...

Site oficial în limba rusă:
Dimensiunea distribuției: 6 MbGoogle Desktop Search + GDS Enterprise

Desigur, nu am putea ignora un dezvoltator atât de faimos. Numele Google spune deja multe. Oamenii care folosesc cel mai puternic motor de căutare de pe Internet de ani de zile vor decide, fără nicio îndoială, să instaleze acest motor de căutare special pe computerul lor. Gândește-te: Google pe computerul tău de acasă! Cu toate acestea, fără a ceda provocărilor cu un brand promovat pe scară largă, să încercăm sobru, și cel mai important obiectiv, să luăm în considerare capacitățile motorului de căutare „desktop” de la Google.

Primul lucru care vă atrage atenția este lipsa propriei sale cochilii pentru program. Google Desktop Search este încă situat în fereastra browserului, respectiv, întreaga interfață a versiunii desktop a fost moștenită de la software-ul de la fratele său mai mare de Internet. Dacă acest lucru este bun sau rău, este un aspect discutabil: unora le place minimalismul în designul acestui motor de căutare, în timp ce alții doresc să vadă o aplicație cu drepturi depline, plină cu tot felul de butoane și așa mai departe.

Ce vă atrage atenția imediat după design? Și faptul că același Google Desktop Search începe să indexeze totul pe computer, fără nicio cerere! Și cel mai interesant este că este imposibil să selectați căile de indexare folosind Google Desktop Search. Va trebui să descărcați un program separat (TweakGDS), care vă va permite să extindeți oarecum setările Google Desktop, inclusiv specificarea locurilor necesare pentru indexare. Deși, până când vă dați seama de toate acestea, acesta va indexa deja un hard disk standard, astfel încât această setare este mai probabil să fie necesară atunci când lucrați cu cantități mari de date, ceea ce este foarte important atunci când este utilizat în rețelele corporative (versiunile Enterprise) . Cu toate acestea, nu este un fapt că, după descărcarea TweakGDS, problemele tale vor fi rezolvate. La urma urmei, necesită Microsoft .NET Framework și Microsoft Scripting Runtime pentru a funcționa. Da... instalarea, precum și accesul la setări, ar fi putut fi simplificate, deși dezvoltatorii pot înțelege probabil: de ce să scrieți ceva nou când există un motor de căutare gata făcut, l-au portat pe computerul local și l-au lăsat utilizatorul „se bucură” și un nume celebru va face o altă capodoperă din „asta”. Haide, să încheiem această digresiune lirică și să trecem la căutare.

În ceea ce privește analiza interogărilor de căutare și livrarea rezultatelor, aici totul este absolut identic cu Google pe Internet: același sistem de afișare a rezultatelor, același set standard de operații logice pentru interogările de căutare. În general, Google Desktop Search, ca și programul anterior, este destinat exclusiv căutării fișierelor - desigur, nu are un vizualizator intern pentru aceste fișiere. Numărul de formate de fișiere acceptate de Google Desktop Search este destul de suficient și, de asemenea, este plăcut că caută paginile de Internet vizitate, preluând date din cache. Vitezele de căutare și indexare sunt destul de acceptabile. Adevărat, pentru uz casnic. Google Desktop Search a făcut față cu o cantitate impresionantă de 20 de gigaocteți de texte în 8 ore și 17 minute. Petrecerea mai multor zile procesând informații din rețeaua corporativă a unei întreprinderi mari nu este ceva ce orice administrator de sistem ar dori să facă. În plus: dimensiunea indexului creat a fost la același nivel (4,5 GB) cu un alt motor de căutare testat în această recenzie - SearchInform.

Marele avantaj (sau dezavantaj - tu hotărăști) al Google Desktop Search este că acceptă pluginuri, care se pot schimba mult în bine. Un alt lucru este că conectarea pluginurilor și configurarea lor complică atât de mult sarcina de a instala un motor de căutare, încât începi să te întrebi dacă toate acestea sunt necesare atunci când poți instala un program normal, cu drepturi depline, în care totul va fi deja prezent. La urma urmei, pentru a utiliza fiecare caracteristică, va trebui să instalați un nou plugin. Chiar și pentru ca programul să funcționeze pe deplin cu arhive, este nevoie de un gadget separat. Este fascinant și seducător faptul că toate aceste module suplimentare sunt gratuite. Cu toate acestea, dacă nu țineți cont de versiunea desktop a motorului de căutare, atunci configurarea competentă a GDS Enterprise s-ar putea să nu fie în puterea dvs. - la urma urmei, nu degeaba specialiștii de la Google își oferă serviciile pentru configurarea propriilor lor. software pentru rețeaua dvs. pentru doar 10.000 USD.

Dacă parcurgeți procedura de configurare și instalare (sau plătiți 10.000 USD unei echipe de răspuns rapid de la Google), veți înțelege că complexitatea instalării este mai mult decât compensată de setările foarte flexibile atunci când sunt utilizate în rețelele corporative. Un aspect important al utilizării Google Desktop într-o rețea corporativă este utilizarea politicilor de grup, ceea ce face posibilă setarea setărilor pentru fiecare utilizator.

Pentru a rezuma, cea mai rezonabilă utilizare a acestui program este un computer de acasă sau de la serviciu. La urma urmei, pentru un computer obișnuit, este suficient doar să instalezi programul - se va ocupa de restul singur (nici măcar nu te va întreba nimic).

Cu toate acestea, Google Desktop Search Enterprise va fi acceptabilă în cazurile în care există o nevoie urgentă de configurare flexibilă a politicii de rețea pentru a utiliza motorul de căutare, în timp ce capacitatea de a procesa interogări de căutare va fi pe locul al doilea ca importanță și timp (sau bani). ) cheltuiți pentru configurarea programului vor fi pe primul loc.

Site-ul oficial:
Dimensiunea distribuției, inclusiv TweakGDS: 1,2 MbCopernic Desktop Search

Click pe poza pentru marire

Interfața programului evocă emoții extrem de pozitive - totul este făcut în conformitate cu standardele general acceptate, nimic de prisos, într-un cuvânt, un design plăcut. Pentru un începător, înțelegerea interfeței Copernic Desktop Search va fi foarte ușoară. Deși, este oarecum confuz faptul că designerii au creat clar interfața programului ținând cont de faptul că programul va funcționa în tema standard Windows XP. Când utilizați tema clasică, programul nu arată atât de frumos. Dar aceasta este mai mult o chestiune de gust.

La prima lansare, programul vă solicită să creați indecși pentru căutare. Mi s-a părut oarecum neobișnuit ca, după selectarea folderelor pentru indexare, programul să nu ofere apăsarea niciunui buton, cum ar fi „Începe indexarea”, iar indexarea nu începe automat, doar atunci s-a observat că Copernic încerca să înceapă indexarea în timp ce computerul era inactiv. Va trebui să aprofundați puțin în opțiunile programului pentru a configura totul corect. Trebuie remarcat faptul că există posibilități destul de largi pentru configurarea creării automate a indexului: un planificator încorporat, capacitatea de a indexa în timp ce computerul este inactiv, în fundal, cu prioritate scăzută. Indexarea nu a fost prea rapidă - 10 ore și 51 de minute - aceasta este mai lent decât în ​​alte motoare de căutare (cu excepția Isle of Bloodhound, dar Copernic este încă cu un ordin de mărime mai rapid decât dezvoltarea tehnologiilor iSleuthHound.

Acum despre structura indexului. În general, nu are nimic special în asta. Este posibil să selectați tipuri de fișiere, atât în ​​formă generală, cât și detaliată. Adică, inițial poți alege ceea ce vrei să indexezi - Documente, Imagini, Videoclipuri, Muzică. În cealaltă filă a ferestrei de opțiuni, veți putea selecta anumite tipuri de fișiere după extensie. În plus, puteți configura indexul astfel încât, de exemplu, imaginile mai mici de 16x16 în dimensiune să nu fie indexate sau fișierele de sunet cu o lungime mai mică de 10 secunde să nu fie indexate. Pe lângă indexarea fișierelor din foldere, Copernic poate lucra cu e-mailuri și contacte din agenda Microsoft Outlook și Microsoft Outlook Express și este posibilă indexarea Favoritelor și Istoricul din Internet Explorer.

În ceea ce privește capacitățile de căutare, acestea sunt foarte slabe aici. În timpul testelor, s-a dezvăluit chiar că programul nu caută documente în formatele txt și html în limba rusă, permițându-vă să le găsiți numai după titluri și nu după conținut. Singurul lucru pe care îl oferă programul pentru a îmbunătăți eficiența căutării este utilizarea unui set standard de operații logice și, chiar și atunci, această caracteristică a fost descoperită experimental, deoarece nu a fost documentată. Apropo, nici ajutorul programului nu este în regulă - este disponibil numai prin Internet, ceea ce, vedeți, este foarte incomod și nu există prea multe informații de ajutor pe Internet. Aparent, dezvoltatorii au decis că interfața simplă a programului nu implică prezența unui ajutor normal. Continuând conversația despre capabilitățile de căutare, trebuie remarcat faptul că, în ciuda analizei slabe a interogărilor, programul oferă un sistem de căutare interesant - utilizatorul poate selecta tipul de fișiere (imagini, videoclipuri, muzică etc.), introduce o căutare interogați și selectați atribute specifice tipului de fișier selectat. De exemplu, pentru fișierele de sunet, acestea pot fi valori din etichetele mp3 (artist, album, dată etc.), pentru imagini, de exemplu, puteți selecta dimensiunea acestora (după rezoluție), în general, fiecare tip are propriile setări. După căutarea unui anumit tip de fișier, programul va afișa o listă foarte informativă în fereastra de rezultate, iar dacă solicitarea dvs. include fișiere de alte tipuri, le puteți deschide făcând clic pe un anumit link.

Separat, merită menționat fereastra de afișare a rezultatelor. Sub lista fișierelor găsite, este afișat conținutul acestor fișiere (o schemă similară este adesea folosită în clienții de e-mail). Adevărat, vizualizarea textului se poate face numai în format nativ și nu există un mod de afișare a textului simplu, care nu este întotdeauna convenabil, deoarece deschiderea unui document în acest caz durează mai mult. Dar, având în vedere că Copernic poate căuta imagini și muzică, este posibil să vizualizați aceste fișiere multimedia.

Sunt descrise principiile de bază de funcționare ale acestui program, acum să vedem ce ne poate oferi Copernic Desktop Search pentru lucrul cu rețeaua... În principiu, puteți viziona foarte mult timp, dar cu greu veți putea vedea nimic . Cu alte cuvinte, acest program nu a fost destinat să fie bazat pe rețea. Copernic Desktop Search este un motor de căutare exclusiv pentru acasă.

Evident, singura (cea mai logică) aplicație a acestui program este un computer de acasă. Aici va face față pe deplin tuturor interogărilor simple de căutare ale utilizatorilor, constând din unul sau două cuvinte, va găsi informațiile necesare, precum și împărțirea căutării în funcție de tipul de fișier și suport pentru fișiere multimedia, împreună cu indexarea de fundal în modul cu prioritate scăzută, cuplată cu un mod plăcut. interfață, oferă programului puterea de a câștiga încredere în rândul utilizatorilor fără experiență.

Site-ul oficial
Dimensiunea distribuției: 2,6 MbISYS Desktop

Click pe poza pentru marire

Un program foarte puternic. În ceea ce privește nivelul său de echipare cu tot felul de funcții, este undeva aproape de următorul sistem de căutare SearchInform de pe listă. Mai mult, dimensiunea fișierului de instalare este mai mare de 40Mb! Este greu de spus ce ar putea fi strâns în astfel de dimensiuni, deoarece același SearchInform, cu funcționalitate similară, ocupă 15Mb.

Nici aici procesul de instalare nu este foarte plăcut, sau mai degrabă nici măcar procesul de instalare. Chiar înainte de a descărca programul, vi se va cere să vă înregistrați, altfel nu există nicio cale. Apoi, interfața. Este făcut foarte frumos, nimic inutil nu atrage atenția, totuși, acestea sunt impresiile unei persoane care este deja oarecum obișnuită cu asta. Nu va fi ușor pentru un începător să-și dea seama unde și ce se află, unde să facă clic și unde să caute în cele din urmă. Este foarte recomandat să citiți ajutorul înainte de a începe lucrul - veți economisi o mulțime de nervi și timp. La orice altceva se adaugă lipsa totală de suport pentru limba rusă în program. Nu e bun. În plus, ferestrele de aici nu sunt supraîncărcate cu comenzi, dar a trebuit să plătim pentru asta cu mai multe module și cu utilizarea de ferestre suplimentare. De exemplu, interogările de căutare sunt introduse prin lansarea unui program, iar gestionarea indexului se realizează folosind un alt program. Interogările de căutare sunt introduse aici și în ferestre pop-up separate. Este greu de spus care este mai bun - o interfață supraîncărcată sau o fereastră multiplă omniprezentă, mai degrabă, este o chestiune de gust.

Când vine vorba de crearea de indexuri, programul oferă caracteristici pentru a simplifica procesul de setare a opțiunilor pentru un nou index. Aceste caracteristici includ mai multe șabloane gata făcute pentru crearea de indexuri pentru folderul „Documentele mele”, „Poștă”, „Poștă și documente”, „Folder specific”, „Dosar cu o selecție de tipuri de fișiere”, etc. Astfel de șabloane simplifică crearea de indici pe prima etapă. Utilitatea pentru lucrul cu indici nu are o interfață foarte bună, ceea ce este intimidant cu o oarecare complexitate (aceasta este o evaluare foarte subiectivă, să fiu sincer), totuși, dacă te uiți la ea, oferă multe opțiuni utile și, în general , utilizarea sa nu cauzează prea multe dificultăți. ISYS Desktop poate indexa date din diverse surse de date și oferă, de asemenea, multe setări flexibile pentru o astfel de indexare. Caracteristicile suplimentare de indexare includ: suport pentru SQL, FTP, TRIM Context, WORLDOX 2002, scripturi. La crearea unui index, dacă ați selectat elementul „Folder cu selecție de tipuri de fișiere”, aveți posibilitatea de a selecta tipuri de fișiere pentru indexare manual (prin extensie). Trebuie spus că pur și simplu există un număr mare de tipuri de fișiere acceptate, dar nu veți putea adăuga propriul tip (extensie) la lista existentă. De asemenea, puteți observa prezența unui planificator de indexare. Crearea unui index și procesarea a 20 de gigaocteți de informații au luat ISYS Desktop 6 ore și 13 minute, arătând în cele din urmă un timp bun și dimensiunea fișierului creat - 7,9 GB.

Capacitățile de căutare ale acestui program sunt destul de bune. Ceea ce este folosit în ISYS este mult mai puternic decât suportul convențional pentru operațiuni logice. Printre capabilitățile avansate de căutare, programul oferă utilizarea de sinonime și un filtru de sortare (după cale, nume și data creării fișierului). Setul de operatori logici este ceva mai larg decât setul standard. Pe lângă operațiile logice, programul vă permite să lucrați cu mulți alți operatori, care, în principiu, pot înlocui unele tipuri de căutare, de exemplu, căutarea cu analiza poate fi înlocuită complet prin utilizarea operatorilor speciali; Am fost foarte surprins că programul nu are o căutare folosind morfologie. Aceasta este o omisiune gravă, deoarece eficiența căutării este mult îmbunătățită atunci când se utilizează analiza morfologică. În plus, nu există o listă de cuvinte semnificative, dar există o listă extinsă de cuvinte nesemnificative. De asemenea, sunt anunțate funcții de căutare precum „căutare aproximativă” și „analiza euristică”.

ISYS oferă o alegere între mai multe tipuri de interogări de căutare, și anume cele vizuale. Acest lucru se face folosind diferite tipuri de ferestre pentru introducerea interogărilor de căutare, cu toate acestea, de fapt, nici o singură fereastră nu permite utilizarea altor tehnologii decât cele enumerate mai sus.

Rezultatele căutării sunt foarte informative și sunt afișate ca o listă de documente sortate după relevanță. O previzualizare a documentului selectat este afișată mai jos. Spre deosebire de Copernic Desktop Search, previzualizarea aici este disponibilă doar sub formă de text simplu, nu a fost posibilă afișarea documentelor în formatul lor nativ, fie că este vorba de Word, Html sau PDF, deși acest lucru, în principiu, nu este prea critic; Programul vă permite să împărțiți documentele găsite în grupuri în funcție de anumite criterii (în mod implicit, acestea sunt împărțite în funcție de relevanță). De asemenea, puteți vizualiza documente deja găsite selectând foldere individuale (acest lucru este convenabil când rezultatul produce un număr foarte mare de documente).

Utilizarea programului într-o rețea corporativă este, de asemenea, foarte justificată, deoarece oferă oportunități bune de organizare a căutării în rețea. Sistemul de căutare se bazează pe crearea unui index public care conține date indexate din resurse online disponibile public.

De fapt, programul de la ISYS este demn de atenție, cel puțin familiarizarea cu el. Acest program este un proiect matur cu un număr mare de funcții (nu întotdeauna și nu toată lumea, desigur, are nevoie de ele, dar totuși). Șansele ca programul să înregistreze unele îmbunătățiri în ceea ce privește procesarea interogărilor de căutare sunt necunoscute, dar în acest moment poate fi recomandat pentru utilizare aproape universală. Și având în vedere că este încă prea greu pentru sistemele de acasă, principalele locuri pentru instalarea lui sunt rețelele corporative.

Site-ul oficial:
Dimensiunea distribuției: 40 MbSearchInform

Click pe poza pentru marire

Probabil că nu merită să începeți imediat cu o descriere a interfeței SearchInform. Ar trebui mai întâi să descriem procesul de instalare, sau mai degrabă unul dintre detaliile acestuia: nu puteți instala programul fără o conexiune la Internet. Faptul este că înainte de prima lansare, programul necesită înregistrarea utilizatorului (gratuit) și trimite toate datele introduse către server. Aparent, dezvoltatorii au trebuit să ia astfel de măsuri în lupta împotriva pirateriei, dar acest lucru nu a avut un efect pozitiv asupra ușurinței instalării.

Interfața programului este proiectată în conformitate cu toate regulile general acceptate, cu toate acestea, la prima vedere, este oarecum greoaie. Folosind programul pentru prima dată, pare că este prea complicat, uneori nu este ușor să ne amintim în ce meniu sau pe ce filă se află opțiunea dorită, totuși, cu o utilizare mai îndelungată, interfața nu mai pare atât de teribil de complicată . Principalul lucru este să citiți mai întâi certificatul.

După ce ați înțeles puțin interfața, puteți începe să creați un index. Procesul în sine este foarte simplu, iar viteza de indexare, chiar și oculară, este semnificativ mai mare decât toate celelalte motoare de căutare din recenzie. Numerele de test clare arată că SearchInform este de două ori mai rapid decât dtSearch și iSYS în ceea ce privește viteza de indexare! Programul a indexat datele furnizate în valoare de 20 gigaocteți într-un timp record de 3 ore și 17 minute. Și dimensiunea indexului creat s-a dovedit a fi cea mai mică de 4,4 GB - cu 100 de megaocteți mai puțin decât Google Desktop Search.

Programul suportă, pe lângă fișierele și folderele obișnuite, și indexarea e-mail-urilor, conectarea și indexarea bazelor de date (!) și a altor surse externe (DMS, CRM), imediat în timpul indexării puteți specifica un dicționar pentru efectuarea unei căutări morfologice, precum și toate atributele pot fi fișiere indexate. După crearea indexului, atunci când încercați să efectuați prima căutare de testare a documentelor, puteți deveni oarecum confuz: „există două tipuri de căutare aici, dar de care am nevoie?” După cum am menționat mai devreme, principalul lucru este să citiți certificatul, apoi totul va deveni clar. Programul poate efectua de fapt două tipuri de căutări - căutarea expresiei și căutarea documentelor similare ca conținut cu textul interogării.

O descriere a tuturor funcțiilor principale pentru analizarea unei interogări de căutare a fost dată mai sus, așa că acum vom enumera doar capacitățile de căutare oferite de acest program. Să începem cu căutarea expresiilor: bineînțeles, căutarea morfologică, căutarea citatelor, operații logice, căutarea cu analiza cuvintelor (căutare la începutul cuvântului, la sfârșit, în partea din mijloc, sau o potrivire completă), căutare mixtă de citate ( când toate cuvintele din interogare trebuie să fie prezente în document, dar nu neapărat în ordinea introdusă), căutarea cu corectarea erorilor, utilizarea sinonimelor, „căutare aproape de citare” (căutați fraza introdusă ca citare, dar alte cuvinte pot să fie prezent între cuvintele introduse), etc. Unele dintre opțiunile enumerate au propriile setări specifice. În plus, este posibil să folosiți un dicționar de cuvinte neimportante, iar programul are deja o listă gata făcută a acestor cuvinte, puteți utiliza și un dicționar de cuvinte prioritare pentru căutare (desigur, va trebui să o completați; tu).

Aici, în principiu, am trecut în revistă pe scurt toate caracteristicile principale ale căutării de expresii.

Să trecem la luarea în considerare a caracteristicilor acestui program - căutarea de documente similare. Dezvoltatorii susțin că aceasta nu este în niciun caz o simplă căutare text, este tocmai o „căutare a celor similare” - exact așa este descris peste tot, dar ei bine, o puteți numi cum doriți - principalul aspect este . O căutare rapidă pe Internet poate dezvălui rapid că așa-numita „căutare similară” este o nouă dezvoltare în domeniul analizei textului. Acest sistem vă permite să găsiți texte care sunt similare în conținut semantic. Cel mai plăcut lucru a fost că, după efectuarea interogărilor de căutare de test, s-a dovedit că teoria coincide destul de bine cu practica! Programul caută de fapt documente cu conținut similar și le afișează într-o listă, sortându-le după procent de similitudine.

În continuare, să ne uităm la ce oferă SearchInform (în special, versiunea sa corporativă SearchInform Corporate) pentru a lucra într-o rețea corporativă. Există două tipuri de aplicații: partea server și partea utilizator. Partea de server procesează independent indecșii specificați, iar utilizatorii îi pot folosi pentru căutare, în funcție de drepturile de acces care le sunt atribuite. Utilizatorii pot fi configurați automat folosind conturi Windows (în termeni profesionali, SearchInform folosește autentificarea NTFS Windows) sau manual (utilizatorii vor trebui adăugați separat). Fiecărui utilizator i se poate permite sau refuza accesul la anumiți indecși, iar utilizatorii pot fi, de asemenea, combinați în grupuri. În general, setările SearchInform pentru lucrul în rețea sunt înaintea Google în ceea ce privește flexibilitatea și Ishhound Server în ceea ce privește comoditatea și simplitatea.

Site-ul oficial:
Dimensiunea distribuției: 14,7 Mb Comparația vitezelor de indexare

Sistem de căutareTimp de indexareDimensiunea indexului
Bloodhound Prof Deluxe 4.538 ore 46 minute19 GB
Isys Desktop 7.06 ore 13 minute7,9 GB
DtSearch 7.06 ore 3 minute8,6 GB
Google Desktop Search Enterprise8 ore 17 minute4,5 GB
Copernic Desktop Search *10 ore 51 minute7 GB
SearchInform 1.5.023 ore 17 minute4,4 GB

* Majoritatea documentelor.html și .txt care conțin text rusesc, deși au fost indexate, au fost imposibil de găsit decât după numele lor

Toate programele sunt demne de atenție.

Pe baza testelor și a unei examinări atente a fiecărui program prezentat în recenzie, se pot trage anumite concluzii. Deci, Google Desktop Search Copernic Desktop Search este destul de potrivit pentru utilizatorul neexperimentat ca sistem de căutare a informațiilor de acasă. Aceștia fac față bine interogărilor simple, nu supraîncărcă utilizatorul cu setări și, în plus, sunt complet gratuit. Încercarea Google de a intra pe piața motoarelor de căutare corporative nu este încă foarte justificată: pentru ca acesta să funcționeze corect, programul trebuie să fie echipat cu module suplimentare și este departe de a fi ușor de configurat. Prin urmare, denumirile care se explică de la sine Desktop Search, Copernic și Google își rezervă în spatele lor nișa motoarelor de căutare „desktop”.

Soluții adevărate, mai puternice - dtSearch, iSYS și SearchInform, de asemenea, nu sunt sigure și oferă utilizatorilor versiunile lor „desktop”. Dar la un preț rezonabil, spre deosebire de software-ul gratuit de la Google și Copernic. Desigur, trebuie să plătiți pentru putere, viteză și funcționalitate. Dar accentul principal al dezvoltatorilor dtSearch, iSYS și SearchInform este, desigur, pe sectorul corporativ. Rețeaua, funcționalitatea, indexarea și viteza de căutare sunt cele care disting aceste produse de „concurenții” lor. Pe baza rezultatelor testului, favoritul a fost identificat - SearchInform. Programul oferă posibilitatea de a căuta documente similare, are cele mai rapide viteze de indexare și căutare și are un set bun de funcții.

În fiecare zi crește volumul de informații din rețea și, prin urmare, de pe computerele utilizatorilor. Pe hard disk-urile unui utilizator obișnuit, numărul de fișiere poate ajunge la câteva sute, iar găsirea celui de care aveți nevoie în masa totală nu este deloc ușoară. Motorul de căutare standard Windows nu funcționează întotdeauna rapid și are o funcționalitate foarte limitată, așa că este logic să folosiți programe terțe.

În această recenzie, vom analiza mai multe programe care vă vor ajuta să găsiți datele necesare pe computer.

Acest program este probabil cel mai puternic instrument pentru căutarea discurilor de PC. Are multe setări fine, filtre și funcții. Distribuția include și utilități suplimentare pentru interacțiunea cu sistemul de fișiere.

Una dintre caracteristicile distinctive ale Căutare fișiere mele este capacitatea de a șterge complet fișierele prin suprascriere cu zerouri sau date aleatorii.

Căutați în fișierele mele

Search My Files este adesea confundat cu software-ul anterior datorită numelui similar. Acest program diferă prin faptul că este mai ușor de utilizat, dar, în același timp, îi lipsesc unele funcții, de exemplu, căutarea pe unitățile de rețea.

Tot

Un program simplu de căutare cu propriile sale caracteristici. Totul poate căuta date nu numai pe computerul local, ci și pe serverele ETP și FTP. Se evidențiază de alți reprezentanți ai software-ului similar prin faptul că vă permite să urmăriți modificările în sistemul de fișiere al computerului.

Căutare eficientă de fișiere

Un alt software foarte ușor de configurat și de utilizat. Cu o dimensiune foarte mică, are un număr suficient de funcții, este capabil să exporte rezultatele în fișiere text și tabel și poate fi instalat pe o unitate flash.

UltraSearch

UltraSearch poate găsi nu numai fișiere și foldere, ci și să caute informații în conținutul documentelor după expresia cheie sau cuvânt. Principala caracteristică distinctivă a programului este inițializarea automată a mediilor conectate.

R.E.M.

REM are o interfață mai prietenoasă decât participanții anteriori. Principiul programului este de a crea zone în care fișierele sunt indexate automat, ceea ce poate accelera semnificativ procesul de căutare. Zonele pot fi create nu numai pe computerul local, ci și pe discuri din rețea.

Google Desktop Search

Dezvoltat de o companie de renume mondial, Google Desktop Search este un mic motor de căutare local. Cu ajutorul acestuia, puteți căuta informații atât pe computerul de acasă, cât și pe Internet. Pe lângă funcția principală, programul prevede utilizarea blocurilor de informații - gadgeturi pentru desktop.

Toate programele din această listă sunt excelente pentru a înlocui căutarea nativă Windows. Alegeți singuri: instalați un software mai simplu, dar cu un set mai mic de funcții, sau un întreg motor de căutare cu capacitatea de a procesa fișiere. Dacă lucrați cu foldere și unități într-o rețea locală, atunci REM și Everything sunt potrivite pentru dvs. și dacă intenționați să „purtați programul cu dvs.”, atunci acordați atenție Căutare efectivă de fișiere sau Căutare fișiere mele.

Odată cu creșterea cenzurii și a supravegherii, alternativele la Google și Yandex devin din ce în ce mai interesante pentru utilizatori. Vă vom spune despre trei motoare de căutare fără restricții care nu colectează informații personale despre dvs., ci, dimpotrivă, vă protejează confidențialitatea.

Pagina de pornire: Cel mai discret motor de căutare din lume

Startpage.com se autointitulează „cel mai discret motor de căutare din lume”. Din 2016, serviciul a fost fuzionat cu site-ul Ixquick. Ca dovadă a securității căutării sale, Startpage.com se autoproclamă ca fiind singurul motor de căutare cu un certificat de confidențialitate UE.

Startpage.com promite să nu stocheze adresele IP ale utilizatorilor și, conform serviciului,nu folosește cookie-uri pentru urmărire. În plus, Startpage.com este accesibil din rețeaua Tor.Serverele motoarelor de căutare sunt situate în Țările de Jos.

Site-ul are o caracteristică convenabilă:Rezultatele căutării pot fi vizualizate utilizând opțiunea Proxy, care criptează conexiunea la pagina web corespunzătoare folosind un server proxy. Astfel, acesta este un adevărat motor de căutare fără restricții: poți vizualiza în siguranță ceea ce blochează furnizorul tău.

Proxy-uri de căutare: Pagina de pornire ocolește cu ușurință blocarea Yandex.DNS

Proxy-urile de căutare sunt caracteristica principală a Startpage, ceea ce îl face un motor de căutare fără cenzură. Dacă trebuie să cauți fără blocare, acest serviciu este pentru tine.

DuckDuckGo: motor de căutare anonim din SUA

DuckDuckGo este cea mai utilizată alternativă sigură la Google, cu peste zece milioane de căutări pe zi.Chiar dacă serverele motorului de căutare sunt situate în SUA, DuckDuckGo.com oferă în continuare câteva caracteristici interesante.

Când căutați prin DuckDuckGo.com, adresa dvs. IP nu va fi salvată. Sistemul de asemeneaNu folosește cookie-uri pentru urmărire.DuckDuckGo folosește criptarea HTTPS. De asemenea, puteți introduce o interogare într-un motor de căutare prin intermediul rețelei Tor. De asemenea, puteți utiliza diferite teme pentru a personaliza aspectul paginii dvs. de căutare.

Aici nu puteți deschide site-uri web printr-un proxy. Dar ținând cont de faptul că sistemul se află în afara jurisdicției Federației Ruse, nu este supus, de exemplu, „dreptului de a fi uitat” în sensul în care este înțeles la noi.Rezultatele căutării pot să nu fie perfecte, dar sunt încă destul de utile.


Dreptul de a fi uitat: DuckDuckGo găsește site-uri cu dovezi compromițătoare blocate în Federația Rusă. Google - doar știri

Acest serviciu este mai potrivit pentru cei care apreciază în primul rând anonimatul și căutează fără urmărire. Sau pentru cei care doresc să găsească informații excluse din rezultatele căutării în Federația Rusă. Cu toate acestea, ar trebui să vă avertizăm: în Rusia, DuckDuckGo a devenit partenerul Yandex, așa că vă puteți aștepta la toate.

notEvil: căutare pe Internet care nu există

Motorul de căutare notEvil vă permite să căutați pe Internet folosind rețeaua Tor anonimă. Pentru a face acest lucru, nu trebuie să instalați niciun software suplimentar (deși veți avea nevoie de el pentru a deschide rezultatele căutării).

Acest motor de căutare vă permite să căutați pe așa-numitul darknet - acea parte a Internetului care este de obicei inaccesibilă utilizatorului obișnuit. Datorită blocării, serviciile utile se mută treptat în el, de exemplu, pentru descărcarea de conținut.

Majoritatea motoarelor de căutare web de pe Tor câștigă fără rușine bani din publicitate: obții rezultate de la Tor și, în plus, o mână de reclame și urmărire gratuit. notEvil în mod fundamental nu face acest lucru. Este clar că aici nu vorbim deloc despre urmărirea IP și utilizarea cookie-urilor.


notEvil: vă ajută să găsiți lucruri în Tor care ar putea să nu existe pe Internet

Site-ul va fi util celor care doresc să se familiarizeze cu conținutul Internetului invizibil; anonimatul hardcore garantat. Apropo, vă recomandăm să salvați imediat linkul către marcajele dvs. - URL-urile din categoria „Tor-to-web” sunt foarte neprietenoase în ceea ce privește amintirea.

Motoarele de căutare anonime ca alternativă sigură la Google

Toate cele trei motoare de căutare nu vă înregistrează adresa IP și nu folosesc cookie-uri pentru urmărire. Criptarea folosind HTTPS este furnizată de toți furnizorii numiți.

Motorul de căutare DuckDuckGo a arătat cele mai bune rezultate de căutare în test și veți primi securitate garantată atunci când alegeți un motor de căutare alternativ cu sistemul Startpage.com. Certificarea UE de protecție a datelor confirmă faptul că motorul de căutare își respectă promisiunea privind anonimatul căutării. NotEvil, la rândul său, este util pentru căutarea în darknet.

Căutarea profesională pe Internet necesită software specializat, precum și motoare de căutare și servicii de căutare specializate.

PROGRAME

http://dr-watson.wix.com/home – programul este conceput pentru a studia matrice de informații text pentru a identifica entitățile și conexiunile dintre ele. Rezultatul lucrării este un raport asupra obiectului studiat.

http://www.fmsasg.com/ - unul dintre cele mai bune programe din lume pentru vizualizarea conexiunilor și relațiilor Sentinel Vizualizer. Compania și-a rusificat complet produsele și a conectat o linie telefonică în limba rusă.

http://www.newprosoft.com/ – „Web Content Extractor” este cel mai puternic și mai ușor de utilizat software pentru extragerea datelor de pe site-uri web. Are, de asemenea, un păianjen Visual Web eficient.

SiteSputnik un pachet software care nu are analogi în lume, permițându-vă să căutați și să procesați rezultatele acestuia pe Internetul Vizibil și Invizibil, folosind toate motoarele de căutare necesare utilizatorului.

WebSite-Watcher – vă permite să monitorizați pagini web, inclusiv cele protejate cu parolă, forumuri de monitorizare, fluxuri RSS, grupuri de știri, fișiere locale. Are un sistem de filtrare puternic. Monitorizarea se realizează automat și este furnizată într-o formă ușor de utilizat. Un program cu funcții avansate costă 50 de euro. Actualizat constant.

http://www.scribd.com/ este cea mai populară platformă din lume și folosită din ce în ce mai mult în Rusia pentru postarea diferitelor tipuri de documente, cărți etc. pentru acces gratuit cu un motor de căutare foarte convenabil pentru titluri, subiecte etc.

http://www.atlasti.com/ este cel mai puternic și eficient instrument de analiză calitativă a informațiilor disponibil utilizatorilor individuali, întreprinderilor mici și chiar mijlocii. Programul este multifuncțional și, prin urmare, util. Combină capacitatea de a crea un mediu informațional unificat pentru lucrul cu diferite fișiere text, tabelare, audio și video ca un întreg, precum și instrumente pentru analiză și vizualizare calitativă.

Ashampoo ClipFinder HD – o cotă din ce în ce mai mare din fluxul de informații vine din video. În consecință, ofițerii de informații competitive au nevoie de instrumente care să le permită să lucreze cu acest format. Un astfel de produs este utilitarul gratuit pe care îl prezentăm. Vă permite să căutați videoclipuri pe baza unor criterii specificate pe site-urile de stocare a fișierelor video, cum ar fi YouTube. Programul este ușor de utilizat, afișează toate rezultatele căutării pe o singură pagină cu informații detaliate, titluri, durata, ora la care videoclipul a fost încărcat în stocare etc. Există o interfață rusă.

http://www.advego.ru/plagiatus/ – programul a fost realizat de optimizatori SEO, dar este destul de potrivit ca instrument de inteligență pe Internet. Plagiatul arată gradul de unicitate al textului, sursele textului și procentul de potrivire a textului. Programul verifică, de asemenea, unicitatea adresei URL specificate. Programul este gratuit.

http://neiron.ru/toolbar/ – include un add-on pentru combinarea căutării Google și Yandex și, de asemenea, permite o analiză competitivă bazată pe evaluarea eficienței site-urilor și a publicității contextuale. Implementat ca plugin pentru FF și GC.

http://web-data-extractor.net/ este o soluție universală pentru obținerea oricăror date disponibile pe Internet. Configurarea tăierii datelor din orice pagină se face în câteva clicuri de mouse. Trebuie doar să selectați zona de date pe care doriți să o salvați, iar Datacol va selecta automat o formulă pentru decuparea acestui bloc.

CaptureSaver este un instrument profesional de cercetare pe Internet. Pur și simplu un program de lucru indispensabil care vă permite să captați, să stocați și să exportați orice informații de pe Internet, inclusiv nu numai pagini web, bloguri, ci și știri RSS, e-mail, imagini și multe altele. Are cea mai largă funcționalitate, o interfață intuitivă și un preț ridicol.

http://www.orbiscope.net/en/software.html – sistem de monitorizare web la prețuri mai mult decât accesibile.

http://www.kbcrawl.co.uk/ – software pentru lucru, inclusiv pe „Internetul invizibil”.

http://www.copernic.com/en/products/agent/index.html – programul vă permite să căutați folosind mai mult de 90 de motoare de căutare, folosind mai mult de 10 parametri. Vă permite să combinați rezultatele, să eliminați duplicatele, să blocați link-urile întrerupte și să afișați cele mai relevante rezultate. Vine în versiuni gratuite, personale și profesionale. Folosit de peste 20 de milioane de utilizatori.

Maltego este un software fundamental nou, care vă permite să stabiliți relația dintre subiecte, evenimente și obiecte din viața reală și pe Internet.

SERVICII

nou https://hunter.io/ – un serviciu eficient pentru detectarea și verificarea e-mailului.

https://www.whatruns.com/ este un scaner ușor de utilizat, dar eficient, pentru a descoperi ce funcționează și nu funcționează pe un site web și care sunt găurile de securitate ale acestuia. De asemenea, implementat ca plugin pentru Chrom.

https://www.crayon.co/ este o platformă bugetară americană pentru informații despre piață și concurență pe internet.

http://www.cs.cornell.edu/~bwong/octant/ – identificatorul gazdei.

https://iplogger.ru/ – un serviciu simplu și convenabil pentru a determina IP-ul altcuiva.

http://linkurio.us/ este un nou produs puternic pentru lucrătorii din domeniul securității economice și anchetatorii corupției. Prelucrează și vizualizează cantități uriașe de informații nestructurate din surse financiare.

http://www.intelsuite.com/en – Platformă online în limba engleză pentru inteligență competitivă și monitorizare.

http://yewno.com/about/ este primul sistem de operare pentru traducerea informațiilor în cunoștințe și vizualizarea informațiilor nestructurate. În prezent, acceptă engleză, franceză, germană, spaniolă și portugheză.

https://start.avalancheonline.ru/landing/?next=%2F – servicii de prognoză și analiză de Andrey Masalovich.

https://www.outwit.com/products/hub/ – un set complet de programe de sine stătătoare pentru munca profesională în web 1.

https://github.com/search?q=user%3Acmlh+maltego – extensii pentru Maltego.

http://www.whoishostingthis.com/ – motor de căutare pentru găzduire, adrese IP etc.

http://appfollow.ru/ – analiza aplicațiilor pe baza recenziilor, optimizarea ASO, pozițiile în top și rezultatele căutării pentru App Store, Google Play și Windows Phone Store.

http://spiraldb.com/ este un serviciu implementat ca plugin pentru Chrom, care vă permite să obțineți o mulțime de informații valoroase despre orice resursă electronică.

https://millie.northernlight.com/dashboard.php?id=93 - un serviciu gratuit care colectează și structurează informații cheie despre industrii și companii. Este posibil să utilizați panouri de informații bazate pe analiza textului.

http://byratino.info/ – colectarea de date faptice din surse disponibile public pe internet.

http://www.datafox.co/ – Platforma CI colectează și analizează informații despre companiile de interes pentru clienți. Există un demo.

https://unwiredlabs.com/home - o aplicație specializată cu un API pentru căutarea prin geolocalizare a oricărui dispozitiv conectat la Internet.

http://visualping.io/ – un serviciu de monitorizare a site-urilor și, în primul rând, a fotografiilor și imaginilor disponibile pe acestea. Chiar dacă fotografia apare doar pentru o secundă, aceasta va fi în e-mailul abonatului. Are un plugin pentru Google Chrome.

http://spyonweb.com/ este un instrument de cercetare care permite analiza aprofundată a oricărei resurse de pe Internet.

http://bigvisor.ru/ – serviciul vă permite să urmăriți campanii de publicitate pentru anumite segmente de bunuri și servicii, sau anumite organizații.

http://www.itsec.pro/2013/09/microsoft-word.html – instrucțiuni de la Artem Ageev privind utilizarea programelor Windows pentru nevoile de inteligență competitivă.

http://granoproject.org/ este un instrument open source pentru cercetătorii care urmăresc rețelele de conexiuni dintre indivizi și organizații din politică, economie, criminalitate etc. Vă permite să vă conectați, să analizați și să vizualizați informațiile obținute din diverse surse, precum și să afișați conexiuni semnificative.

http://imgops.com/ – un serviciu pentru extragerea metadatelor din fișierele grafice și lucrul cu acestea.

http://sergeybelove.ru/tools/one-button-scan/ – un mic scaner online pentru verificarea găurilor de securitate din site-uri web și alte resurse.

http://isce-library.net/epi.aspx – serviciu pentru căutarea surselor primare folosind un fragment de text în limba engleză

https://www.rivaliq.com/ este un instrument eficient pentru realizarea de informații competitive pe piețele vestice, în primul rând europene și americane, pentru bunuri și servicii.

http://watchthatpage.com/ este un serviciu care vă permite să colectați automat informații noi din resursele de internet monitorizate. Serviciul este gratuit.

http://falcon.io/ este un fel de raportare pentru web. Nu este un înlocuitor pentru Rapportive, dar oferă instrumente suplimentare. În schimb, Rapportive oferă un profil general al unei persoane, parcă lipit de date din rețelele sociale și mențiuni de pe web http://watchthatpage.com/ - un serviciu care vă permite să colectați automat informații noi din resursele monitorizate internetul. Serviciul este gratuit.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – supliment pentru Firefox. Monitorizează actualizările paginilor web. Util pentru site-urile web care nu au fluxuri de știri (Atom sau RSS).

http://agregator.pro/ – agregator de portaluri de știri și media. Folosit de marketeri, analiști etc. pentru a analiza fluxurile de știri pe anumite subiecte.

http://price.apishops.com/ – serviciu web automat pentru monitorizarea prețurilor pentru grupuri de produse selectate, magazine online specifice și alți parametri.

http://www.la0.ru/ este un serviciu convenabil și relevant pentru analiza link-urilor și backlink-urilor către o resursă de internet.

www.recordedfuture.com este un instrument puternic pentru analiza și vizualizarea datelor, implementat ca un serviciu online construit pe cloud computing.

http://advse.ru/ este un serviciu cu sloganul „Aflați totul despre concurenții dvs.”. Vă permite să obțineți site-urile web ale concurenților în conformitate cu interogările de căutare și să analizați campaniile de publicitate ale concurenților în Google și Yandex.

http://spyonweb.com/ – serviciul vă permite să identificați site-uri cu aceleași caracteristici, inclusiv pe cele care folosesc aceiași identificatori de serviciu de statistică Google Analytics, adrese IP etc.

http://www.connotate.com/solutions – o linie de produse pentru inteligența competitivă, gestionarea fluxurilor de informații și conversia informațiilor în active informaționale. Include atât platforme complexe, cât și servicii simple, ieftine, care permit monitorizarea eficientă împreună cu compresia informațiilor și obținerea doar a rezultatelor necesare.

http://www.clearci.com/ - platformă de inteligență competitivă pentru afaceri de diferite dimensiuni, de la start-up-uri și companii mici până la companii Fortune 500. Rezolvată ca saas.

http://startingpage.com/ este un add-on Google care vă permite să căutați pe Google fără a vă înregistra adresa IP. Acceptă pe deplin toate capabilitățile de căutare Google, inclusiv în limba rusă.

http://newspapermap.com/ este un serviciu unic care este foarte util pentru un ofițer de informații competitive. Conectează geolocalizarea cu un motor de căutare media online. Acestea. selectați regiunea de care sunteți interesat, sau chiar un oraș, sau limba, vedeți locul de pe hartă și o listă de versiuni online ale ziarelor și revistelor, faceți clic pe butonul corespunzător și citiți. Suportă limba rusă, interfață foarte ușor de utilizat.

http://infostream.com.ua/ este un sistem foarte convenabil de monitorizare a știrilor „Infostream”, care se distinge printr-o selecție de primă clasă și destul de accesibil oricărui portofel, de la unul dintre clasicii căutării pe Internet, D.V.

http://www.instapaper.com/ este un instrument foarte simplu și eficient pentru salvarea paginilor web necesare. Poate fi folosit pe computere, iPhone, iPad, etc.

http://screen-scraper.com/ – vă permite să extrageți automat toate informațiile din paginile web, să descărcați marea majoritate a formatelor de fișiere și să introduceți automat date în diferite forme. Salvează fișierele și paginile descărcate în baze de date și realizează multe alte funcții extrem de utile. Funcționează pe toate platformele majore, are versiuni profesionale gratuite complet funcționale și foarte puternice.

http://www.mozenda.com/ - are mai multe planuri tarifare si este accesibil chiar si micilor afaceri, un serviciu web de monitorizare web multifunctionala si livrare a informatiilor necesare utilizatorului de pe site-urile selectate.

http://www.recipdonor.com/ - serviciul vă permite să monitorizați automat tot ceea ce se întâmplă pe site-urile concurenților.

http://www.spyfu.com/ – și asta dacă concurenții tăi sunt străini.

www.webground.su este un serviciu de monitorizare a Runetului creat de profesioniștii în căutarea pe Internet, care include toți furnizorii importanți de informații, știri etc. și este capabil de setări de monitorizare individuale pentru a se potrivi nevoilor utilizatorului.

MOTOARE DE CĂUTARE

https://www.idmarch.org/ este cel mai bun motor de căutare pentru arhiva mondială de documente pdf din punct de vedere al calității. În prezent, au fost indexate peste 18 milioane de documente pdf, de la cărți la rapoarte secrete.

http://www.marketvisual.com/ este un motor de căutare unic care vă permite să căutați proprietari și management de top după numele complet, numele companiei, poziția sau o combinație a acestora. Rezultatele căutării conțin nu numai obiectele pe care le căutați, ci și conexiunile acestora. Proiectat în principal pentru țările vorbitoare de engleză.

http://worldc.am/ este un motor de căutare pentru fotografii liber accesibile legate de geolocalizare.

https://app.echosec.net/ este un motor de căutare public care se descrie ca fiind cel mai avansat instrument analitic pentru profesioniștii din domeniul aplicării legii și al securității și informațiilor. Vă permite să căutați fotografii postate pe diverse site-uri, platforme sociale și rețele sociale în raport cu coordonatele specifice de geolocalizare. În prezent, există șapte surse de date conectate. Până la sfârșitul anului, numărul lor va depăși 450. Mulțumim lui Dementy pentru pont.

http://www.quandl.com/ este un motor de căutare pentru șapte milioane de baze de date financiare, economice și sociale.

http://bitzakaz.ru/ – motor de căutare pentru licitații și comenzi guvernamentale cu funcții suplimentare plătite

Website-Finder - face posibilă găsirea site-urilor pe care Google nu le indexează bine. Singura limitare este că caută doar 30 de site-uri web pentru fiecare cuvânt cheie. Programul este ușor de utilizat.

http://www.dtsearch.com/ este un motor de căutare puternic care vă permite să procesați terabytes de text. Funcționează pe desktop, web și intranet. Suportă atât date statice, cât și dinamice. Vă permite să căutați în toate programele MS Office. Căutarea se efectuează folosind fraze, cuvinte, etichete, indecși și multe altele. Singurul motor de căutare federal disponibil. Are atât versiuni plătite, cât și versiuni gratuite.

http://www.strategator.com/ – caută, filtrează și agregează informații despre companie din zeci de mii de surse web. Căutări în SUA, Marea Britanie, principalele țări CEE. Este foarte relevant, ușor de utilizat și are opțiuni gratuite și plătite (14 USD pe lună).

http://www.shodanhq.com/ este un motor de căutare neobișnuit. Imediat după apariția sa, a primit porecla „Google pentru hackeri”. Nu caută pagini, ci determină adrese IP, tipuri de routere, calculatoare, servere și stații de lucru situate la o anumită adresă, urmărește lanțuri de servere DNS și vă permite să implementați multe alte funcții interesante pentru inteligența competitivă.

http://search.usa.gov/ este un motor de căutare pentru site-uri web și baze de date deschise ale tuturor agențiilor guvernamentale din SUA. Bazele de date conțin o mulțime de informații practice, utile, inclusiv pentru utilizare în țara noastră.

http://visual.ly/ – astăzi vizualizarea este din ce în ce mai folosită pentru prezentarea datelor. Acesta este primul motor de căutare infografic de pe Web. Alături de motorul de căutare, portalul are instrumente puternice de vizualizare a datelor care nu necesită abilități de programare.

http://go.mail.ru/realtime – caută discuții despre subiecte, evenimente, obiecte, subiecte în timp real sau personalizabil. Căutarea foarte criticată anterior în Mail.ru funcționează foarte eficient și oferă rezultate interesante și relevante.

Zanran tocmai a fost lansat, dar funcționează deja excelent, primul și singurul motor de căutare de date care extrage date din fișiere PDF, tabele EXCEL, date pe pagini HTML.

http://www.ciradar.com/Competitive-Analysis.aspx este unul dintre cele mai bune sisteme de regăsire a informațiilor din lume pentru inteligența competitivă pe deep web. Preluează aproape toate tipurile de fișiere în toate formatele pe tema de interes. Implementat ca serviciu web. Preturile sunt mai mult decat rezonabile.

http://public.ru/ – Căutare eficientă și analiză profesională a informațiilor, arhiva media din 1990. Biblioteca media online oferă o gamă largă de servicii de informare: de la acces la arhivele electronice ale publicațiilor media în limba rusă și recenzii de presă tematice gata făcute până la monitorizare individuală și cercetare analitică exclusivă bazată pe materiale de presă.

Cluuz este un motor de căutare tânăr, cu oportunități ample de inteligență competitivă, în special pe internetul în limba engleză. Vă permite nu numai să găsiți, ci și să vizualizați și să stabiliți conexiuni între oameni, companii, domenii, e-mailuri, adrese etc.

www.wolframalpha.com – motorul de căutare de mâine. Ca răspuns la o solicitare de căutare, furnizează informații statistice și faptice disponibile asupra obiectului cererii, inclusiv informații vizualizate.

www.ist-budget.ru – căutare universală în bazele de date de achiziții publice, licitații, licitații etc.


Până de curând, găsirea informațiilor necesare pe World Wide Web nu era atât de ușoară. Dar, datorită dezvoltării rapide și apariției noilor motoare de căutare, acest proces a devenit mult mai convenabil și mai rapid. În recenzia noastră de astăzi vă prezentăm cele mai bune 10 servicii pentru căutarea diferitelor tipuri de date care pot găsi tot ce aveți nevoie în adâncurile internetului.

1. Motor de căutare pe Internet - Bing


Bing este un motor de căutare celebru pe Internet care a fost creat în iunie 2009. Acest serviciu este disponibil în 40 de limbi. Are aproximativ 350 de milioane de vizitatori unici lunar.

2. Motor de metacăutare pe Internet - AOL Search.com


AOL Search.com este un metamotor de căutare pe Internet care a fost fondat în Statele Unite ale Americii în 1985. Numărul lunar de vizitatori ai acestui serviciu este de aproximativ 75 de milioane de persoane. Poziția de CEO este ocupată de Tim Armstrong.

3. Motor de căutare pe Internet - DuckDuckGo


DuckDuckGo este un motor de căutare pe internet open source care a fost lansat în 2008 de Gabriel Weinberg. Sediul companiei este situat în Valley Forge, Pennsylvania. Numărul de vizitatori unici care folosesc DuckDuckGo este de aproximativ 13 milioane de oameni pe lună.

4. Motor de căutare pe Internet - Ask.com


Ask.com este un sistem de căutare pe Internet, a cărui caracteristică principală este căutarea răspunsurilor la întrebări. Serviciul a fost fondat în iunie 1996 în Berkeley, California de Garrett Gruner și David Wharton. Numărul lunar de vizitatori unici la acest serviciu este de aproximativ 145 de milioane de persoane.

5. Motor de căutare pe Internet - Google


Google este cel mai faimos motor de căutare pe Internet, cu sediul în Mountain View, California, Statele Unite ale Americii. Compania a fost fondată la 4 septembrie 1998 de Larry Page și Serghei Mihailovici Brin. Numărul său lunar de vizitatori unici este de aproximativ 1.100.000.000 de persoane.

6. Sistem de metacăutare pe Internet - MyWebSearch.com


MyWebSearch.com este un motor de metacăutare pe Internet care ocupă locul 73 pe lista celor mai populare site-uri web. Are aproximativ 60 de milioane de vizitatori unici lunar.

7. Metamotor de căutare pe Internet - Infospace.com


Motorul de căutare prezentat a fost fondat în 1996. Sediul său este situat în Bellevue, Washington, Statele Unite. Numărul lunar de vizitatori unici Infospace.com este de aproximativ 24 de milioane de oameni.

8. Motor de metacăutare pe Internet - WebCrawler.com


WebCrawler.com este un motor de metacăutare pe internet alimentat de Yahoo și Google. Compania a fost fondată în aprilie 1994. Are aproximativ 65 de milioane de vizitatori unici lunar.

9. Internet metamotor de căutare - Info.com


Info.com este un metamotor de căutare cu sediul în capitala Regatului Unit, Londra. Info.com are aproximativ 13 milioane de vizitatori unici lunar.

10. Motor de căutare pe Internet – Yahoo


motor de căutare pe internet numit - Yahoo, care a fost fondată în ianuarie 1994 de Jerry Yang și David Feal. CEO-ul companiei este Marissa Mayer. Numărul său lunar de vizitatori unici este de aproximativ 300 de milioane de oameni. Sediul serviciului este situat în Santa Clara, California, Statele Unite ale Americii.

Iar iubitorii de dispozitive mobile și de tehnologie informatică vor fi probabil interesați să se uite