Определение на търсачката
Има различни видове приложения, считани за търсачки. Съществуват йерархични търсачки, наричани още паяци или паяци, директории, смесени търсачки и директории, метаизследващи двигатели, вертикални търсачки и много други.
Обемът на информацията, открита в Интернет, е толкова абсурдно преувеличен, че ако не бъде отпечатана, тя не само не би се вписала в най-голямата библиотека в света, но и ще ни трябва толкова сгради, за да съхраним обемите, колкото площта на няколко човешки мегалополиса.
Голяма част от тази информация е открито достъпна за обществеността, но трябва да знаете къде да я намерите, за да я намерите. За да го намерим, имаме инструмент: търсачките.
Търсачката е интернет услуга, която автоматично индексира страниците, които съставляват хиляди и хиляди интернет уебсайтове, и ни предлага своето запитване чрез търсене по ключови думи.
Всъщност търсачката се състои приблизително от три части: от една страна, базата данни, която съдържа препратките към уеб страниците и документите, за които търсачката е запозната и която може дори да стане цели копия на страници със съответните им елементи, като изображения (както в случая с кеша на Google).
От друга страна, имаме мотор, който отговаря за търсенето на страниците, които ще бъдат класифицирани, което е известно като „паяк“, тъй като неговият модел за търсене се основава на разнасяне на „крака“, които следват връзките, които напускат страниците.
Това е причината, когато създаваме уеб страница, можем бързо да я видим класифицирана и в резултатите от търсачки като Google, Yahoo! или Bing.
И накрая, третата част на търсачката се състои от потребителския интерфейс, който ни позволява да извършваме търсения. Това като съществени елементи се състои от текстово поле за въвеждане на ключовата дума или израз на търсене и бутон за стартиране на самото търсене.
Това, което получаваме, след като въведем ключовата дума или множеството ключови думи, които ни интересуват, е списък на страниците, на които се появяват тези думи.
Така че, например, ако се интересуваме от търсене на статии за риболов, можем да въведем тази дума (тегло), както е в Google или Bing, между другото, и щракнете върху бутона за търсене, за да ни покаже страниците с резултати, които включват казана дума.
Всички търсачки предоставят възможност за търсене по различни думи, които могат да се появят на страницата, в нарушение относно начина, по който сме ги въвели, или търсене по буквалната фраза, които са същите думи, но в същия ред, в който сме ги въвели. За целта трябва да затворим фразата в двойни кавички.
Например, ако искаме да намерим автора на латинската фраза audaces fortuna iuvat, ще въведем в търсачката:
„Смело богатство иват“
и тогава ще натиснем клавиша за връщане или ще кликнем върху бутона за търсене.
С течение на времето някои търсачки са разработили серия от „трикове“ за допълнително усъвършенстване на търсенията.
Това е случаят с Google, който ни позволява, наред с други неща, да търсим в конкретен уебсайт вместо в целия Интернет или да извършваме изчисления или конверсии на единици (измерване, валута).
Редът, в който се представят резултатите, се определя от серия от фактори, които дават „оценка“ на всяка класифицирана страница.
Всяка търсачка присъжда тази оценка по различен начин според различни критерии и всъщност алгоритъмът, който дава точките, обикновено е една от най-добре пазените тайни на компаниите, които стоят зад търсачките; Чували ли сте някога за SEO?
Алгоритмите за търсене също са включили изкуствен интелект за усъвършенстване на резултатите от търсенето.
Какво търсим често зависи от езиковия или културния контекст, в който пишем, или те могат да бъдат думи с двойни или тройни значения в зависимост от различни фактори. Познаването на търсенията, които сме извършили досега, и разбирането на тези значения в контекст помага да предложим по-полезни резултати на интернет потребителите и това се опитва от търсачките.
В исторически план първата модерна търсачка е Webcrawler, която се появи през 1994 година.
Дотогава всички търсачки се състоеха от подреден и структуриран индекс на връзки към уебсайтове и страници, по които трябваше да се движим ръчно, постепенно се спускайки през дърво от категории и подкатегории.
Това, което настоящето вече ни осигурява и ни очаква в бъдеще, са гласови търсения (тоест диктуват думите за търсене на машината и че тя ги „разбира“) и търсения от снимки, в които Търсачката също "разбира" какво излиза в изображенията и го интерпретира.
Такива технологии вече съществуват и могат да се прилагат, но те все още са във фаза, в която трябва да отлежат, за да се преместят на нов стадион.