Преглед садржаја:
Дефиниција - Шта значи Паук?
У контексту Интернета, паук је специјализовани софтвер осмишљен за систематско индексирање и прегледавање Ворлд Виде Веб-а, обично у сврху индексирања веб страница како би их обезбедио као резултате претраживања за упите корисника. Најпознатији од таквих паука је Гооглебот, главни Гоогле претраживач који помаже да се осигура да се релевантни резултати врате за упите претраживања.
Пауци су такође познати и као претраживачи, претраживачи или једноставно ботови.
Техопедија објашњава Паука
Паук је у основи програм који се користи за скупљање информација са свјетске мреже. Он претражује странице веб локација вадећи информације и индексирајући их за каснију употребу, обично за резултате претраживача. Паук посећује веб странице и њихове странице кроз различите везе на и са страница, тако да ће страницу без иједног линка до ње бити тешко индексирати и можда се рангирати заиста мало на страници са резултатима претраге. А ако постоји пуно веза које упућују на неку страницу, то би значило да је страница популарна и да ће се појавити више на резултатима претраге.
Кораци у претраживању веба:
- Паук проналази сајт и започне претраживати своје странице.
- Паук индексира речи и садржај веб локације.
- Паук посећује везе пронађене на сајту.
Спидерс или вебцравлерс су само програми и као такви следе систематска правила која су поставили програмери. Власници веб локација такође могу да се укључе у то тако што ће рећи пауку које делове сајта да индексира, а који не. Ово се постиже креирањем датотеке "роботс.ткт" која садржи упутства за паука у вези са којим деловима треба индексирати и везама које треба да прате и које треба да игнорише. Најзначајнији паукови су они у власништву главних претраживача као што су Гоогле, Бинг и Иахоо, и они намењени за вађење података и истраживање, али постоје и неки злонамерни пауци написани за проналажење и прикупљање е-поште које корисник може продати компанијама или пронаћи рањивости у Веб безбедности.
