Skip to content Skip to navigation

OpenStax_CNX

You are here: Home » Content » Infotöötlus (Julia Kjahrenova)

Navigation

Recently Viewed

This feature requires Javascript to be enabled.
 

Infotöötlus (Julia Kjahrenova)

Module by: Julia Kjahrenova. E-mail the author

Summary: Infotöötlus aine

Erialainformatsioon internetis

Infoühiskonnas ei ole suurima väärtusega mitte info, vaid aeg, mille jooksul vajalik ja õige informatsioon hankida ning oskus selle informatsiooniga midagi tarka peale hakata. Just internetti on koondunud inimkonna teadmised ja informatsioon: juba paari aasta eest ületas teabe hulk internetis kogu inimkonna ajaloo jooksul formaliseeritud info hulga.

Internet

  • võimaldab ülemaailmset suhtlemist kolleegide, sõprade, klientidega
  • lihtne juurdepääs andmebaasidele (bibliograafilised -ja täistekstandmebaasid), mis sisaldavad infot firmade, tööstuse, tervishoiu, hariduse ja teaduse kohta
  • suurepärane koht, mis võimaldab omandada ka haridust ja enesetäiendust
  • võimaldab tegeleda klienditeenindusega, turundusega

Uuringute järgi kasutavad iga päev otsimootorite abi kuni 90% interneti kasutajatest. Ülejäänud kümme protsenti külastavad kindlaid lehekülgi, mille aadress ei muutu ning kust nad saavad kogu vajaliku info.

Põhimõtteliselt võib praeguseid otsingumootoreid võrrelda telefoniraamatuga, mida täiendatakse ebaregulaarselt, esitatakse vaid populaarset informatsiooni, osa andmeid on aegunud või valed, mõned teemad on välja jäetud ning palju lehti lihtsalt välja rebitud. Selle näilise segaduse juures on aga tegelikult võimalik vajalikku leida ja isegi suhteliselt kergelt. Sellise hinnangu on otsimootoritele andmud Jaan Vare artiklis “Kes otsib, see leiab” ajakirjas Arvutimaailm (2000) nr.7 lk. 3.

Turule püsimajäämiseks täiustatakse pidevalt otsimootoreid, luuakse uusi teenuseid ja tehnoloogiaid. Paar aastat tagasi oli raske üht otsimootorit teiste seast esile tõsta. Praeguseks on loodud teenused neile, kes otsivad majandusalast infot ja neile, kes otsivad tooteid. Võistlus veebi otsimootorite vahel toob kasu nende arengule. Iga otsimootor on loonud juurde uusi võimalusi aitamaks paremini küsimust moodustada ja tulemuste hulgas navigeerida.

 

Otsimootorid

Otsimootori ülesandeks on internetist või selle mingist piirkonnast info otsimine mingi etteantud märksõna või fraasi põhjal. Otsimootoreid saab liigitada mitmel eri viisil: teenuse järgi, otsitava temaatika järgi, geograafilise piirkonna järgi, otsitava keele järgi ja fraasi otsimismeetodi järgi.

Teenuse järgi saab eristada peamiselt kolme tüüpi süsteeme:

  • www otsimootorid , mis otsivad infot www lehekülgedelt;
  • Useneti otsimootorid , mis otsivad infot uudisegruppidest; tavaliselt saab otsida viimase paari kuu jooksul postitatud materjalide hulgast; sisaldavad ka arhiive;
  • anonüümse FTP otsimootorid , mis otsivad materjale FTP serveritest.

Temaatika järgi saab eristada universaalseid otsimootoreid , mis otsivad kõikvõimalikke materjale, ning temaatilisi otsimootoreid, mis on keskendunud mingile kindlale teemale ( nt isikute või firmade otsimisele vms).

Geograafilise piirkonna järgi saab eristada globaalseid otsimootoreid, mis hõlmavad kogu internetti – st maailma – ning lokaalseid otsimootoreid , mis käsitlevad mingis piirkonnas, maailmajaos, riigis, linnas jms leiduvaid materjale. Sellega sarnaneb veidi otsimootorite jaotus esituskeele järgi.

Otsimootorite andmebaasid on koostatud arvutiprogrammide poolt nn 'spider', ‘crawler', mis regulaarselt külastavad andmebaase ja automaatselt indekseerivad neid. Jälgides lehekülgedel leiduvaid viiteid, suudab “ämblik” jõuda nende lehtedeni, mis pole veel indekseeritud. Lehekülje registreeimisel võib “ämblik” luua indeksi kõigist leheküljel leiduvatest sõnadest, viidetest teistele lehekülgedele ning püüda eristada eristada ebaolulisest (nt sidesõnad, parasiitsõnad jne). Olulistest märksõnadest, märksõna asukoha järgi leheküljel või spetsiaalse märksõnade kirjelduse järgi luuakse dokumendile koht temaatilises kataloogis. Digitaalse ämbliku loodud indeks on põhjalik ja pisiasju märkav. Selleks, et teha sellises indeksis edukas otsing, tuleb aga tunda ämblike “hingeelu”, et päringuid töötlevale mootorile anda edasi just see õige päring.

Leitud materjalid seab otsimootor tavaliselt järjekorda otsitud märksõnade vastavuse järgi. Selle hindamiseks kasutatakse mitmeid erinevaid meetodeid, mis vaatavad peamiselt märksõna esinemist teksti eri osades. Näiteks märksõna esinemine pealkirjas on palju suurema kaaluga kui selle esinemine kusagil teksti sees või lõpus. Mõni otsimootor väljendab kokkulangevust protsentides.

Kasulik on kasutada ühe otsingu puhul mitut otsimootorit, kuna igaüks sisaldab unikaalset infot ja osa kattub.

Otsimootorite kasutajaskond on väga lai. Otsing peab olema jõukohane nii kogenud otsingu teostajale kui ka algajale, kes teeb oma esimese ühesõnalise otsingu. Kui otsida ebatavalist või raskesti leitavat informatsiooni, siis on kasulik kasutada suurema indeksiga otsimootoreid, sest nad katavad suurema osa veebilehtedest. Kuid kui otsida informatsiooni populaarsematel teemadel, siis ei pruugi suure indeksiga lehed anda kõige paremaid tulemusi. See on oluline, kuna otsimootorid erinevad suuruse, indekseerimise, täiendamise sageduse ja otsivõimaluste poolest.

Otsingul kasutatv profiil sõltub otsisüsteemi poolt pakutavatest võimalustest. Kasutades nn advanced search võimalusi saab koostada keeruka otsinguprofiili. Erinevates otsimootorites võivad need võimalused olla erinevad. Seepärast tuleb enne otsima asumist tutvuda otsimootori poolt pakutavate võimalustega. Otsimootorite kvaliteeti on võimalik testida mõne lihtsa küsimusega, tulemused on erinevate otsimootorite puhul kardinaalselt erinevad.

 

Metaotsimootorid

Kuna interneti andmebaasid kasvavad kiires tempos ja palju temas sisalduvast teabest kipub veelgi kiiremini vananema, siis tavalised otsimootorid ei rahulda enam kasutajate kasvavaid vajadusi. Tegelikult on kõikide interneti lehekülgede talletamine reaalajas praktiliselt võimatu ja isegi paremad otsimootorid suudavad indekseerida ainult kuni kuuendiku kõigist internetis leiduvatest lehekülgedest. Otsismootorite teave võib olla 3-4 kuud vana, kuna selle pidev uuendamine nõuab üha kiiremaid ja võimsamaid arvutisüsteeme. Üheks lahenduseks on meta- ehk multiotsingu süsteemide rakendamine, mis kasutavad märksõnaotsinguks mitut otsimootorit rööbiti. Metaotsingu pioneeriks oli Washingtoni Ülikoolis loodud MetaCrawler 1995 aastal. Tööpõhimõte on lihtne: päringusõna(d) juhitakse korraga paljudele otsimootoritele ja tulemused liidetakse ühisele vastuslehele. Üldjuhul otsiaeg lüheneb ja saadakse väiksem arv üksteist dubleerivaid vastuseid.

Seega teeb metaotsimootor kiire ja pinnapealse otsingu mitmest otsimootorist korraga, külastades iga otsimootorit lühikest aega. Metaotsingut on otstarbekas kasutada siis, kui otsitakse harvaesinevat, unikaalset terminit või fraasi. Nad saavad kätte ainult 10% tulemustest igast otsimootorist, mida nad külastavad. Tulemuste võrdlemisel selgub, et 60% allikatest kattub, 40% on originaalset infot. Kui otsingus kasutatakse mitut terminit või keerukat otsingu loogikat võib see osaliselt kaotsi minna, või arvestab seda ainult konkreetne otsimootor.

 

Teemakataloogid

Temaatilised kataloogid kujutavad endast hierarhilisi katalooge, mis liigitavad käsitletava materjali temaatika järgi järjest peenemalt. Temaatilistes kataloogides asendub otsimine navigeerimisega, milles kitsendatakse samm-sammult otsitavat valdkonda.

Temaatilised kataloogid võivad anda paremaid tulemusi kui otsimootorid, kuna nad on loodud inimeste poolt. Kuid allikate hulk on otsimootorites suurem. Teemakataloogid on kasulikud just siis, kui uuritav teema on uurija jaoks uus ning ta soovib saada teemast ülevaadet. Tehes otsingu teemakataloogis, võib vastuseid olla suhteliselt vähe, kuid see-eest on need teemakohased.

 

Virtuaalraamatukogud

Virtuaalraamatukogu all mõistetakse elektrooniliselt paiknevat informatsiooni ja selle kättesaadavaks tegemist, arvestamata ressursside asukohta ja kättesaamiseks kuluvat aega.

Virtuaalraamatukogud on akadeemilistes ringkondades algatatud infoteenused internetis, et pakkuda alternatiivi üldtuntud otsivahenditele ja hõlbustada kasutamist haridus- ning teadustööd tegevatele ringkondadele. Kuigi veeb pakub uurijatele uusi ning täiendavaid võimalusi informatsiooni hankimiseks ja uurimistöö tulemuste levitamiseks, põhjustab aina suurenev informatsioonihulk probleeme tema kasutajatele, sest üha keerulisem on leida relevantset teavet. Virtuaalraamatukogu on seega süsteem, mille kaudu kasutaja saab kohapeal ühendust võtta eemalasuvate raamatukogude ja andmebaasidega, kasutades selleks vahendajana näiteks kohaliku raamatukogu elektronkataloogi, ülikooli- või muud võrguarvutit.

Sageli kasutatakse sünonüümidena termineid “virtuaalraamatukogu”, “elektrooniline raamatukogu”, “digitaalraamatukogu” ja “e-raamatukogu”, kuid igaühele neist omistatakse siiski ka oma definitsioon. Elektrooniline raamatukogu saab endas hõlmata digitaalraamatukogu, kuna ta on laiem mõiste. Nii digitaalraamatukogu kui elektrooniline raamatukogu võivad olla virtuaalraamatukogud, kui nad eksisteerivad ainult virtuaalselt, kuna virtuaalraamatukogu kaasab erinevad infomaterjalid ja -teenused, mis on arvutite ja arvutivõrkude kaudu organiseeritud virtuaalruumi.

Virtuaalraamatukogu on kvaliteetne infoteenus, mis vahendab raamatukogu andmebaasi valitud ja teatud valiku- ja kvaliteedikriteeriumidest lähtuvalt kirjeldatud infomaterjale. Viruaalraamatukogu võib olla universaalse sisuga, koondada informatsiooni ühe riigi kohta või sisaldada konkreetse teadusharu elektroonilisi ressursse.

Näited: Dutch Electronic Subject Service (DutchESS), FinElib Philosophy in Cyberspace , Virtual Computer Library , Biz/ed (Business and economics information gateway), MathGuide , TTÜ raamatukogu teemaväravad .

Veebi võib jagada “nähtavaks” ja “nähtamatuks” veebiks. Nähtamatuks ehk süvaveebiks nimetatakse veebiosa, mis sisaldab lehekülgi, mille poole otsirobotid otseselt ei pöördu ja mis jääb neile peidetuks. See sisaldab:

  • parooliga kaitstud saite
  • tulemüüride taha peidetud dokumente
  • arhiveeritud materjale
  • interaktiivseid vahendeid, nagu veebikalkuraatorid ja sõnastikud
  • erialalised andmebaasid sissepääsuga dialoogiakna kaudu

Nähtamatu veebi maht ületab nähtava veebi oma mitmekordselt. Kui internet üldiselt sisaldab palju ebaolulist ja aegunud materjali, siis nähtamatu veeb sisaldab eriti palju kõrgekvaliteedilist materjali. Nähtamatu veebi üheks peamiseks osaks on info, mis on salvestatud andmebaasidesse või andmebaasijuhtimisega veebisaitidesse.

Seega tuleb erialainformatsiooni internetis otsida andmebaasidest, kõrgkoolide, teadusasutuste, erialaühingute ja organistasioonide lehekülgedelt, raamatukogude elektron kataloogidest. Märksõna otsingut on otstarbekas täpsustada, kasutades selleks teaviku vormi ilseloomustavaid sõnu: teadusajakirjad, konverentsimaterjalid, dissertatsioonid, teadustööd, jne. Sageli sisaldavad just teemakataloogid ja virtuaalraamatukogud bibliograafilisi- ja täistekstandmebaase. Andmebaaside otsinguks võib kasutada Librarians' Index to the Internet , Yahoo , WWW Virual Library . Raamatukogude elektron kataloogide otsinguks kasutage Libweb , LibDex , LIBCAT

Parim koht teadustööde otsinguks on vaba juurdepääsuga dissertatsioonide andmebaas UMI ProQuest Digital Dissertations . Andmebaas sisaldab valdavalt USA-s, aga ka Kanadas ja Suurbritannias kaitstud magistri- ja doktoritöid. Juurdepääs on avatud jooksva ja sellele eelneva aasta tööde 24 esimesele leheküljele PDF formaadis.

Suurepärase ülevaate interneti otsimootoritest ja otsivõimalustest leiateHow to Choose a Search Engine or Directory : Univerity at Albany LibrariesSearch the Internet Tips from U.C. Berkeley LibrarySearch Engine GuideSearch Engine Watch : Tips About Internet Search Engines & Search Engine SubmissionSearchEngines.com - search engine rankings and search engine optimization tips.

 

Tunnused, mille alusel otsimootoreid võrreldakse ja otsingustrateegia luuakse

  • Otsimootori suurus
  • Värskendamissagedus – mida sagedamini andmeid värskendatakse, seda vähem esineb seal “surnud” või aegunud lehekülgi
  • Mida otsimootor sisaldab - WWW, Usenet, tekstifailid, meililistid, pildid, multimeedia, FTP jne
  • Kas fraasi otsing on võimalik
  • Boole'i loogika kasutamine AND, OR, NOT, NEAR, AND NOT
  • + ja – märgi kasutamine, + seda sõna peab sisaldama , - selle sõna peab välistama
  • Kuidas tulemused reastatakse. Leitud materjalid seab otsimootor tavaliselt järjekorda otsitud märksõnade vastavuse järgi. Selle hindamiseks kasutatakse mitmeid erinevaid meetodeid, mis vaatavad peamiselt märksõna esinemist teksti eri osades.
  • Kas väljade järgi on võimalik otsingut täpsustada: title, URL, link, host, domain, text, image, anchor, applet jne
  • Sõnatüve lühendamine * , sõnade ainsuse ja mitmuse kasutamine
  • Tõstutundlikkus
  • Otsikeelte valiku võimalus (suur keelte valik AltaVistas, Euroseek's)
  • Otsingu piiramine dokumendi kuupäevaga
  • Multimeedia otsingu võimalus
  • Tõlkimisvõimalus

Content actions

Download module as:

PDF | EPUB (?)

What is an EPUB file?

EPUB is an electronic book format that can be read on a variety of mobile devices.

Downloading to a reading device

For detailed instructions on how to download this content's EPUB to your specific device, click the "(?)" link.

| More downloads ...

Add module to:

My Favorites (?)

'My Favorites' is a special kind of lens which you can use to bookmark modules and collections. 'My Favorites' can only be seen by you, and collections saved in 'My Favorites' can remember the last module you were on. You need an account to use 'My Favorites'.

| A lens I own (?)

Definition of a lens

Lenses

A lens is a custom view of the content in the repository. You can think of it as a fancy kind of list that will let you see content through the eyes of organizations and people you trust.

What is in a lens?

Lens makers point to materials (modules and collections), creating a guide that includes their own comments and descriptive tags about the content.

Who can create a lens?

Any individual member, a community, or a respected organization.

What are tags? tag icon

Tags are descriptors added by lens makers to help label content, attaching a vocabulary that is meaningful in the context of the lens.

| External bookmarks