Skip to content Skip to navigation

OpenStax_CNX

You are here: Home » Content » Opmærkning og opmærkningssprog - om HTML og XML

Navigation

Recently Viewed

This feature requires Javascript to be enabled.
 

Opmærkning og opmærkningssprog - om HTML og XML

Module by: Steffen Leo Hansen. E-mail the author

Summary: Introduktion til og diskussion af opmærkning med HTML og XML

Lidt om hjemmesider og opmærkning

Vi har alle adskillige gange besøgt en hjemmeside i vores jagt på informationer når vi søger oplysninger om personer, produkter eller ord og begreber som vi ikke forstår. Vi er så vant til at bevæge os i cyberspace og til at besøge hjemmesider, at vi ikke opfatter det som anvendt teknologi, ikke tænker over hvad der gemmer sig bag en hjemmeside og hvordan den er bygget op. Men vi har nogle ganske præcise forventninger til en hjemmeside: den skal indeholde de informationer vi søger, og de skal være let tilgængelige. Derfor er vi heller ikke sene til at fælde dom over en hjemmeside hvis vi bliver skuffede: ”Den er kedelig, den gider jeg ikke besøger igen!”, ”Den indeholder ikke de oplysninger jeg søger!”, ”Den er svær at bruge!”.

En hjemmeside er et udstillingsvindue, det sted hvor en leverandør præsenterer sine produkter for sine kunder, og stedet hvor man gerne skulle få nye kunder. Det er derfor vigtigt at en hjemmeside på en og samme tid er smart, indbydende, let at bruge og informativ. Det stiller store krav til design, til opbygning og indretning af hjemmesiden. De centrale informationer skal placeres det rigtige sted på siden – eller siderne – og det skal være nemt at bevæge sig rundt og komme fra et sted til et andet på en hjemmeside. Og det hele skal samtidig være overskueligt, ligesom der skal være en naturlig sammenhæng mellem informationer som præsenteres samme sted.

Når man leder efter en hjemmeside, bruger man en browser1, et program som kan finde og fortolke indholdet på en hjemmeside. Det sprog man anvender når man bygger sin hjemmeside, skal derfor helst være et sprog der ikke er afhængigt af at bruger anvender en bestemt type computer eller en bestemt browser. Lige netop sådan et sprog er HTML, en forkortelse der dækker over HyperText Markup Language.

At en hjemmeside er HyperText vil sige, at det er tekst som ikke er bundet til papir, ikke er bundet af en lineær præsentation og læsning fra venstre mod højre. Man kan derimod bevæge sig frit i teksten, udnytte links og henvisninger og springe fra et sted i teksten til etandet ved at klikke på et ord, en illustration eller på en adresse til en anden hjemmeside.

Om opmærkning og opmærkningssprog

At HTML er et Markup Language vil sige at det er et sprog som man bruger til at forsyne en tekst med markører. Vi siger også at HTML er et opmærkningssprog.

Helt konkret og bogstaveligt går opmærkning derfor ud på at indsætte markører (eng. tags) i en tekst. Bruger vi HTML som opmærkningssprog, kan vi slå mængden af mulige markører og deres betydning op i en særlig HTML-ordbog.

Opmærkning svarer på mange måder til vores brug af et tekstbehandlingssystem når vi ønsker at fremhæve og udskille vigtige dele i en tekst som for eksempel i:

Figur 1
        
          Eric T. Ray
          Learning XML
          O’Reilly 2003 
          

Vi bruger som noget helt naturligt forskellige indbyggede funktioner i det aktuelle tekstbehandlingssystem i vores opmærkning, det kan være fed skrift eller italic og vi kan ændre på størrelsen af bogstaverne. Men mange gange bruger vi også eksplicitte markører, som for eksempel i:

Figur 2

	 Forfatter: Eric T. Ray
          Titel: Learning XML
          Forlag: O’Reilly 2003
          Udg.: 2003 
          

I ovenstående eksempel indsætter vi markører, Forfatter, Titel, Forlag og Udg., for at gøre det lettere for læseren at forstå hvad det er for en type informationer der vises.

HTML og XML

I det foregående afsnit er begrebet opmærkning introduceret og HTML er beskrevet som et opmærkningssprog. To eksempler, fig.1 og fig.2 illustrerer hvordan man kan bruge funktionerne i et tekstbehandlingssystem, fed skrift, skråskrift og skrifttyper, til opmærkning. De viser tillige at funktioner som ’indrykning’ og ’tekstbox’ også fungerer som en form for opmærkning, dvs som et middel til rent grafisk at fremhæve og tydeliggøre det centrale i den information som man formidler. De to eksempler illustrerer en yderligere og væsentlig forskel på måden at opmærke på. I fig. 2 er der indsat markører som beskriver indholdet i den information som præsenteres. Vi kan direkte aflæse af markørerne at ’Eric T. Ray’ er navnet på en forfatter og at ’Learning XML’ er titlen på en bog som han har skrevet. Denne information mangler i fig. 1, som alene fokuserer på den grafiske præsentation og på at adskille forfatter, titel og forlag fra hinanden ved hjælp af forskelle i skriften.

Denne forskel i fokus – præsentation over for indhold – genfinder vi i forskellen mellem HTML og XML, eXtensible Markup Language.

Hvad vil du fremhæve: præsentation eller indhold

HTML har som opmærkningssprog fokus på præsentationen af informationer. Det er derfor det sprog vi bruger når vi bygger hjemmesider. XML har fokus på indholdet. Det svarer ganske godt til forskellen mellem fig. 1 og fig. 2. Vi bruger XML og de markører vi sætter ind i teksten til at sige noget om indholdet: hvad handler det om, som i fig. 2, og modsat bruger vi HTML når vi lægger vægt på hvordan teksten skal fremstå og præsenteres.

Vi kan illustrere forskellen på følgende vis:

Figur 3

          <b> Eric T. Ray </b>
          <i> Learning XML </i>
          <p> o’Reilly </p>
          <font size=’-1´> O’Reilly 2003 </font>
          

I fig. 3 – lad os kalde det et HTML-dokument – er der brugt markører fra HTML til at præsentere en streng med fed skrift (l.1), med skråskrift (l.2) og til at nedsætte størrelsen på den anvendte skrifttype (l.4). Læg mærke til at en markør (eng. tag) er omgivet af særlige tegn, tegnet < som starten på en markør, og > som afslutning. Markøren <b> angiver at skriften skal være fed (eng.bold), og markøren <i> angiver at skiften skal fremstå som italic. Med markøren <p> angives at der er tale om ren tekst, en (text)paragraph. Læg endvidere mærke til at en opmærkning altid bør omfatte en startmarkør og en slutmarkør. Slutmarkøren kender vi på syntaksen som for eksempel i </b >. Opmærkningen <b> ... </b> har således den effekt at alt hvad der står mellem startmarkøren og slutmarkøren bliver præsenteret med fed skrift.

Sammenfattende kan man sige, at når man opmærker i HTML, fungerer man som både en form for grafiker og som typograf. Når vi opmærker i XML, er fokus et andet. Da er det indholdet det gælder:

Figur 4

             <forfatter> Eric T. Ray </forfatter>
             <titel> Learning XML </titel>
             <forlag> O’Reilly </forlag>
             <udg> 2003 </udg>
             

De markører som er brugt i fig. 4 – lad os kalde det et XML-dokument – siger alene noget om hvad det er for en type information der står mellem de to markører, hvad data mellem start- og slutmarkør handler om.

Vi kan sammenfattende karakterisere forskellen mellem HTML og XML som en forskel mellem valg af design , HTML, og valg af information, XML. Vi har på den ene side de data som vi vil præsentere, på den anden vores viden om de informationer som er repræsenteret i data og vores forestilling om hvordan vi kan modellere disse informationer i XML. En bog er skrevet af en person, det vi normalt kalder FORFATTER, den har en TITEL og er udgivet af et FORLAG på et bestemt tidspunkt. Det er denne vores idé og forestilling om den typiske bog og tilhørende informationskategorier som vi fokuserer på i XML og sætter navn på ved hjælp af vores markører.

Det siger sig selv, at en browser ikke ved hvilke informationskategorier vi har i hovedet og anvender når vi opmærker i XML, uanset hvad vi opmærker. Modsat er det praktisk at den kan genkende og fortolke de markører som definerer præsentationen. Derfor er mængden af markører i HTML og deres betydning fastlagt på forhånd. Vi kan ikke lave om på dette og introducere vores egne markører2.

XML derimod giver brugeren mulighed for lave og bruge sit eget opmærkningssprog i og med at vi skiller indholdet fra præsentationen. Et XML-dokument er strukturerede data, men også struktureret information. Strukturen er identisk med de tags der anvendes. De afspejler den informationsstruktur somer indeholdt i de data der opmærkes som for eksempel i tilfældet med en bog. Hvis vi udveksler vores tags eller informationskategorier med hinanden, vil vi også kunne hente, bruge og genbruge oplysninger med samme struktur, og vi kan uden problemer vise det hele hvis det er pakket ind i HTML.

Test dig selv

Som afslutning på dette første modul følger et par opgaver som du kan bruge til at træne opmærkning.

Som det første skal du samle alle de oplysningstyper – informationskategorier – som efter din mening typisk er knyttet til beskrivelsen af en bog.

Lav en liste med de relevante begreber (forfatter, titel, forlag.....) og lav derefter en liste hvor begreberne er noteret som tags.

Nedenfor finder du tre forskellige beskrivelser af tre forskellige bogtitler.

Sammenlign dine liste med de tre beskrivelser og udvid om nødvendigt listerne med nye kategorier, kategorier som du ikke har tænkt over i første omgang.

Kopiér en af teksterne over i dit tekstbehandlingssystem, indsæt dine tags i teksten og gem den som et XML-dokument, det vil sige som en fil med efternavnet xml, for eksempel: jørgen_leth.xml

Eksempel 1

Tekst 1: hentet hos Gentofte Kommunes Biblioteker:

Roman Anne Marie Løn. Sekstetten : roman / Anne Marie Løn. - [Kbh.] : Gyldendal, 2008. - 550 sider ISBN 978-87-02-07227-3 : hf. : kr. 299,00.

ISBN 978-87-02-07365-2 : ib. : kr. 349,00.

Eksempel 2

Tekst 2: hentet hos Gentofte Kommunes Biblioteker:

Lydbog, Biografi. Det uperfekte menneske / Jørgen Leth

Gyldendal Lyd, 2008-Forfatteren, filminstruktøren og Tour de France-eksperten Jørgen Leths (f. 1937) erindringsessays, hvori han beskriver øjeblikke i sit liv og omkostningerne ved at leve som æstetiker: rastløsheden, depressionerne og ensomheden.

Eksempel 3

Tekst 3: hentet hos Gyldendals Bogklub (og derfor er det ikke sikkert at alle informationerne er relevante i din model!):

Jo Nesbø

Flagermusmanden

Klubpris: 149,-

Første bind i Jo Nesbøs suveræne krimi-serie om Harry Hole

Den norske kriminalbetjent Harry Hole sendes til Australien for at bistå i opklaringen af mordet på en ung, norsk kvinde. I lufthavnen mødes han af Andrew kensington, en aboriginal kriminalbetjent med en mindst ligeså broget fortid som ham selv. Sammen bevæger de sig rundt i Sydneys red light district, King's Cross, og forsøger at navigere efter de svage ekkoer fra en morder. Oversat af Allan Hilton Andersen efter Flaggermusmannen

Afslut denne første øvelse med at udskrive din færdige og endelige liste over informationskategorier og tilhørende tags knyttet til beskrivelsen af en bog.

Hvordan vil du forklare forskellen i følgende udsagn:

HTML er strukturerede data

XML er struktureret information

Footnotes

  1. En af de mest anvendte browsere er Interne Explorer fra Microsoft
  2. Fremover vil vi anvende den gængse engelske terminologi for markører: tags

Content actions

Download module as:

PDF | EPUB (?)

What is an EPUB file?

EPUB is an electronic book format that can be read on a variety of mobile devices.

Downloading to a reading device

For detailed instructions on how to download this content's EPUB to your specific device, click the "(?)" link.

| More downloads ...

Add module to:

My Favorites (?)

'My Favorites' is a special kind of lens which you can use to bookmark modules and collections. 'My Favorites' can only be seen by you, and collections saved in 'My Favorites' can remember the last module you were on. You need an account to use 'My Favorites'.

| A lens I own (?)

Definition of a lens

Lenses

A lens is a custom view of the content in the repository. You can think of it as a fancy kind of list that will let you see content through the eyes of organizations and people you trust.

What is in a lens?

Lens makers point to materials (modules and collections), creating a guide that includes their own comments and descriptive tags about the content.

Who can create a lens?

Any individual member, a community, or a respected organization.

What are tags? tag icon

Tags are descriptors added by lens makers to help label content, attaching a vocabulary that is meaningful in the context of the lens.

| External bookmarks