vorige logische pagina | homepagina (zonder frames) | homepagina (met frames)

Laatst aangepast op 8 december 2000

Wat is een URL?

 
Wat is een URL? | Omschrijving van een URL | Samenstellende delen | Protocols | Computernaam | Poortnaam | Directory-path | Bestandsnaam | Label of verwijzing binnen een bestand
 
Lijst met URL's van zoekrobotten of zoekprogramma's
Lijst van typische onderwijs sites
Verwijzingen naar bibliotheken
Verwijzingen naar educatieve uitgevers

 

Wat is een URL?

Omschrijving van URL

Een URL staat voor een "Uniform Resource Locator" wat zoveel wil zeggen als een unieke bestandsnaam of bestandslocatie (directory of folder) binnen het volledige internet. Een dergelijke naam moet dus binnen het internet uniek zijn voor alle computers die op het internet aangesloten zijn.

URL's zijn die namen die je in tijdschriften en aankondigingen op radio en tv verneemt wanneer men een verwijzing maakt naar een web-pagina. Om die web-pagina dan te bezoeken moet je in je "raadpleeg"-programma of BROWSER in het invoervakje "location" deze URL volledig correct overtypen en op de enter-toets drukken. Het vak "location" of "locatie" is meestal het bovenste invoervak van je browser. Respecteer bij het ingeven van een URL het gebruik van HOOFD- en kleine letters en leestekens (wat niet altijd evident is wanneer een URL via de radio bekend gemaakt wordt, probeer in dat geval eerst alles in kleine letters, nadien alles in hoofdletters). Als je in een URl het woord "dot" hoort dan staat dit voor een punt, het leesteken . dus (zonder spaties er voor of er na).

 

Samenstellende delen van een URL

Als je een beetje met computers vertrouwd bent is de samenstelling van een URL best te begrijpen. Zo'n URL bestaat minstens uit twee delen, maar vaak kan je er drie of meer delen in onderscheiden.

 
 

1) Het gebruikte protocol

Elke URL begint met een afkorting die het gebruikte protocol voor de betreffende internet-site voorstelt.

   http:   staat voor HyperText Transfer Protocol
   ftp:    staat voor File Transfer Protocol
   telnet: staat voor het TelNet protocol
   smpt:   staat voor Simple Mail Transfer Protocol
           (wordt gebruikt voor het versturen van een e-mail
           naar de outgoing mail server)
   mailto: staat voor een e-mail-protocol dat het 
           mail-programma zelf oproept
   pop3:   is ook een e-mail protocol (Post Office Protocol versie 3)
           en wordt gebruikt wanneer iemand zijn e-mail wil ophalen
           vanop zijn incoming mail server. 

De dubbele punt na de protocol-aanduiding is absoluut noodzakelijk om een correcte URL in te geven.

(*) Special!

Voor wie zelf thuis wil experimenteren met HTML, of voor intranet-gebruikers, bestaat er ook het file: -protocol. Hiermee haal je geen bestanden over van ergens op het Internet maar vanaf je eigen pc (harde schijf, CD-ROM, diskette of een lokaal gedeeld apparaat).

Dit laat je bijvoorbeeld toe om je eigen HTML-pagina's te controleren vooraleer je ze op het net stuurt.

Je kan er een simulatie van het internet mee aanmaken, of je kan het gebruiken om een eigen hypertext-bibliotheek mee aanleggen op je pc. Een bibliotheek die je via je Browser off-line raadpleegt.

 
 

2) De computernaam (servernaam)

Na de protocol-aanduiding komt een identificatie van de computer (in feite de server) waarop de desbetreffende bestanden staan. Om de protocol-aanduiding te onderscheiden van de computernaam gebruikt men twee gewone schuine strepen // (slashes). Niet te verwarren met de "back-slash" (\) die bij DOS en WINDOWS-systemen gebruikt worden om directory- en bestandsnamen van mekaar te scheiden.

   http://www.hogent.be/ 

is dan al een geldige URL. Je merkt dat het http-protocol zal gebruikt worden, en de unieke naam van de computer is www.hogent.be

(*) Special!

Als je het file: -protocol gebruikt moet je drie schuine strepen gebruiken en een rechtopstaand streepje | als afsluiting van de drive-aanduiding. Dus geen dubbele punt meer na de letter-aanduiding van je schijfstation!

Zo moet je bv.

   file:///C|/HTML-DOC/EERSTE.HTM 

ingeven om het bestand "EERSTE.HTM" vanop je directory "HTML-DOC" vanop je harde schijf C: te bekijken met je browser.

Even terug nu naar de gewone URL's.

   http://www.hogent.be/ 

De computernaam uit bovenstaande URL bestaat toevallig uit drie delen. Je hebt ook computernamen met slechts twee delen, vb. de computer waarop het staatsblad van BelgiŽ te raadplegen is via internet

   http://staatsblad.be/ 

Een computernaam kan ook uit meer dan drie delen bestaan, vb.:

   http://www.lerc.nasa.gov/  

Het zal je wel opgevallen zijn dat in de twee eerste voorbeelden het laatste deel van de computernaam telkens " be " is. Dit wijst erop dat deze computers (=servers) horen tot het internet-domein BelgiŽ. Het volledige internet is immers opgedeeld in enkele zeer grote domeinen waarbinnen steeds verdere onderverdelingen (sub-domeinen) aangebracht zijn.

Er bestaat een overeenkomst om het laatste deel van de computernaam (hier = servernaam) toe te kennen volgens enkele eenvoudige regels. Daardoor kan je achterhalen op wat voor computer (server) een bepaalde webpagina staat.

Zo wijst het laatste deel van een servernaam van de internet-servers in de US op het type van organisatie die deze computer beheert (met andere woorden: je kan stellen dat die organisatie behoort tot een groep van organisaties wiens webservers allen behoren tot eenzelfde hoofddomein van het internet):

   com = het hoofddomein voor commerciŽle instellingen, bedrijven of organisaties,
         m.a.w. deze servers horen toe aan een privť bedrijf 
         of een commerciŽle organisatie
   edu = een educatieve instelling (college, universiteit, 
         high-school, enz.)
   gov = overheidsinstelling of -instituut
   mil = afdeling van het Amerikaans leger
   net = aanbieder van netwerkdiensten
   org = non-profit organisatie 

Het laatste deel van een computernaam van de internet-servers buiten de US wijzen meestal op het land waar de computer staat:

   be = BelgiŽ
   ch = Zwitzerland (Cantons de Helvetia)
   de = Duitsland
   fr = Frankrijk
   nl = Nederland
   no = Noorwegen
   uk = United Kingdom - Verenigd koninkrijk 

Toemaatje

In de niet-Amerikaanse sites heb je dus niet meteen zicht op het type organisatie op basis van het computeradres. Meer en meer zien we toch ook in deze adressen aanduidingen opduiken die verwijzen naar het type organisatie. Zo is het tussenvoegsel "ac" vaak de aanduiding van een academische instelling zoals bv. een universiteit. "lib" wordt vaak gebruikt als aanduiding dat het een bibliotheek betreft.
Meer en meer gaan ook commerciŽle organisaties in Europa de aanduiding "com" gebruiken i.p.v. de land-aanduiding (vooral organisaties die zich als internationaal willen profileren nemen dit over).

Zo staat bijvoorbeeld:

   http://www.lib.rug.ac.be  voor de homepage van de BIBLIOTHEEK (lib...rary)
            van de R.U.G. (ac...academic)  van GENT, en niet van GRONINGEN
            want er staat ook  be. 

Omgekeerde hiŽrarchie

In feite moet je de internet-computernaam (of servernaam) achterste voor lezen. Het meest rechtse deel staat op het hoogste niveau. Bijvoorbeeld in bovenstaande url slaat  be  op het hoogste niveau (=domein). Binnen het niveau   be   is er een niveau met alle officiŽle universitaire websites, nl.  ac  . Daarbinnen is   rug  ťťn van de onderverdelingen. En binnen   rug   zijn de websites die allemaal iets met de bibliotheek te maken hebben gegroepeerd onder het niveau  lib  . Als algemene startplaats neemt men vaak   www   als laatste onderverdeling; zoals eerder gezegd is dit niet noodzakelijk steeds zo.

Nog een ander voorbeeld. De Vlaamse Autonome Hogeschool Gent heeft ook meerdere http-servers. Daar dit een Belgisch instituut is horen die servers allen tot   be  als hoogste domain. Daarbinnen heeft deze hogeschool het subdomain   hogent   bekomen. Dit subdomain is verder onderverdeeld in andere subdomainen, o.a.:

  • www - als algemene startsite,
  • docent - als server voor de homepages van de docenten en lectoren,
  • student - als server voor de studenten,
  • X-ite - als server voor de informele contacten tussen de personeelsleden van de hogeschool,
  • hnet - voor de administratieve toepassingen van de hogeschool, enz...

 

3) Eventuele poortnaam

Zelden zie je nog een poortnaam vermeld in een URL. Standaard is de poortnaam (een technische aanduiding van een intern adres op de pc waarlangs de buitenwereld contact moet nemen met deze computer) voor het http-protocol steeds :80 . Als men echter de standaardwaarde gebruikt hoef je deze in 99 % van de gevallen niet meer in te geven. Staat er in de URL die je toegespeeld kreeg wel nog een poortnummer vermeld, geeft dit dan ook in de URL mee, bv.

   http://info.cern.ch:80/  
 

4) Eventuele uitbreidingen

 

4.1) Een directory of "pad"

Een algemene URL bestaat meestal alleen uit de protocolaanduiding en de unieke "internet"naam van de computer. Als je alleen iets dergelijks ingeeft dan kom je automatisch terecht op de algemene verwelkomingspagina of home-pagina van die computer. Dat is wat je bv. krijgt als je http://www.hogent.be/ zou ingeven in het locatie-vak.

Op een aantal computers staan er echter meerdere home-sites, met andere woorden, op ťťn computer kunnen meerdere bedrijven of meerdere personen hun eigen home-page beheren. Om er voor te zorgen dat elk van die personen niet in de bestanden van een ander zit te knoeien, krijgt elk van die gebruikers een eigen directory of folder toegewezen. Een dergelijke directory kan enkele niveau's diep zijn zodat je een heuse opeenvolging van directory's moet ingeven vooraleer je op het juiste niveau terecht gekomen bent. Een dergelijke opeenvolging van directory's noemt men ook vaak het "pad" (path) naar een bestand of web-pagina

Zo staan al de webpagina's van mijn (deze) site in de directory "~ldc392" van de internet-computer van de docenten van de Vlaamse Autonome Hogeschool Gent. De URL van mijn homepage bestaat dus uit drie delen, nl.: de protocolaanduiding (http:), de naam van de internet-computer (docent.hogent.be) en het pad (in dit geval slechts ťťn directoy-naam "~ldc392") http://docent.hogent.be/~ldc392 is dus de URL naar de home-pagina van mijn-deze site.

 

4.2) Eventuele bestandsnaam

Sommige sites bestaan uit honderden web-pagina's. Als je steeds via de home-pagina zou moeten passeren om uiteindelijk via ettelijke onderliggende keuzes terecht te komen op die web-pagina die je interesseert dan zou je vaak veel tijd verliezen. Daarom kan men de URL van een home-pagina uitbreiden met pad en bestandsnaam van die specifieke web-pagina die je nodig hebt.

Zo is de URL van deze web-pagina http://docent.hogent.be/~ldc392/URL-LIST.HTM, en kan je die als dusdanig ook rechtstreeks oproepen.

Daar het internet een "platform"-onafhankelijk systeem is, zal het je ook niet verbazen dat je directory en bestandsnamen terugvindt die zondigen tegen de bv. de bestandsnaamgeving van DOS of WINDOWS-3.x. Het is dus best mogelijk dat je bestandsnamen ontmoet die langer zijn dan acht karakters, of extensies die langer zijn dan drie tekens.

Dit "platform"-onafhankelijk karakter is ook de verklaring waarom je in pad-namen op internet geen backslashes gebruikt (waar die normaal op IBM-compatibele machines noodzakelijk zijn).

 
 

4.3) Eventuele verwijzing binnen een bestand

In een aantal gevallen is het zelfs wenselijk om binnen ťťnzelfde web-pagina nog fijnere verwijzingen te kunnen maken. Zeker wanneer de betreffende web-pagina in feite een lijst is van elementen die onderling weinig met mekaar te maken hebben. De verwijzing naar een onderdeel of een "label" in een document gebeurt door het "hekje" # te laten volgen op de bestandsnaam en daarna de naam van het "label" te typen.
 
Zo ga je met de volgende URL rechtstreeks naar het onderdeel "resolutie" van de web-pagina met uitleg over verschillende termen die met een "R" beginnen:
http://docent.hogent.be/~ldc392/LEXIC-R.HTM#resolutie
 
En zo is de volgende URL een verwijzing terug naar het deel binnen deze web-pagina waarin een omschrijving staat van wat een url is: http://docent.hogent.be/~ldc392/URL-WAT.HTM#Omschrijving  
 

De link doet het niet meer!

Al de hier vermelde adressen (URL's) zijn gecontroleerd op het ogenblik dat ze aan deze pagina toegevoegd werden. Internet-pagina's zijn echter "levende" dingen en kunnen dus verhuizen en ook sterven. Mocht je in deze lijst een URL vinden die niet meer klopt, gelieve ons dan te verwittigen door een mailtje met al de nodige gegevens te sturen naar Lucas.DeCocker@hogent.be.  
 


 
Naar de vorige logische pagina van deze documentenreeks | Naar de homepage (zonder frames) | Naar de homepagina (met frames).
 
Deze pagina bevindt zich op een WWW-server van de Vlaamse Autonome Hogeschool Gent. Voor commentaar, vragen of suggesties i.v.m. deze pagina ben je steeds welkom bij Lucas De Cocker, lector mediakunde, K.L. Ledeganckstraat 8, B-9000 Gent. E-mail = Lucas.DeCocker@hogent.be
 
Het gebruik van dit document is onderworpen aan de wetten op het auteursrecht ©. Wens je deze inhoud (of delen ervan) te kopiŽren of op een andere manier te vermenigvuldigen, aarzel dan niet om met mij contact op te nemen.