Internet Archive

Internet Archive (Nederlands: Internetarchief) is een website en project met als doel universele toegang te bieden tot alle menselijke kennis. Het project is begonnen door Brewster Kahle in 1996 en was gevestigd in het Presidio van San Francisco, Californië, Verenigde Staten.

Het huidige hoofdkantoor van het Internetarchief in een voormalige kerk in San Francisco
Internetondernemer Brewster Kahle, stichter van het Internet Archive

Sinds november 2009 is het gehuisvest in een voormalige Christian Science-kerk in San Francisco.

Collectie

Het voormalige hoofdkantoor in het Presidio, een voormalig militair terrein, tot november 2009 de thuisbasis van het Internetarchief

De collectie omvat:

Wayback Machine

Kopie van het Internet Archive (in de Bibliotheca Alexandrina)

Het archief onderhoudt de Wayback Machine, met inhoud die gedoneerd wordt door Alexa Internet. Nadat een gebruiker een URL opgeeft, zorgt deze machine voor gearchiveerde versies van de website, door de jaren heen. In juni 2016 had Internet Archive 487 miljard webpagina's opgeslagen.

De naam Wayback Machine komt uit een tekenfilmserie, genaamd The Rocky and Bullwinkle Show. De hond Mr. Peabody en zijn assistent, een jongen genaamd Sherman, gebruiken een tijdmachine, genaamd de WABAC Machine om beroemde gebeurtenissen uit het verleden te bezoeken.

Boeken

De grootste collectie die daarnaast door Internet Archive beschikbaar wordt gesteld, bestaat uit boeken. In juni 2016 stelde het meer dan 10 miljoen teksten online ter beschikking, waarvan 2,3 miljoen afkomstig waren uit Amerikaanse bibliotheken.

Films

Internet Archive heeft onder de categorie Moving Images een gevarieerd aanbod aan audiovisueel materiaal. In juni 2016 bestond de collectie uit meer dan 2,5 miljoen films en filmpjes.[1]

Subcollecties van Moving Images zijn:

  • Animation & Cartoons: tekenfilms uit de jaren 30 en 40, computer- en 3D-animatie en zogenaamde Brick-films met Lego-mannetjes.
  • Arts & Music: materiaal van de tv-programma's Punkcast, GrooveTV, This or That! en Coffee House TV. Daarnaast ook ingezonden filmpjes.
  • Computers & Technology: Diverse programma's over de geschiedenis van computers en internet.
  • Cultural & Academic Films: Diverse documentaires, met veel materiaal over archeologie en sociale bewegingen.
  • Ephemeral Films: Educatie- promotie- en andere niet-entertainment-filmpjes. Hieronder vallen Britse oorlogspropaganda-filmpjes, reclames voor drive-inbioscopen, oude filmpjes uit San Francisco en een collectie amateurfilms, verzameld door Skip Elsheimer.
  • Movies: Hieronder vallen onder andere meer dan duizend bioscoopfilms die in het publieke domein zijn gevallen, en een verzameling filmtrailers.
  • News & Public Affairs: Nieuws- en actualiteiten. Hieronder een verzameling nieuwsopnames van de aanslagen van 11 september, programma's over de oorlog in Irak, het programma Democracy Now! en een verzameling toespraken van George W. Bush.
  • Non-English Videos: Een verzameling niet-Engelse video's. De talen van de meeste video's zijn Arabisch, Duits, Chinees, Frans, Italiaans, Japans en Spaans.
  • Open Source Movies: Ingezonden filmpjes met een Creative Commons-licentie. Met meer dan 72000 filmpjes de grootste collectie.
Filmkenner Rick Prelinger digitaliseerde meer dan 2000 filmpjes voor Internet Archive

Geluidsopnames

Onder de categorie "Audio" bevinden zich meer dan 2,9 miljoen geluidsopnames. De muzieksectie omvat grotendeels muziek van onafhankelijke artiesten, die zich laten vertegenwoordigen door zogenaamde netlabels. Daarnaast is er een grote collectie live-opnames van artiesten, die een open beleid voeren ten aanzien van geluidsopnames van hun concerten, zoals de Grateful Dead, Jefferson Starship, Ryan Adams, en Alejandro Escovedo. Verder zijn er collecties audioboeken, gedichten, hoorspelen en colleges te vinden.

Omvang en opslag

De totale omvang van het archief bedroeg in 2003 ongeveer 100 terabyte aan gegevens, met een groeicijfer van 12 terabyte per maand. In 2004 bereikte het een grootte van meer dan een petabyte, met een groeicijfer van 20 terabyte per maand. Dit is inclusief 40 miljard webpagina's. Een kopie van de gegevens wordt ook bijgehouden in de Bibliotheca Alexandrina in het Egyptische Alexandrië. In oktober 2012 werd de mijlpaal van 10 petabyte bereikt.[2]

Licenties

De meeste films, boeken en geluidsopnames vallen onder het publieke domein of vallen onder de Creative Commons-licentie.
De live-opnames van artiesten kunnen bestaan omdat die artiesten een open beleid voeren bij hun optredens, maar dat maakt de muziek zelf nog niet vrij van auteursrechten.

Controverse

Verwijdering van Scientologysites

Eind 2002 verwijderde het Internet Archive verschillende websites uit de Wayback Machine die kritisch waren over Scientology.

De foutmelding die men kreeg bij opvragen van een archiefversie van een verwijderde website, zei dat verwijdering van het origineel was geschied op verzoek van de website zelf. Later bleek echter dat advocaten van de Scientologykerk geëist hadden dat het materiaal zou worden verwijderd en dat de websites zelf daar helemaal niet om hadden gevraagd.

Ongevraagd kopiëren

Critici wijzen op het gegeven dat de Internet Archive ongevraagd kopieën maakt van websites die niet onder een vrije licentie vallen (zoals het publieke domein of Creative Commons). Als reactie wijst Internet Archive erop dat de opgeslagen gegevens altijd op verzoek van de websites zelf verwijderd kunnen worden of dat websites met behulp van robots.txt de toegang voor Internet Archive kunnen blokkeren.

Zie ook

Algemeen

Voorbeelden Wayback Machine

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.