Digitaaliset arkistonhoitajat työskentelevät julkisen datan säilyttämiseksi katoamiselta

Image by Bernard Goldbach, from Flickr

Digitaaliset arkistonhoitajat työskentelevät julkisen datan säilyttämiseksi katoamiselta

Reading Time: 2 min

Updated 2 times since publishing

Jo yli 30 vuoden ajan Internet Archive’s Wayback Machine on säilyttänyt hallituksen verkkosivustoja ja tutkimukselle välttämättömiä tietojoukkoja, kuten Spectrum:n uudessa raportissa yksityiskohtaisesti kuvataan.

Kiire? Tässä ovat nopeat faktat:

  • Wayback Machine ylläpitää olennaista hallituksen dataa, joka toimii elintärkeänä materiaalina tieteelliselle ja insinööritieteelliselle tutkimukselle.
  • Trumpin toisen presidenttikauden aikana yli 8 000 hallituksen verkkosivua ja tietokantaa katosi julkiselta saatavuudelta.
  • Harvardin yliopiston Library Innovation Lab onnistui säilyttämään 311 000 tietojoukkoa, jotka kuuluivat Data.gov-kokoelmaan.

Nämä tiedot, jotka tulevat virastoilta kuten NASA ja National Science Foundation, tarjoavat olennaista dataa tiedemiehille ja insinööreille. Jos ne katoavat, tutkimuksen pätevyys ja historiallinen tarkkuus ovat vaarassa, kuten Spectrum on huomauttanut.

Hallituksen tietojen poistaminen ei ole uusi ilmiö. 9/11-iskujen jälkeen Bushin hallinto poisti turvallisuussyistä miljoonia tavuja tietoa. Obama otti erilaisen lähestymistavan ja avasi vuonna 2009 Data.gov -sivuston yleisön saataville, kertoo Spectrum.

Trumpin ensimmäisellä kaudella Ympäristötiedon ja -hallinnon aloitteen tutkijat havaitsivat, että jotkut hallituksen verkkosivut olivat saavuttamattomissa, ja viittaukset ”ilmastonmuutokseen” oli pyyhitty pois useilta sivuilta, sanoo Spectrum.

Trumpin toisen kauden aikana datan säilyttämiseen liittyvät huolenaiheet ovat kärjistyneet. Helmikuussa The New York Times raportoi, että yli 8 000 hallituksen verkkosivua ja tietokantaa oli otettu pois käytöstä.

Jotkut näistä ovat sittemmin palanneet, mutta Grist havaitsi muutoksia, mukaan lukien termien kuten ”ilmastonmuutos” ja ”puhdas energia” poistaminen. Helmikuun 11. päivä seurasi oikeudellisia haasteita, ja liittovaltion tuomari määräsi tietyt CDC:n ja FDA:n tietokannat palautettavaksi, kuten Spectrum raportoi.

Tämän menetyksen torjumiseksi digitaaliset arkistonhoitajat ovat ryhtyneet toimiin. Harvard Law Schoolin Library Innovation Lab on kopioinut Data.gov:n koko 16-teratavun arkiston, joka sisältää yli 311 000 tietoaineistoa. He käyttävät automatisoituja kyselyjä API:en kautta pitääkseen sen päivitettyinä päivittäin.

Arkistonhoitajat pelaavat elintärkeää roolia tiedon suojelemisessa säilyttämällä historiallisia tietoja tuleville sukupolville. Elintärkeän tiedon menetys heidän poissaolonsa seurauksena johtaisi julkisten tietueiden uudelleenkirjoittamiseen, mikä rajoittaisi tulevia tutkimusmahdollisuuksia.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back