Tietoja Google-teoshausta
Esittely
Ajatuksia ja mielipiteitä
Yleisiä ohjeita

Yhteistyökumppaniohjelma
Kustantajille ja kirjailijoille
Liity nyt
Yhteistyökumppaniohjeita

Kirjastoyhteistyö
Esittely
Kirjastoyhteistyökumppanit
Kirjastonhoitajan ohje

Tietoja Google-teoshausta

Yleiskuvaus | Historia | Faktoja ja harhakäsityksiä

Google-teoshaun historia

Alussa oli Google-teoshaku.

No, ei ihan. Mutta teoshakuprojekti on samanikäinen kuin Googlekin. Vuonna 1996 Googlen perustajat Sergey Brin ja Larry Page olivat mukana jatko-opiskelijoina Stanfordin yliopiston Digital Library Technologies Project -yksikön tukemassa tutkimusprojektissa. Heidän tavoitteenaan oli saada digitaaliset kirjastot toimimaan, ja heidän ajatuksensa oli seuraava: tulevaisuudessa suuret kirjakokoelmat on digitoitu, lukijat indeksoivat teosten sisältöä selaimen avulla, analysoivat niiden välisiä yhteyksiä ja määrittävät jokaisen teoksen merkittävyyden ja käytettävyyden selvittämällä kuinka paljon ja minkälaatuisia lainauksia teoksesta on muissa teoksissa.

He kehittivät BackRub-robotin, jonka nykyaikaisen tapa käsitellä perinteistä lainausanalyysiä inspiroi heitä kehittämään Googlen PageRank-algoritmit eli hakujen ydinteknologian, joka tekee Googlesta Googlen.

Jo silloin Larryllä ja Sergeyllä oli näkemys siitä miten ihmiset joka puolelta maailmaa voisivat etsiä haluamiaan teoksia ja löytää haluamansa tiedot. He eivät kuitenkaan voineet kuvitellakaan, että he olisivat myöhemmin käynnistämässä projektia, joka mahdollistaisi tuon näkemyksen toteutumisen. Tässä lyhyt kertaus tärkeimmistä kehitysaskeleista:

[2002]

Pieni joukko Googlen työntekijöitä käynnisti virallisesti salaisen books-projektin. He keskustelivat asiantuntijoiden kanssa erilaisista tulevaisuuden haasteista aloittaen yksinkertaisella, mutta erittäin tärkeällä kysymyksellä: kuinka kauan kestäisi kaikkien maailman kirjojen skannaaminen? Lopputuloksena oli yllättäen se, että kenelläkään ei ollut vastausta kysymykseen. Tyypilliseen Google-tapaan Larry Page päätti testata asiaa itse. Yhden toimistopäivän aikana hän ja Marissa Mayer, yksi ensimmäisistä Googlen tuotepäälliköistä, kääntelivät metronomin pitäessä tahtia 300-sivuisen teoksen sivut. Heiltä kesti 40 minuuttia teoksen läpikäyntiin.

Eri puolilla maailmaa oli samaan aikaan käynnissä merkittäviä digitointiprojekteja, kuten Kongressin kirjaston American Memory -projekti, Gutenberg-projekti, Million Book -projekti ja Universal Library -projekti, jotka innoittivat työryhmää lähtemään paikan päälle tutustumaan näihin projekteihin.

Osana tätä tietojenkeräysvaihetta Larry Page otti yhteyttä vanhaan opinahjoonsa Michiganin yliopistoon, joka on ollut edelläkävijä kirjastonsa digitoinnissa projekteillaan kuten JSTOR ja Making of America. Kun Larry kuuli, että arvio yliopiston kirjaston seitsemän miljoonan niteen digitoinnin kestosta oli 1 000 vuotta, hän kertoi yliopiston rehtorille Mary Sue Colemanille, että hän uskoo Googlen pystyvän auttamaan projektissa niin, että digitointi kestää vain kuusi vuotta.

[2003]

Työryhmän edustaja matkusti Phoenixiin, Arizonaan, ja osallistui hyväntekeväisyyskirjamessuille hankkiakseen teoksia, joilla voitaisiin testata skannaustekniikoita, jotka eivät tuhoaisi teoksia. Lukemattomien kokeilujen jälkeen työryhmä onnistui kehittämään skannaustavan, joka oli paljon hellävaraisempi kuin käytössä olleet pikaprosessit. Työryhmä oli tyytyväinen – ja teokset olivat vielä tyytyväisempiä.

Samaan aikaan tiimin ohjelmistosuunnittelijat ratkoivat vaikeita teknisiä ongelmia, joita esiintyi, kun teoksissa oli erikoisia kirjasinkokoja, epätavallisia fontteja tai muita odottamattomia erikoisuuksia – 430 eri kielellä.

[2004]

Sir Thomas Bodleyn vuonna 1602 perustaman Oxfordin yliopiston Bodleian-kirjaston tavoitteena on aina ollut palvella koko maailman eikä pelkästään yliopistomaailman tarpeita. Vieraillessaan tässä kuuluisassa kirjastossa työryhmä yllättyi iloisesti lämpimästä vastaanotostaan.

Hyllyjä kierreltäessä kirjastonhoitajat ottivat esiin vuosisatoja vanhoja leikkaamattomia teoksia, jotka ovat harvoin nähneet päivänvaloa. Ensimmäistä kertaa sitten Shakespearen aktiiviaikojen unelma siitä, että näitä teoksia voisi tarkastella valtava määrä ihmisiä aikaisemman pienen kirjallisuudentutkijajoukon lisäksi tuntui olevan saavutettavissa.

Vierailu oli lupaava, ja jatkotapaamiset ja keskustelut johtivat virallisen yhteistyön aloittamiseen kirjaston vertaansa vailla olevan yli miljoonan 1800-luvulta peräisin olevan vapaasti jaeltavan teoksen digitoimiseksi kolmen seuraavan vuoden aikana.

Samaan aikaan keskustelut maailman johtavien kustantajien kanssa alkoivat kantaa hedelmää. Lokakuussa Larry ja Sergey julkaisivat Google Print -ohjelman Frankfurtin kirjamessuilla Saksassa. Ensimmäisinä ohjelmaan liittyivät seuraavat kustantajat: Blackwell, Cambridge University Press, the University of Chicago Press, Houghton Mifflin, Hyperion, McGraw-Hill, Oxford University Press, Pearson, Penguin, Perseus, Princeton University Press, Springer, Taylor & Francis, Thomson Delmar ja Warner Books.

Joulukuussa ilmoitimme Googlen kirjastoyhteistyöohjelmasta, jonka mahdollisti yhteistyö Harvardin, Michiganin yliopiston, New Yorkin yleisen kirjaston, Oxfordin ja Stanfordin kanssa. Yhteensä näiden kirjastojen kokoelmien nidemäärän arvioidaan olevan yli 15 miljoonaa teosta.

[2005]

Vuosi Google Printin julkaisemisen jälkeen työryhmä palasi Frankfurtin kirjamessuille kertomaan, että nyt ohjelmaan voidaan hyväksyä osanottajia kahdeksasta Euroopan maasta: Itävallasta, Belgiasta, Ranskasta, Saksasta, Italiasta, Alankomaista, Espanjasta ja Sveitsistä.

Tavoitteenamme on järjestää maailman tietovarannot ja saattaa ne kaikkien käyttöön, ja sen mukaisesti lahjoitimme kolme miljoonaa dollaria Kongressin kirjastolle, jotta se voisi rakentaa World Digital -kirjaston, joka mahdollistaa harvinaisten ja ainutlaatuisten teosten käytön joka puolelta maailmaa. Laajensimme lisäksi kirjaston kanssa laatimaamme skannauksen pilottiohjelmaa niin, että se kattoi myös Kongressin kirjaston lakitieteellisen kirjaston historiallisesti arvokkaiden teosten digitoinnin.

Google nimesi Google Print -ohjelman uudelleen ja nimeksi tuli Google Books eli Google-teoshaku, joka vastaa paremmin sen käyttötapaa. Työryhmä myös vastasi kirjastoyhteistyöohjelman ympärillä kiehuneeseen keskusteluun osallistumalla julkiseen väittelyyn ohjelman taustalla vaikuttavista toimintaperiaatteista.

[2006]

Liikuttavassa puheessaan Yhdysvaltain kustannusalan kattojärjestön Association of American Publishersin (AAP) kokouksessa Michiganin yliopiston rehtori Mary Sue Coleman selitti miksi yliopisto liittyi kirjastoyhteistyöohjelmaamme korostaen teosten digitoinnin tärkeyttä esimerkiksi hirmumyrsky Katrinan tapaisten luonnonmullistusten takia ja toteamalla: "Me uskomme tähän ikuisesti."

Maaliskuussa osallistuimme Lontoon kirjamessuille, jossa osa kustantajayhteistyöohjelmamme osallistujista kertoi kokemuksistaan.

Pian tämän jälkeen pyysimme yhteistyökumppaneitamme kertomaan, haluaisivatko he myydä teosten online-käyttöoikeuksia lukijoilleen – niin että nämä voisivat lukea teoksia selaimestaan. Tämä on ensimmäinen uusi kustantajien kanssa kehittämistämme toiminnoista, joiden avulla he voivat kokeilla innovatiivisia teosten myyntitapoja internetissä.

Kesän aikana autoimme Shakespeare in the Park -ryhmää aloittamaan 50. toimintavuotensa ilmaisilla esityksillä Keskuspuistossa luomalla paikan, jossa saattoi etsiä kirjailijan näytelmät internetistä. Vieraillessamme New Yorkissa kävimme myös BOOK Expo America -messuilla ja annoimme yhdysvaltalaisille kustantajille ja kirjailijoille vähän esimakua siitä mitä käyttäjät näkevät, kun he liittyvät Google-teoshaun yhteistyökumppaniohjelmaan.

Kehitimme teoshakua lukuisilla parannuksilla niin, että siitä tuli entistä tehokkaampi ja helppokäyttöisempi. Ensin laajensimme vapaasti jaeltavien teosten käytettävyyttä lisäämällä Lataa PDF -painikkeen kaikkiin kyseisiin teoksiin. Muutamaa kuukautta myöhemmin julkaisimme uuden selainkäyttöliittymän, jonka avulla oli entistä helpompaa selata ja käyttää teoshakua. Uuteen käyttöliittymään lisättiin myös uudet Tietoja tästä teoksesta -sivut, jotka toivat sivuille tietoa teoksista Googlen algoritmien avulla – aluksi aiheeseen liittyvät muut teokset, valitut sivut ja viittaukset tieteellisistä tutkimuksista.

Syksyllä neljä uutta yliopistoa liittyi kirjastoyhteistyöohjelmaan: Kalifornian yliopisto, Madridin Complutense-yliopisto, Wisconsin-Madisonin yliopisto ja Virginian yliopisto.


[2007]

Uusi käyttöliittymä lähtökohtanamme etsimme jatkuvasti uusia tapoja, joilla käyttäjät voivat teoksia käyttää.

  • Paikat tässä teoksessa: fuusaus Googlen karttoihin antaa käyttäjille mahdollisuuden selata teoksia niissä mainittujen paikannimien perusteella (julkaisimme myöhemmin kokeellisen KML-kerroksen Google Earthiin, joka tekee päinvastaisen toimenpiteen – käyttäjä valitsee paikan ja me liitämme teokset siihen).
  • Suositut otteet: Loimme uuden tavan liikkua teosten välillä hakemalla tietyn otteen käyttöä eri teoksissa.
  • Oma kirjastoni: Käyttäjät voivat käyttää tehokasta Google-hakua omien kokoelmiensa sisällä. Käyttäjät voivat hallita omaa kirjastoansa ja jakaa sen sekä omat katsauksensa ja arvostelunsa muiden käyttäjien kanssa.
  • Uusi kotisivu (aluksi vain Yhdysvalloissa). Tarjosimme käyttäjille lisää tarttumapintoja heidän hakiessaan teoksia hakemistostamme.

Marissa Mayer esitteli universaalin haun Yhdysvalloissa, ja teoshausta tuli yhä oleellisempi osa Googlen hakutoimintoja.

Toukokuussa Lausannen yliopiston kirjasto ja Ghentin yliopiston kirjasto liittyivät teoshakuohjelmaan lisäten suuren määrän ranskan-, saksan-, flaamin- ja latinankielisiä teoksia sekä muunkielisiä teoksia. Eurooppalaisten kirjastojäsenten lukumäärä kasvoi näin kuuteen.

Heinäkuussa lisäsimme Näytä pelkkä teksti -linkin kaikkiin vapaasti jaeltaviin teoksiin. T.V. Raman kertoo, että tämä avaa teoksen erilaisille teknologioille, kuten näytönlukijoille ja Braille-näytöille, joiden avulla näkövammaiset käyttäjät voivat lukea teoksia yhtä helposti kuin muutkin käyttäjät.

Joulukuuhun mennessä teoshaun käyttöliittymä oli julkaistu yli 35 kielellä, kuten japaniksi tšekiksi ja suomeksi. Yli 10 000 kustantajaa ja kirjailijaa yli 100 maasta osallistuu Google-teoshaun yhteistyökumppaniohjelmaan. Kirjastoyhteistyöohjelma laajentui 28 yhteistyökumppaniin, joista seitsemän on kansainvälisiä yhteistyökumppaneita: Oxfordin yliopisto (Yhdistyneet kuningaskunnat), Madridin Complutense-yliopisto (Espanja), Katalonian kansalliskirjasto (Espanja), Lausannen yliopistokirjasto (Sveitsi), Ghentin yliopisto (Belgia) ja Keio-yliopisto (Japani).

Pyrimme tänä vuonna kehittämään teknologiaamme edelleen ja laajentamaan yhteistyötämme kustantajien ja yliopistojen kanssa kautta maailman. Seuraa uutisia …

©2011 Google - Etusivu - Tietoja Googlesta - Tietosuojakäytäntö