książki Google

Google Books (niemiecki: Google Books ) to największa prywatna kolekcja książek poddanych retrocyfryzacji . Jest własnością amerykańskiej firmy Google LLC . Kolekcja jest publicznie dostępna w postaci wyciągów. Według ich własnych informacji, ich celem jest udostępnienie wiedzy zapisanej w książkach przede wszystkim poprzez digitalizację do wyszukiwania pełnotekstowego . W 2019 roku, z okazji 15-lecia Google Books, firma ogłosiła, że ​​dysponuje skanami ponad 40 milionów książek w ponad 400 językach.

Tymczasowo puste półki na książki na Uniwersytecie Michigan : trwa cyfryzacja w Google Books, 2008 r.

opis

Książki Google czerpią z dwóch źródeł:

  • Google Print w węższym znaczeniu, – już nie kontrowersyjny – projekt współpracy z wydawcami oraz
  • Biblioteka Google , w której książki z dużych bibliotek akademickich są skanowane masowo, nawet bez uprzedniej zgody posiadacza praw, co było i jest prawnie kontrowersyjne.

historia

W październiku 2004 r. firma Google Print zaprezentowała się na Targach Książki we Frankfurcie (konferencja prasowa z udziałem założycieli Google, Sergeya Brina i Larry'ego Page'a ). W grudniu 2004 r. wyniki wyszukiwania zeskanowanych książek zaczęły pojawiać się na listach wyników angielskiego interfejsu wyszukiwania Google.com. Do 2015 roku Google postanowił przeskanować 15 milionów książek. To około 4,5 miliarda stron. Od kwietnia 2005 r. prowadzone są osobne poszukiwania zawartości programu. W październiku 2005 roku na Targach Książki we Frankfurcie zaprezentowano interfejs użytkownika w języku niemieckim i innych językach. 4 listopada 2005 r. strona wyszukiwania została oficjalnie zaprezentowana z rozszerzonym wyszukiwaniem (możliwe są zapytania według okresu). 17 listopada 2005 r. firma Google ogłosiła zmianę nazwy usługi we własnym blogu firmy . Od tego czasu zapytania z print.google.com są przekazywane do books.google.com.

We wrześniu 2008 r. Google ogłosił, że będzie digitalizować gazety razem z wydawcami gazet z Ameryki Północnej. Wersja cyfrowa powinna umożliwiać wyszukiwanie i nawigację za pomocą przeglądarki internetowej i pojawiać się jak w wersji drukowanej wraz ze zdjęciami, nagłówkami i reklamami.

Obecnie istnieje współpraca z Archiwum Internetowym nad kilkoma książkami . Istnieją tam wydania w różnych formatach, ponieważ odniesienie do pliku PDF jest kierowane do Google (gdzie nie jest dostępny dla użytkowników spoza USA dla prac po 1864 r., patrz kontrowersje ).

W 2009 i 2012 roku rekordy danych dla przeglądarki Ngram Viewer zostały utworzone w różnych językach z korpusu Google Books .

Współpraca z wydawcami

Google otrzymuje książki od wydawców lub otrzymuje od nich pliki PDF . Książki są skanowane i umieszczane w indeksie jako e-teksty za pomocą OCR . Użytkownicy widzą jednocześnie tylko stosunkowo kilka stron pojedynczej książki. Po kilku stronach tylko zarejestrowani użytkownicy (bezpłatnie) mogą zobaczyć szereg innych stron. Dostęp do wielu stron jest od początku zablokowany. Po wyczerpaniu dziennego limitu nie można przeglądać kolejnych stron. Z reguły spis treści jest swobodnie dostępny, a często także indeks.

Google stara się chronić treści za pomocą pewnego rodzaju ochrony przed kopiowaniem („ zarządzanie prawami cyfrowymi ”). Jednak fakt, że nie zawsze jest to w pełni stosowane, można łatwo zrozumieć z różnych książek specjalistycznych. Przeglądane strony można nawet odczytać z pamięci podręcznej przeglądarki po wyświetleniu ich w przeglądarce internetowej za pomocą określonych metod i można je scalić w plik PDF za pomocą odpowiednich narzędzi.

Współpraca z bibliotekami

Notatka Google Books w Bibliotece Uniwersytetu Michigan, 2007.

Od około 2005 roku, Google został skanując cały inwentarz z University of Michigan biblioteki (ponad 7 milionów tomów), a także dużej części bibliotek US Uniwersytet na Harvard University i Stanford University , The New York Public Library , a w Europie Biblioteka Bodleian w tym University of Oxford . Uczestniczą również biblioteki z University of Virginia , University of Wisconsin-Madison , Princeton University , University of California oraz University of Texas w Austin .

Pod koniec 2006 roku do sieci bibliotek, które posiadają książki zdigitalizowane przez Google, dołączyły dwie inne instytucje: Biblioteka Narodowa Katalonii ( Biblioteca de Catalunya ) w Barcelonie oraz biblioteka Universidad Complutense Madrid .

6 marca 2007 roku Bawarska Biblioteka Państwowa w Monachium ogłosiła, że ​​będzie pierwszą niemiecką biblioteką współpracującą z projektem. Około miliona dzieł wolnych od praw autorskich pochodzących ze zbiorów historycznych i zbiorów specjalnych ma zostać zdigitalizowanych. Z projektu digitalizacji wyłączone są jedynie zbiory rękopisów i inkunabułów oraz rzadkie i szczególnie cenne druki historyczne. W styczniu 2014 r. Biblioteka Stanowa w Ratyzbonie , która podlega Bawarskiej Bibliotece Państwowej, ogłosiła, że ​​wraz z Google dokona digitalizacji swoich zbiorów wolnych od praw autorskich. Do końca 2014 roku 70 000 książek z biblioteki w Ratyzbonie powinno być dostępnych online.

W lipcu 2008 r. Biblioteka Miejska Lyonu ogłosiła, że ​​jest pierwszą francuską biblioteką, której książki zostały zdigitalizowane.

15 czerwca 2010 r. Austriacka Biblioteka Narodowa (ÖNB) ogłosiła, że ​​Google dokonuje digitalizacji swoich zasobów książek wolnych od praw autorskich. Koszt digitalizacji około 400 000 książek wynosi około 30 milionów euro i jest ponoszony przez Google. Dyrektor generalny ÖNB Johanna Rachinger określiła ten projekt jako jedno z największych partnerstw publiczno-prywatnych w austriackim krajobrazie kulturowym. 400 tys. tomów od XVI do XIX w. (z wyjątkiem tych, co do których przemawiają zastrzeżenia konserwatorskie) ma być utrwalonych w pełnym tekście – około 120 mln stron książki będzie wówczas dostępnych w sieci i bezpłatnie.

Ostra krytyka autorów i wydawców skłoniła Google do zawieszenia skanowania książek chronionych prawem autorskim do listopada 2005 roku. Do tego czasu posiadacze praw powinni wskazać, których książek nie chcą udostępniać ( rozwiązanie opt-out ). Chociaż Google powołuje się na dozwolony użytek z prawa Stanów Zjednoczonych i jest wspierany przez renomowanych prawników, wydawcy i stowarzyszenia autorów żądają, aby żadna książka nie była umieszczana w programie bez zgody ( opt-in ). W październiku 2005 roku autorzy i wydawcy ze Stanów Zjednoczonych złożyli pozwy przeciwko Google.

Zastosowanie w badaniach

Artykuł opublikowany w Science w grudniu 2010 r. donosił o możliwościach wykorzystania Google Books do ilościowej analizy kultury ( Culturomics ). Około 4% wszystkich kiedykolwiek wydrukowanych książek było dostępnych dla naukowców do ich analiz. Przekształcili książki w ogromną bazę danych słów w książkach ( n-gramów ). Podejście to można wykorzystać do badań w różnych dziedzinach , takich jak leksykografia , ewolucja gramatyki , pamięć zbiorowa , adaptacja technologii , sława , cenzura czy epidemiologia historyczna . Zespół badawczy oszacował z. B. na podstawie bazy danych, że zasobność słownictwa angielskiego w ostatnim stuleciu prawie się podwoiła. W innym badaniu porównano Sigmunda Freuda wpływy kulturowe z tym od Karola Darwina . Freud stracił więc wpływ; Darwin wyprzedził Freuda w 2005 roku.

krytyka

Problemy z wyborem kopii cyfrowych

Historyk Jean-Noël Jeanneney – były dyrektor Francuskiej Biblioteki Narodowej , który wraz z Gallicą prowadzi bezpłatny europejski projekt cyfryzacji – przekonuje, że Europa powinna stworzyć alternatywę dla projektu cyfryzacji Google. Przede wszystkim krytykuje Google za hegemonię języka angielskiego i efekt akumulacji (nazywa to „metodą przyciągającą wzrok”, termin „ranking” jest powszechny, zob.: PageRank ), który prowadzi do walki o celową uwagę czytelnika. następuje koncentracja na liderze listy. Silniejszy dostawca zawsze staje się silniejszy kosztem słabszego. To sprawia, że ​​Google jest szczególnie ważne dla reklamy. Jeanneney chciałaby przeciwstawić tej „kapitalistycznej” zasadzie Google modelem, w którym państwo ma głos w sprawach pamięci kulturowej. Dziewiętnaście bibliotek narodowych i uniwersyteckich w Europie podpisało apel francuskiej biblioteki narodowej, aby zapobiec zagrożeniu przez Stany Zjednoczone dominacji intelektualnej i kulturalnej.

Problem polegający na tym, że Google Books, ze swoją dominacją na rynku, zaciemnia alternatywy poprzez swoją praktykę selekcji, jest również obserwowany w Niemczech, zwłaszcza podczas badania specjalnych dziedzin, takich jak historia lokalna lub badanie dialektów.

Problemy z funkcjami wyszukiwania

Nie ma przyporządkowania do książek systematycznych grup tematycznych i słów kluczowych, jak w katalogach bibliotecznych . Nie ma możliwości wyboru książek z określonego tematu. Google zakłada, że ​​wystarczy wyszukiwanie tematyczne, aby objąć wszystkie słowa zawarte w książkach. Wpisanie słowa kluczowego może dostarczyć wyniki tylko w używanym języku. Nie bierze się pod uwagę, że wyszukiwania są często przeprowadzane w różnych językach i że słowo może być używane w kilku obszarach tematycznych i może mieć różne znaczenia.

Problemy z rozpoznawaniem tekstu

Zdigitalizowane przez Google. Widoczne palce personelu na skanerze.

W 2007 roku Der Spiegel skrytykował często słabąjakość OCR i nieodpowiednie metadane . Zdarzają się przypadki, w których nazwisko autora zostało błędnie rozpoznane przez OCR, przez co praca nie może zostać odnaleziona pod nazwiskiem autora. Widoczna jakość stron była wielokrotnie krytykowana. Dotyczy to punktów, w których brakuje fragmentów tekstu i widocznych palców oraz nakładek palców personelu skanera. Amerykański pisarz i artysta konceptualny Kenneth Goldsmith poświęcił temu zjawisku esej w 2013 roku w „ New Yorkerze” .

Prawo autorskie

Szczególnie w centrum uwagi znalazły się Google Books, ponieważ projekt obejmuje nie tylko dzieła nieobjęte prawami autorskimi, ale także dzieła chronione prawem autorskim. „Google Book Settlement” to propozycja ugody sporządzona przez firmę Google Inc. w odpowiedzi na pozew zbiorowy wniesiony przeciwko Tobie przez wydawców i autorów z USA. Okres sprzeciwu dla wydawców i autorów („okres braku uczestnictwa”) został przedłużony z 5 maja 2009 r. do 4 września 2009 r.

We wrześniu 2011 roku stało się znane:

„W zaskakującym posunięciu grupy autorów zaatakowały swoich jednorazowych partnerów uniwersyteckich pozwem, domagając się, aby szkoły przekazały cyfrowe zbiory i przestały współpracować z Google. Pozew otwiera nowy etap w walce o biblioteki cyfrowe i ma miejsce w tym samym tygodniu, w którym kontrowersyjna ugoda w sprawie książek Google ma umrzeć w sądzie”.

„W zaskakującym procesie stowarzyszenia autorów przegapiły swoich dawnych sojuszników, uniwersytety, z pozwem domagającym się, aby uniwersytety zrezygnowały z cyfrowych księgozbiorów i przestały współpracować z Google. Pozew otwiera nową rundę w walce o biblioteki cyfrowe i ma miejsce w tym samym tygodniu, w którym oczekuje się, że kontrowersyjna „ugoda dotycząca książek Google” zostanie zakończona w sądzie”.

W listopadzie 2013 r. w postępowaniu w sprawie praw autorskich przez American Authors Guild przeciwko Google wniosek o rozprawę z ławą przysięgłych został odrzucony, a jednocześnie stwierdzono, że Google Books jest zasadniczo objęty zasadą „ dozwolonego użytku ”. Wyrok ten został potwierdzony w drugiej instancji w październiku 2015 r.

Na przykład w USA Amerykańskie Stowarzyszenie Dziennikarzy i Autorów skrytykowało umowę jako handel wewnętrzny na korzyść zaangażowanych stron. Członkowie konkurencyjnego projektu Open Content Alliance krytykują też podejście Google, które nie uwzględnia praw autorskich .

Krytyka z Niemiec

Wyrok dotyczy również wydawców i autorów spoza Ameryki, ponieważ z Google można skontaktować się na całym świecie za pośrednictwem Internetu. Google mógłby wówczas udostępnić na swojej platformie dowolne prace niemieckojęzycznych autorów, którzy nie złożyli sprzeciwu w USA (termin 4 września 2009 r.), w formie cyfrowej, bez możliwości wyrażenia przez autorów sprzeciwu. Organizacja zbiorowego zarządzania Wort (VG Wort) opracowała własną propozycję regulacji dla niemieckiego rynku książki . Z jednej strony VG Wort krytykuje i pozywa aspekty tej możliwej ugody w amerykańskim sądzie. Z drugiej strony VG Wort współpracuje z Google nad planowaną realizacją umowy.

W niemieckim apelu z Heidelbergu pisarze, wydawcy i naukowcy wzywają do ochrony praw autorskich przed ich erozją. Manifest łączy dwie rzeczy: krytykę cyfryzacji książek Google z ogólną krytyką polityki otwartego dostępu. To podzieliło krytyków szybko rozwijającego się projektu cyfryzacji Google. W porównaniu z tym Apel Heidelbergowy widzi poważny problem. W Frankfurter Allgemeine Zeitung sugerowane jest podejrzenie „ugody kuponowej”, w ramach której samozwańczy adwokaci powoda negocjują „umowę” z Google w celu uzyskania hojnej opłaty i pozycji dominującej na rynku dla Google.

1 września 2009 r. rząd federalny skrytykował propozycję zjednoczenia. Domagała się stworzenia przynajmniej odrębnej klasy dla niemieckich posiadaczy praw i wyłączenia ich z ogólnego porozumienia. Ponadto naruszenie praw autorskich przez Google i zachowanie „najpierw zrób, potem zapytaj” utrudniają takie projekty, jak europejska biblioteka internetowa Europeana , która z góry chroni prawa autorskie.

Krytyka ze strony Komisji Europejskiej

Przy okazji przesłuchania eksperckiego przez Komisję Europejską w dniu 7 września 2009 r. firma Google zapowiedziała, że ​​odpowie na obawy wydawców i autorów oraz zaangażuje ich przedstawicieli w nadzór nad projektem Google Books . Książek, które są chronione prawem autorskim i które można dostarczyć w Europie, nie powinny być skanowane i udostępniane online bez wyraźnej zgody. Jednocześnie Komisja Europejska ogłosiła, że ​​chce zmienić prawo autorskie, ponieważ tylko USA skorzystałyby z zalet cyfryzacji i marketingu internetowego ze względu na stan prawny.

inne projekty

  • Open Content Alliance et al. wraz z konkurentem Yahoo , Internet Archive i Uniwersytetem Kalifornijskim skatalogował i zdigitalizował książki na dużą skalę w ramach Otwartej Biblioteki , jako bezpłatne treści i pod ścisłą ochroną praw autorskich.
  • Konkurent i ewentualny partner Google, internetowa firma wysyłkowa Amazon , oferuje komercyjne książki w pełnym tekście, ale skupia się na książkach aktualnie dostępnych w sklepach i chce promować sprzedaż książek.
  • MINERVA , europejski projekt koordynujący cyfryzację europejskich dóbr kultury.
  • Wikiźródła , darmowy projekt online do zbierania i edycji tekstów , które są wolne od praw autorskich ( domena publiczna ) lub są objęte wolną licencją .
  • Projekt Gutenberg to wolontariusze biblioteka cyfrowa dostępna przez Internet. Założona w 1971 roku jest najstarszą biblioteką cyfrową na świecie.
  • Gallica , projekt digitalizacji Francuskiej Biblioteki Narodowej.
  • Biblioteka Europejska , europejska inicjatywa, której celem jest poprawa dostępu do zdigitalizowanych dzieł krajów członkowskich.
  • Wielcy wydawcy, tacy jak Random House (Bertelsmann), zaczynają digitalizować swoje księgozbiory i udostępniać je wyszukiwarkom. Random House umieścił część swojego inwentarza książek (5000 tytułów, więcej w przyszłości) online w lutym 2007 roku. Dzięki Insight firma umożliwia swoim klientom przeszukiwanie określonej liczby stron na tytuł.
  • Inna biblioteka internetowa, Zeno.org, jest dostępna od października 2007 roku .
  • Libreka – niemiecka odpowiedź Börsenverein des Deutschen Buchhandels na Google Book Search

literatura

linki internetowe

Commons : Google Books  - kolekcja zdjęć, filmów i plików audio

Indywidualne dowody

  1. ^ 15 lat Książek Google. W: blog.google. 17 października 2019, dostęp 12 kwietnia 2020 .
  2. Książki Google: sąd USA spowalnia plany książkowe Google. zeit online, 23 marca 2011, dostęp 17 maja 2012 .
  3. Założyciele Google prezentują Google Print we Frankfurcie. heise online, 8 października 2004, dostęp 17 maja 2012 .
  4. Książki Google: Richter wywiera presję na strony sporu. zeit Online, 9 kwietnia 2010, dostęp 17 maja 2012 .
  5. ^ Jen Grant, kierownik ds. marketingu produktów : Ocenianie Book Search po okładce. Oficjalny blog Google, 17 listopada 2005, w archiwum z oryginałem na 8 listopada 2017 roku ; dostęp 20 listopada 2018 r .
  6. ^ Punit Soni: Wprowadzanie historii do sieci, jedna gazeta na raz . googleblog.blogspot.com 8 września 2008
  7. Na przykład z książki „Active Directory for Windows Server 2008” autorstwa Addison-Wesley, ISBN 978-3-8273-2740-6 prawie cała treść książki jest dostępna w niektóre dni w Internecie
  8. ^ Jens Redmer: Bawarska Biblioteka Państwowa staje się największym partnerem bibliotecznym nieanglojęzycznym. W: Wewnątrz Google Book Search. 6 marca 2017, dostęp 20 marca 2017 .
  9. ^ Klaus Ceynowa: „UMOWA BSB-GOOGLE”. (PDF; 3,5 MB) Milion książek z Bawarskiej Biblioteki Państwowej online. W: Magazyn Biblioteczny. Komunikaty Bibliotek Państwowych w Berlinie i Monachium nr 1/2008. s. 4-8 , zarchiwizowane z oryginału w dniu 21 listopada 2010 r .; Źródło 17 maja 2012 .
  10. ^ State Library Regensburg: Wydarzenia i raporty ( Memento od 10 listopada 2014 w Internet Archive )
  11. Google dokonuje digitalizacji Biblioteki Miejskiej w Lyonie , derstandard.at, 13 lipca 2008 r.
  12. APA: Google digitalizuje Bibliotekę Narodową. Zarchiwizowane z oryginału w dniu 16 grudnia 2013 r .; Źródło 13 lutego 2012 .
  13. ^ John Bohannon: Google otwiera książki do nowych kulturoznawstwa (PDF; 184 kB). W: Science, tom 330, 17 grudnia 2010. s. 1600.
  14. Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, Zespół Google Books, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, Erez Lieberman Aiden: Ilościowa analiza kultury na podstawie milionów zdigitalizowanych książek . W: Science, Vol. 331, 16.12.2010. s. 176-182.
  15. Peter Bürger: Ponury o Google Books . Telepolis , 6 stycznia 2012 r.
  16. a b Przykłady patrz: Wyszukiwanie książek w Google . W: Grüner Anzeiger , 12.11.2009 , s. 30.
  17. Malte Herwig: Opróżniona biblioteka . W: Der Spiegel, 12/2007, s. 186 f.
  18. krytyka na blogowej stronie VÖBB (Stowarzyszenia Bibliotekarzy Austriackich) ; Źródło 10 lutego 2013 February
  19. Kenneth Goldsmith: The Artful Accidents of Google Books. Pobrano 13 października 2020 r. (Amerykański angielski).
  20. a b Google Book Settlement. Google, archiwum z oryginałem na 10 lutego 2013 roku ; dostęp 20 marca 2017 r. (w języku angielskim).
  21. Rozprawa w sprawie ugody w Google została przełożona, oczekiwanie na Ugodę 2.0. Zarchiwizowane z oryginału w dniu 19 marca 2013 r .; Źródło 17 maja 2012 .
  22. a b ASJA nazywa zmienioną ugodę Google „zasadniczo niesprawiedliwą wobec autorów”. Amerykańskie Stowarzyszenie Dziennikarzy i Autorów, 18 lutego 2010, zarchiwizowanych od oryginału na 25 lutego 2012 roku ; dostęp 19 marca 2017 r. (w języku angielskim).
  23. ^ Jeff Roberts: Autorzy dla uniwersytetów: zrezygnuj z Google Books - paidContent. 12 września 2011, dostęp 20 marca 2017 .
  24. heise.de : Książki Google uznane za legalne po ośmiu latach w sądzie. 15 listopada 2013 . Źródło 15 listopada 2013 .
  25. heise.de : Sąd Apelacyjny potwierdza: Google Books jest legalne w USA. 16 października 2015, dostęp 16 października 2015 .
  26. Google Book Settlement Nadszedł czas na interwencję rządu federalnego – FAZ. Źródło 17 maja 2012 .
  27. Wyszukiwarka książek Google Obiekty rządu federalnego - Spiegel Online. Źródło 17 maja 2012 .
  28. Koncesje dla wydawców europejskich? Focus Online, 7 września 2009 r.
  29. Komisja Europejska chce zmienić prawa autorskie Handelsblatt, 7 września 2009
  30. Stuart Applebaum: Insight, nowo uruchomiona usługa cyfrowego wyszukiwania i przeglądania oferująca ponad 5000 tytułów Random House, Inc. w USA (plik PDF; 31 kB), informacja prasowa, 27 lutego 2007 r.
  31. ^ Usługa internetowa Insight , losowy dom