REKLAMA

Sztuczna inteligencja na pirackich książkach. Oto jak szkoliła się MetaAI

2025-04-08 08:10
publikacja
2025-04-08 08:10

Największa kradzież dzieł w historii ludzkości, czyli jak Meta szkoliła swoją sztuczną inteligencję na pirackich książkach. Legalne opcje uznano za "nieracjonalnie drogie" i za "niezwykle powolny" proces.

Sztuczna inteligencja na pirackich książkach. Oto jak szkoliła się MetaAI
Sztuczna inteligencja na pirackich książkach. Oto jak szkoliła się MetaAI
fot. Dado Ruvic / / FORUM

O sztucznej inteligencji głośno jest od lat. Choć dopiero dziś coraz częściej mamy okazję z nią obcować. Dużym problemem dla wyszkolenia sztucznej inteligencji okazała się jednak potrzeba olbrzymich ilości tekstów wysokiej jakości.

Co ważne, książki są jednym z najłatwiej dostępnych źródeł tekstu. W przeciwieństwie do stron zawierających treści optymalizowane pod wyszukiwarki (SEO), są źródłem wysokiej jakości. To o tyle istotne, ponieważ AI karmiące się AI obniża własną jakość, a przecież w sieci mnóstwo treści już zostało wygenerowanych przez sztuczną inteligencję. Dlatego też książki sprzed 2020 roku dają gwarancję, że nie zawierają treści powstałych przy jej użyciu.

Jak ujawnił "The Atlantic", Mark Zuckerberg, dyrektor generalny Mety, zatwierdził korzystanie z LibGen (skrót od "Library Genesis"), czyli nielegalnego repozytorium plików, które było źródłem treści wykorzystywanych do trenowania modelu AI Mety. LibGen powstał ok. 2008 roku w Rosji, to system, w którym znajduje się ponad 7,5 mln plików z książkami i 81 mln plików z pracami badawczych. To jedna z największych internetowych pirackich bibliotek na świecie, jednak przydatna dla wielu studentów (i jak się okazuje nie tylko ich).

Zdaniem "The Atlantic" pracownicy Mety rozmawiali z wieloma firmami o zakupie licencji do książek w celu wykorzystania ich w pracach nad AI, jednak efekty były niezadowalające. "Wydaje mi się to nieracjonalnie drogie" — napisał jeden z pracowników na wewnętrznym czacie firmy. Starszy menedżer z zespołu pracującego nad Llama 3 dodał, że byłby to również "niezwykle powolny" proces.

Po tym jak sprawa wyszła na jaw, środowiska autorskie z całego świata chcą pozwać Metę. Francuscy wydawcy i autorzy już w marcu 2025 r. ogłosili taki plan. Vincent Montagne, prezes Krajowego Związku Wydawców, podczas konferencji prasowej oskarżył Metę o "nieprzestrzeganie praw autorskich i pasożytnictwo". W Polsce Unia Literacka (stowarzyszenie broniące praw autorów)
także zachęca autorów do sprawdzenia bazy danych "The Atlantic".

- Mamy do czynienia z największą kradzieżą dzieł w historii ludzkości. Kradzieżą, na którą pozwalają rządy. Nawet Unia Europejska, mimo wysiłków ze strony organizacji zrzeszających twórców, takich jak European Writers Council, reaguje poniżej oczekiwań. Siła tzw. big techów, póki co jest obezwładniająca. A przecież piractwo jest kradzieżą, za które należy karać - mówi cytowana przez "Gazetę Wyborczą" Grażyna Plebanek, pisarka zaangażowana w działania Unii Literackiej.

Oprac. JM

Źródło:
Tematy
Orange Nieruchomości
Orange Nieruchomości
Advertisement

Komentarze (20)

dodaj komentarz
blind-oln
W Polsce więzieniem straszą jak ktoś film z internetu ściągnie. Kiedy wniosek o aresztowanie Zuckerberga?
samsza
Jeżeli jesteś Korsarzem i działasz w imieniu władcy na podstawie wystawionego przez niego listu kaperskiego, to nie jesteś piratem...
:)
inwestor.pl
Korporacja jak ukradnie to wrzuci to w koszty, które zapłacą... jej klienci, a jak ukradnie szaraczek to idzie do paki. Taka to równość wobec prawa.
samsza
Mnisi przez stulecia tworzyli księgi, to już nie ma praw autorskich, nakarmić tą cenną wiedzą AI i po kłopocie.
elistheo
I co im zrobią ? Będzie trochę krzyku i tyle.
Tą sytuacje obrazuje stare chińskie przysłowie: "Prawo jest jak płot - żmija zawsze się prześliźnie, tygrys zawsze przeskoczy, a bydło przynajmniej się nie rozłazi, gdzie nie powinno."
meliska
Meta mogłaby lobbować za ograniczeniem absurdalnie długich praw autorskich. Mieliby wtedy legalny dostęp do literatury starszej niż 30, 40 lat. Ale nie. Zamiast tego wolą kraść, bo wiedzą, że są bezkarni.
tomitomi
tak masz rację ; każda informacja jest towarem z którego bezpłatnie/bezkarnie korzystają , rozwijając/tworząc bazę danych za friko !
zoomek
"Mark Zuckerberg, dyrektor generalny Mety, zatwierdził korzystanie z LibGen (skrót od "Library Genesis"), czyli nielegalnego repozytorium plików, które było źródłem treści wykorzystywanych do trenowania modelu AI Mety. LibGen powstał ok. 2008 roku w Rosji, to system, w którym znajduje się ponad 7,5 mln plików z książkami "Mark Zuckerberg, dyrektor generalny Mety, zatwierdził korzystanie z LibGen (skrót od "Library Genesis"), czyli nielegalnego repozytorium plików, które było źródłem treści wykorzystywanych do trenowania modelu AI Mety. LibGen powstał ok. 2008 roku w Rosji, to system, w którym znajduje się ponad 7,5 mln plików z książkami i 81 mln plików z pracami badawczych. To jedna z największych internetowych pirackich bibliotek na świecie, jednak przydatna dla wielu studentów (i jak się okazuje nie tylko ich)."
No to co?
Jakieś podateczki kary dla CIAowej firemki Cukierberga?
tomitomi
ludzie ! zrozumcie , że AI to typowe pasożytnictwo - ten pasożyt żywi się i rozwija , informacjami które sami mu dostarczacie ! - za darmo !

Powiązane: Sztuczna inteligencja

Polecane

Najnowsze

Popularne

Ważne linki