Ang Stichting Brein ay kumukuha ng malaking halaga ng ilegal na data para sa AI training offline

Huling na-update ang artikulong ito noong Agosto 14, 2024

Ang Stichting Brein ay kumukuha ng malaking halaga ng ilegal na data para sa AI training offline

Stichting Brein

Ang Stichting Brein ay kumukuha ng malaking halaga ng ilegal na data para sa AI training offline

Ang organisasyon ng copyright na si Stichting Brein ay nagsagawa ng offline na Dutch dataset, isang koleksyon ng data, na nilayon para sa pagsasanay ng artificial intelligence (AI). Ayon sa organisasyon, ito ang unang pagkakataon na nangyari ito sa Netherlands.

Si Brein mismo ay nagsasalita tungkol sa isang “malaking dataset” na, ayon sa organisasyon, ay binubuo ng mga ilegal na kopya ng sampu-sampung libong libro, milyon-milyong linya mula sa mga artikulo ng balita mula sa mga website tulad ng Nu.nl at mga subtitle ng hindi mabilang na mga pelikula at serye sa TV mula sa ilegal. pinagmumulan. Sinabi rin ng direktor na si Bastiaan van Ramshorst na alam niya kung sino ang lumikha, ngunit hindi niya masabi dahil sa privacy.

Gamitin ang set ng data

Ang dataset ay inilaan upang sanayin ang isang tinatawag na modelo ng wika, sa jargon ang mga ito ay tinatawag na malalaking modelo ng wika. Ang gumawa ng dataset ay nangako kay Brein nang nakasulat na hindi na ito gagamitin at nagbigay din ng impormasyon tungkol sa kung sino ang nakatanggap nito. Sinusuri na ngayon ng pundasyon kung ang data ay aktwal na ginamit ng mga modelo ng AI. Kung ganoon ang kaso, mananagot ang mga partido.

Ang materyal na lumalabag sa copyright ay isang pangunahing problema kapag nagsasanay ng AI. Kamakailan, sinaliksik na malinaw na lumalabas na ang mga gawa ng mga gumagawa ng Dutch na imahe ay ginamit nang walang pahintulot nila upang sanayin ang mga kilalang AI image generator, kabilang ang DALL-E at Midjourney.

Sa US, kasalukuyang may demanda sa pagitan ng The New York Times at OpenAI, ang gumagawa ng ChatGPT. Inaakusahan ng pahayagan ang kumpanya ng paggamit ng napakalaking halaga ng mga artikulo sa pahayagan upang sanayin ang AI nang walang pahintulot. Naniniwala ang OpenAI na pinahihintulutan ang paggamit ng data.

Pagtatatahi kay Brein

Ibahagi sa mga kaibigan

Be the first to comment

Leave a Reply

Your email address will not be published.


*