Kategorije: IT novice

Podjetja z umetno inteligenco zbirajo podatke s strani množičnih medijev v nasprotju z neposrednimi prepovedmi

Perplexity, ki svoj izdelek opisuje kot "brezplačni iskalnik z umetno inteligenco", je bil v zadnjih dneh deležen kritik. Kmalu po tem, ko ga je Forbes obtožil, da je ukradel njegov članek in ga ponovno objavil na več platformah, je Wired poročal, da Perplexity ignorira protokol za izključitev robotov ali robots.txt in odstranjuje svoje članke s svojega spletnega mesta in drugih publikacij Condé Nast. Tehnično spletno mesto The Shortcut je tudi obtožilo podjetje AI, da je odstranilo njegove članke. Zdaj je Reuters razkril, da Perplexity ni edino podjetje za umetno inteligenco, ki zaobide datoteke robots.txt in na spletnih mestih poišče vsebino, ki jo nato uporabi za usposabljanje svoje tehnologije.

Reuters je poročal, da je videl pismo, naslovljeno na založnike iz TollBit, zagonskega podjetja, ki jih povezuje s podjetji za umetno inteligenco, da lahko sklepajo licenčne pogodbe, in jih opozarja, da so se "agenti za umetno inteligenco iz različnih virov (in ne le iz enega podjetja) odločili zaobiti protokol robots.txt za prejemanje vsebin s spletnih mest." Datoteka robots.txt vsebuje navodila za iskalne robote, do katerih strani lahko in do katerih ne morejo dostopati. Spletni razvijalci ta protokol uporabljajo že od leta 1994, vendar je spoštovanje le-tega popolnoma prostovoljno.

V pismu TollBita ni bilo imenovano nobeno podjetje, vendar Business Insider pravi, da je izvedel, da OpenAI in Anthropic – izdelovalca klepetalnih robotov ChatGPT oziroma Claude – prav tako obideta signale robots.txt. Obe podjetji sta že povedali, da spoštujeta navodila »ne pajkaj«, ki jih spletna mesta postavijo v svoje datoteke robots.txt.

Med preiskavo je Wired ugotovil, da je stroj na Amazonovem strežniku, ki ga "gotovo upravlja Perplexity", zaobšel navodila robots.txt na njegovem spletnem mestu. Za potrditev, da Perplexity čisti svojo vsebino, je Wired posredoval naslove orodij podjetja iz svojih člankov ali kratke nasvete, ki opisujejo njihove zgodbe. Orodje naj bi dalo rezultate, ki so natančno parafrazirali njene članke "z minimalnim pripisom". In včasih je ustvaril celo netočne povzetke za članke – Wired pravi, da je chatbot lažno trdil, da poroča o določenem kalifornijskem policistu, ki je v enem primeru zagrešil kaznivo dejanje.

V intervjuju za Fast Company je izvršni direktor podjetja Perplexity Aravind Srinivas za publikacijo povedal, da njegovo podjetje "ne ignorira protokola za izključitev robotov in nato laže o tem." Vendar to ne pomeni, da nima koristi od botov, ki ignorirajo protokol. Srinivas je pojasnil, da podjetje poleg svojih uporablja iskalne bote tretjih oseb in da je bot, ki ga je prepoznal Wired, eden izmed njih. Ko je Fast Company vprašal, ali je Perplexity naročil ponudniku pajka, naj preneha brskati po spletnem mestu Wired, je rekel: "To je zapleteno."

Srinivas je zagovarjal prakso svojega podjetja in za publikacijo povedal, da protokol za izključitev botov "ni pravna podlaga" in predlagal, da bodo založniki in podjetja, kot je njegovo, morda morali vzpostaviti novo vrsto odnosa. Namignil je tudi, da je Wired namerno uporabil namige, da bi se klepetalni robot Perplexity obnašal tako, da običajni uporabniki ne bi dobili enakih rezultatov. Glede netočnih ugotovitev, ki jih je ustvarilo orodje, je Srinivas dejal: "Nikoli nismo rekli, da je klepetalni robot Perplexity netočen: 'Nikoli nismo rekli, da nikoli nismo imeli halucinacij.'

Preberite tudi:

Delite s prijatelji, znanci, družino in partnerji :-)
Julia Alexandrova

Kofetar. Fotograf. Pišem o znanosti in vesolju. Mislim, da je še prezgodaj, da bi srečali nezemljane. Spremljam razvoj robotike, za vsak slučaj ...

Pustite Odgovori

Vaš e-naslov ne bo objavljen. Obvezna polja so označena*