Categories: AI nel businessBlog

Rilevatori di contenuti AI. Ne valgono la pena? | AI nel business #38

Oggi, gli sviluppatori di rilevatori di contenuti AI li presentano come strumenti per garantire l’autenticità. La domanda è, valgono la fiducia e l’investimento? In questo articolo, esamineremo come funzionano i rilevatori di contenuti AI, perché potrebbero estinguersi, quali sfide portano e i dilemmi etici che pongono.

Rilevatori di contenuti AI

I rilevatori di contenuti AI si basano su modelli linguistici simili a quelli utilizzati per generare contenuti AI. Possono essere suddivisi in quelli il cui compito è controllare l’origine di immagini, testi e musica generati con il supporto dell’intelligenza artificiale. Ogni tipo di “rilevatore AI” funziona in modo leggermente diverso, ma nessuno di essi può distinguere con assoluta certezza tra contenuti creati da esseri umani e contenuti generati da AI.

I rilevatori di immagini generate da AI stanno assumendo un ruolo sempre più importante a causa del potere dei media di generare notizie false. Analizzano anomalie, stili e modelli distintivi e cercano segni lasciati da modelli come DALL-E.

Tra i rilevatori utilizzati per identificare le immagini spicca lo strumento “AI or Not” di Optic, che utilizza database di immagini generati da Midjourney, DALL-E e Stable Diffusion. Sebbene i risultati siano incerti, è un passo verso lo sviluppo di metodi di identificazione più precisi in futuro.

Fonte: AI or Not (https://www.aiornot.com/)

Dietro il funzionamento dei rilevatori AI che riconoscono testi generati da AI ci sono algoritmi avanzati che analizzano la struttura e la scelta delle parole del testo, e poi riconoscono schemi specifici dell’AI. Si avvalgono di:

  • classificatori – un algoritmo che classifica il testo e controlla stile, tono e grammatica. Ad esempio, una descrizione di prodotto che potrebbe adattarsi a qualsiasi prodotto del suo tipo potrebbe essere classificata come una creazione AI,
  • embeddings (incapsulamenti) – rappresentazioni numeriche delle parole che consentono alle macchine di comprendere il contesto del loro utilizzo. È grazie a loro che il programma “comprende” che un testo con una selezione monotona di parole può essere il lavoro di un’AI,
  • perplessità – che è una misura dell’imprevedibilità di un testo. I testi scritti da esseri umani tendono ad avere una perplessità più alta, sebbene testi che sono intrinsecamente semplici, utilitari nella forma tipica, o scritti da stranieri possano essere erroneamente classificati come generati da AI,
  • diversità (burstiness) – questo fattore descrive la variabilità nella lunghezza e nella struttura delle frasi. Gli esseri umani tendono a scrivere testi più variati rispetto all’intelligenza artificiale.

Gli elementi sopra menzionati vengono utilizzati insieme dai rilevatori di contenuti AI per valutare se ci troviamo di fronte a un testo creato dall’uomo o da una macchina.

Perché utilizzare i rilevatori di contenuti AI?

I rilevatori di contenuti AI operano in una varietà di settori – dall’istruzione al marketing e al reclutamento. Ecco i principali motivi per averli come strumento di supporto nella valutazione, ma non come prova definitiva se il contenuto è stato generato:

  • Identificazione di foto modificate da AI che ritraggono persone famose – per rilevare se la foto rappresenta una situazione reale,
  • Prevenzione della disinformazione – nel contesto della lotta alla disinformazione, i rilevatori di contenuti AI efficaci aiutano i moderatori dei social media a rilevare la diffusione di informazioni false per identificare ed eliminare contenuti ripetitivi generati da bot,
  • Limitazione della pubblicazione di testi a basso valore – i rilevatori di contenuti AI possono aiutare gli editori a rifiutare testi contenenti informazioni generiche generate da ChatGPT, Bing o Bard dopo aver digitato una semplice query.

Tuttavia, vale la pena ricordare che l’origine del testo non è la base per il calo del ranking di un sito da parte di Google. Il blog del Google Search Center afferma che è fondamentale per Google “premiare contenuti di qualità indipendentemente da come vengono creati […]. L’automazione è stata a lungo utilizzata per generare contenuti utili, come punteggi sportivi, previsioni meteorologiche e trascrizioni. L’AI può aprire nuovi livelli di espressione e creatività ed essere uno strumento chiave per supportare la creazione di ottimi contenuti web.”

Inaffidabilità dei rilevatori di contenuti AI. Realtà o mito?

Sebbene i rilevatori di contenuti AI siano onnipresenti, la loro efficacia può essere discutibile. I principali problemi sono:

  • bassa efficienza nel rilevare contenuti AI,
  • problemi con falsi positivi, così come
  • difficoltà nell’adattare i rilevatori a modelli AI nuovi e in rapida diversificazione e miglioramento.

I test condotti da OpenAI hanno mostrato che il loro classificatore ha riconosciuto il testo generato da GPT solo nel 26% dei casi. Un esempio interessante dell’inaffidabilità dei generatori può essere visto in un esperimento condotto da TechCrunch, che ha mostrato che lo strumento GPTZero ha identificato correttamente cinque dei sette testi generati da AI. Mentre il classificatore di OpenAI ha identificato solo uno.

Fonte: GPTZero (https://gptzero.me/)

Inoltre, c’è il rischio di ricevere un falso positivo, cioè identificare un testo scritto da un umano come generato da AI. Ad esempio, l’inizio del secondo capitolo del Don Chisciotte di Miguel de Cervantes è stato contrassegnato dal rilevatore di OpenAI come molto probabilmente scritto da intelligenza artificiale.

Sebbene gli errori nell’analisi di testi letterari storici possano essere considerati una curiosità divertente, la situazione diventa più complicata quando vogliamo utilizzare i rilevatori come strumenti per valutare i testi. La Costituzione degli Stati Uniti è stata contrassegnata da ZeroGPT come il 92,15% scritta da intelligenza artificiale. E, secondo uno studio pubblicato da ricercatori della Stanford University, il 61% dei saggi TOEFL scritti da studenti non madrelingua inglese è stato classificato come generato da AI. Sfortunatamente, non ci sono dati su quanto sia alta la percentuale di testi erroneamente classificati come positivi in altre lingue.

Un altro problema è il cambiamento di classificazione nei successivi passaggi del rilevatore. Questo perché spesso accade che un rilevatore come ZeroGPT o Scribbr cambi la classificazione di frammenti di testo, che contrassegna come generati da AI una volta e come scritti da umani un’altra volta.

Fonte: Scribbr (https://www.scribbr.com/ai-detector/)

I rilevatori di immagini e video AI sono utilizzati principalmente per identificare deepfake e altri contenuti generati da AI che possono essere utilizzati per diffondere disinformazione.

Gli attuali strumenti di rilevamento come Deepware, Illuminarty e FakeCatcher non forniscono risultati sui loro test di affidabilità. Nel contesto legale del rilevamento di materiale visivo generato da AI, ci sono iniziative per aggiungere filigrane alle immagini AI. Tuttavia, questo è un modo molto inaffidabile – si può facilmente scaricare un’immagine senza filigrana. Midjourney adotta un approccio diverso alla filigranatura, lasciando agli utenti la decisione se vogliono filigranare un’immagine in questo modo.

Evitare il rilevamento da parte dell’AI. È possibile e come?

Gli imprenditori dovrebbero essere consapevoli che i rilevatori di contenuti AI non sono un sostituto della valutazione della qualità umana e non sono sempre affidabili. I loro problemi pratici di manutenzione possono presentare notevoli difficoltà, così come cercare di evitare che il proprio contenuto venga classificato come generato da AI. Soprattutto quando l’AI è semplicemente uno strumento nelle mani di un professionista – cioè, non è “contenuto generato da AI”, ma piuttosto “contenuto creato in collaborazione con AI.”

È relativamente semplice aggiungere qualcuno ai materiali generati in modo che il modo in cui vengono creati sia davvero difficile da rilevare. Se la persona che utilizza l’AI generativa sa quale effetto ottenere, può semplicemente modificare manualmente i risultati.

La domanda di base riguarda il motivo per cui vogliamo evitare il rilevamento se il contenuto è stato generato da AI.

  • Se si tratta di una questione etica e riguarda, ad esempio, la paternità di ricerche scientifiche pubblicate – ci si deve affidare all’etica professionale dello scienziato e all’uso responsabile degli strumenti basati su AI.
  • Se il datore di lavoro desidera che i dipendenti rinuncino all’uso dell’AI – rimane un accordo contrattuale per l’uso dell’intelligenza artificiale generativa.

Solleva anche la questione se vogliamo promuovere un uso responsabile dell’AI attraverso divieti e detrattori (ZeroGPT e GPTZero!), o attraverso un apprezzamento della trasparenza, della costruzione di fiducia e dell’uso onesto delle tecnologie avanzate.

Fonte: ZeroGPT (https://www.zerogpt.com/)

Riepilogo

La risposta alla domanda se i rilevatori di contenuti AI valgano la pena di essere utilizzati è tutt’altro che chiara. I rilevatori di contenuti AI sono ancora in fase di sviluppo e il loro futuro è difficile da prevedere. Una cosa è certa: evolveranno insieme allo sviluppo della tecnologia AI. I progressi nell’AI, inclusa la crescente capacità dei modelli linguistici di imitare lo stile di scrittura umano, significano che il rilevamento dei contenuti AI potrebbe diventare ancora più complicato. Per le aziende, questo è un segnale per seguire questi sviluppi e non fare affidamento solo sugli strumenti, ma sulla loro valutazione del contenuto e della sua idoneità per lo scopo per cui è stato creato. E utilizzare l’intelligenza artificiale in rapida evoluzione in modo saggio.

Se ti piace il nostro contenuto, unisciti alla nostra comunità di api operose su Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Esperto di JavaScript e istruttore che forma i dipartimenti IT. Il suo obiettivo principale è aumentare la produttività del team insegnando agli altri come cooperare efficacemente durante la programmazione.

View all posts →

Robert Whitney

Esperto di JavaScript e istruttore che forma i dipartimenti IT. Il suo obiettivo principale è aumentare la produttività del team insegnando agli altri come cooperare efficacemente durante la programmazione.

Share
Published by
Robert Whitney

Recent Posts

Il ruolo dell’IA nella moderazione dei contenuti | IA nel business #129

Le aziende si confrontano con la gestione di una vasta quantità di contenuti pubblicati online,…

2 days ago

Analisi del sentiment con l’IA. In che modo aiuta a guidare il cambiamento nel business? | IA nel business #128

nell'era della trasformazione digitale, le aziende hanno accesso a un'ammontare senza precedenti di dati sui…

2 days ago

Migliori strumenti di trascrizione AI. Come trasformare lunghe registrazioni in riassunti concisi? | AI nel business #127

Sapevi che puoi ottenere l'essenza di una registrazione di diverse ore da un incontro o…

2 days ago

Generazione video con intelligenza artificiale. Nuovi orizzonti nella produzione di contenuti video per le aziende | AI nel business #126

Immagina un mondo in cui la tua azienda può creare video coinvolgenti e personalizzati per…

2 days ago

LLMOps, o come gestire efficacemente i modelli di linguaggio in un’organizzazione | AI nel business #125

Per sfruttare appieno il potenziale dei Modelli di Linguaggio di Grandi Dimensioni (LLM), le aziende…

2 days ago

Automazione o aumento? Due approcci all’IA in un’azienda | IA nel business #124

Nel 2018, Unilever aveva già intrapreso un percorso consapevole per bilanciare le capacità di automazione…

3 days ago