Sottotitoli automatici:
croce o delizia?
Vi sarà sicuramente capitato di incappare in un reel di Instagram con i sottotitoli o, se siete più tecnologici di noi, di usufruire in prima persona della possibilità che molti social ormai offrono di inserirli per voi nei vostri video. Vi sarà altresì capitato di notare però che, in molti casi, questi sottotitoli presentano:
- grammatica e/o sintassi incorretta;
- inserimenti casuali di lettere maiuscole;
- parole/espressioni che differiscono da quanto viene detto nell’audio (ci si riferisce, in particolare ma non esclusivamente, a parole straniere).
Per non parlare poi della forma in cui spesso questi sottotitoli si presentano:
- il testo si può interrompere in qualsiasi momento, a seguito di un qualsiasi elemento grammaticale e senza alcun utilizzo di punteggiatura;
- in caso di video lunghi o molto lunghi (come può capitare di trovare su Youtube), il testo compare in modo continuativo, senza pause o interruzioni di alcun tipo, anche al cambiare di argomento.
Qui di seguito ve ne riportiamo un esempio estratto da un’intervista di “Passa dal BSMT” che potete trovare online:
La loro creazione è opera della Macchina, dell’intelligenza artificiale e di software di riconoscimento vocale che, adeguatamente istruiti, trascrivono l’audio dei video e generano automaticamente, appunto, i sottotitoli, anche se, come detto, in modo spesso incorretto.
Ma se sono così incorretti, allora perché dare la possibilità agli utenti di usufruirne?
- In primo luogo, per una questione molto poco altruistica: il marketing e l’engagement del pubblico; stando infatti ad alcuni studi, la possibilità di leggere il testo incrementa il tempo medio di interazione dell’utente con una storia o un post;
- In secondo luogo, per una questione di aumento della fruizione del prodotto (che, ammettiamolo, è comunque strettamente correlata all’incremento dell’interesse del pubblico): a detta dei più, l’aver aggiunto la possibilità di inserire i sottotitoli automatici su ogni qualsivoglia forma di video o reel online rappresenta un passo in avanti da un punto di vista dell’accessibilità, in quanto permette a chiunque di usufruire di un qualunque contenuto (ci si riferisce, tra gli altri, a persone straniere, a persone sorde o ipoudenti, o, più in generale, a persone che in un dato momento non possono avere accesso all’audio del contenuto).
Noi saremo sicuramente di parte, ma vale davvero la pena di lasciare fare totalmente alla macchina il lavoro che potrebbe svolgere un essere umano? L’intelligenza artificiale non è (ancora) in grado di comprendere appieno sfumature vocali, contesti specifici o, tra le altre cose, riferimenti culturali, e conseguentemente compie errori che inficiano o persino impediscono la totale fruizione degli stessi sottotitoli. A questo si aggiunga che, in alcuni casi, il lavoro della macchina è talmente errato da dover richiedere l’intervento umano per correggere gli errori commessi.
Allora, da un punto di vista meramente lavorativo, ci chiediamo se valga davvero la pena di far lavorare la macchina al posto dell’uomo se poi quello stesso uomo è costretto a correggere la macchina; la questione economica sicuramente salta all’occhio in questo contesto, ma non varrebbe forse la pena di fare uno sforzo economico in più per fornire un servizio migliore? E a questo proposito, chi fornisce questo servizio racconta al mondo di fornirlo anche, e soprattutto, per questioni di servizio pubblico/accessibilità, ma è davvero questo quello che si ottiene se il servizio offerto non è corretto e dunque totalmente fruibile da parte dei destinatari?