La funzione Azure Speech to Text di Microsoft è alimentata da modelli di rete neurale profonda e consente la trascrizione audio in tempo reale che può essere impostata per gestire più altoparlanti.
Come parte del servizio cloud Azure, è possibile eseguire Azure Speech to Text nel cloud, on premises, o in edge computing. In termini di prezzi, è possibile eseguire la funzione in un contenitore gratuito con una singola richiesta concorrente per un massimo di 5 ore di audio gratuito al mese.
Watson Speech to Text
Ragioni per comprare
Il Watson Speech to Text di IBM è la terza soluzione cloud-nativa su questa lista, con la funzione alimentata da AI e apprendimento automatico come parte dei servizi cloud di IBM.
Mentre c’è la possibilità di trascrivere il discorso al testo in tempo reale, c’è anche la possibilità di convertire in batch i file audio ed elaborarli attraverso una serie di opzioni di lingua, frequenza audio e altre opzioni di output.
È anche possibile etichettare le trascrizioni con etichette di altoparlanti, formattazione intelligente e timestamp, nonché applicare l’editing globale per parole o frasi tecniche, acronimi e per l’uso di numeri.
Come altri servizi cloud, Watson Speech to Text permette una facile implementazione sia nel cloud che on-premises dietro il proprio firewall per garantire la sicurezza.
Le migliori app gratuite per la sintesi vocale
- Google Gboard
- Just Press Record
- Speechnotes
- Transcribe
- Riconoscimento vocale Windows 10
Google Gboard
Testo facilmente accessibile al discorso
Ragioni per comprare
Ragioni per evitare
Se hai già un dispositivo mobile Android, allora, se non è già installato, scaricate Google Keyboard dal Google Play store e avrete un’app text-to-speech istantanea. Anche se è progettato principalmente come una tastiera per l’input fisico, ha anche un’opzione di input vocale che è direttamente disponibile. E poiché tutta la potenza dell’hardware di Google è dietro di essa, è uno strumento potente e reattivo.
Se questo non è abbastanza, ci sono caratteristiche aggiuntive. Oltre a quelle di input fisico come lo swiping, è anche possibile attivare immagini nel testo utilizzando i comandi vocali. Inoltre, può anche lavorare con Google Translate, ed è pubblicizzato come un supporto per oltre 60 lingue.
Anche se Google Keyboard non è uno strumento di trascrizione dedicato, in quanto non ci sono comandi di scelta rapida o di modifica del testo direttamente integrati, fa tutto ciò che serve da uno strumento di trascrizione di base. E poiché è una tastiera, significa che dovrebbe essere in grado di lavorare con qualsiasi software che si può eseguire sul vostro smartphone Android, in modo da poter modificare il testo, salvare ed esportare utilizzando quello. Ancora meglio, è gratuito e non ci sono pubblicità che ti impediscono di usarlo.
Just Press Record
Uno strumento di trascrizione cloud-based
Ragioni per comprare
Ragioni per evitare
Se vuoi un’app dedicata alla dettatura, vale la pena controllare Just Press Record. Si tratta di un registratore audio mobile che viene fornito con caratteristiche come la registrazione con un solo tocco, la trascrizione e la sincronizzazione iCloud tra i dispositivi. La cosa bella è che si rivolge praticamente a tutti ed è estremamente facile da usare.
Quando si tratta di registrare le note, tutto quello che dovete fare è premere un pulsante, e si ottiene un tempo di registrazione illimitato. Tuttavia, la cosa davvero grande di questa app è che offre anche un potente servizio di trascrizione.
Per mezzo di esso, è possibile trasformare rapidamente e facilmente il discorso in testo ricercabile. Una volta trascritto un file, è possibile modificarlo dall’interno dell’app. C’è anche il supporto per più di 30 lingue, il che lo rende l’applicazione perfetta se si lavora all’estero o con un team internazionale. Un’altra bella caratteristica è il riconoscimento dei comandi di punteggiatura, assicurando che le vostre trascrizioni siano prive di errori di battitura.
Questa app è sostenuta dalla tecnologia cloud, il che significa che è possibile accedere alle note da qualsiasi dispositivo (che è online). Sei in grado di condividere file audio e di testo anche con altre app iOS, e quando si tratta di organizzarli, puoi visualizzare le registrazioni in un file completo.
Speechnotes
Potenziato dalla tecnologia Google
Ragioni per comprare
Ragioni per evitare
Speechnotes è un’altra app di dettatura facile da usare. Un tocco utile qui è che non è necessario creare un account o qualcosa del genere; basta aprire l’app e premere sull’icona del microfono, e il gioco è fatto.
L’app è alimentata dalla tecnologia di riconoscimento vocale di Google. Quando stai registrando una nota, puoi facilmente dettare i segni di punteggiatura attraverso i comandi vocali, o utilizzando la tastiera di punteggiatura integrata.
Per rendere le cose ancora più facili, è possibile aggiungere rapidamente nomi, firme, saluti e altri testi di uso frequente utilizzando una serie di tasti personalizzati sulla tastiera integrata. C’è anche la capitalizzazione automatica, e ogni modifica apportata a una nota viene salvata sul cloud.
Quando si tratta di personalizzare le note, è possibile accedere a una pletora di caratteri e dimensioni del testo. L’app è scaricabile gratuitamente dal Google Play Store, ma è possibile effettuare acquisti in-app per accedere alle funzioni premium (c’è anche una versione browser per Chrome).
Transcribe
Software di dettatura con intelligenza artificiale
Ragioni per comprare
Ragioni per evitare
Commercializzato come un assistente personale per trasformare video e memo vocali in file di testo, Transcribe è una popolare app di dettatura che è alimentata da AI. Ti permette di fare trascrizioni di alta qualità semplicemente premendo un pulsante.
L’app può trascrivere automaticamente qualsiasi video o promemoria vocale, supportando oltre 80 lingue da tutto il mondo. Mentre è possibile creare facilmente note con Transcribe, è anche possibile importare file da servizi come Dropbox.
Una volta trascritto un file, è possibile esportare il testo grezzo in un elaboratore di testi da modificare. L’app è scaricabile gratuitamente, ma dovrai fare un acquisto in-app se vuoi sfruttare al massimo queste caratteristiche a lungo termine. C’è una prova disponibile, ma è fondamentalmente solo 15 minuti di trascrizione gratuita. Transcribe è disponibile solo su iOS, però.
Riconoscimento vocale di Windows 10
Il sistema operativo desktop di Microsoft ha completamente integrato il riconoscimento
Ragioni per comprare
Ragioni per evitare
Se non vuoi pagare per un software di riconoscimento vocale, e stai eseguendo l’ultimo sistema operativo desktop di Microsoft, allora potresti essere contento di sapere che Windows 10 ha effettivamente alcune capacità di riconoscimento vocale molto solide integrate nel sistema operativo.
Windows Speech Recognition, come è fantasiosamente chiamato – e si noti che questo è qualcosa di diverso da Cortana, che offre comandi di base e capacità di assistente – permette non solo di eseguire comandi tramite controllo vocale, ma offre anche la possibilità di dettare nei documenti.
Il tipo di precisione che si ottiene non è paragonabile a quella offerta da artisti del calibro di Dragon, ma poi di nuovo, non si paga nulla per utilizzarlo. È anche possibile migliorare la precisione allenando il sistema leggendo il testo e dandogli accesso ai vostri documenti per imparare meglio il vostro vocabolario. Vale sicuramente la pena indulgere in un po’ di allenamento, in particolare se avete intenzione di utilizzare la funzione di riconoscimento vocale un po’. L’azienda è stata impegnata a vantarsi dei suoi progressi in termini di riconoscimento vocale alimentato da reti neurali profonde, e Microsoft ci sta certamente preparando ad aspettarci cose impressionanti in futuro. L’obiettivo finale probabile è che Cortana faccia tutto, dai comandi vocali alla dettatura.
Attiva il riconoscimento vocale di Windows dirigendoti verso il pannello di controllo (cercalo, o fai clic destro sul pulsante Start e selezionalo), poi clicca su Facilità di accesso, e vedrai l’opzione per ‘avviare il riconoscimento vocale’ (qui troverai anche l’opzione per impostare un microfono, se non lo hai già fatto).
App per il riconoscimento vocale del testo da considerare
A parte ciò che è già stato coperto sopra, c’è un numero crescente di app disponibili su tutti i dispositivi mobili per lavorare con il riconoscimento vocale del testo, anche perché la tecnologia di riconoscimento vocale di Google è disponibile per l’uso.
SpeechTexter è un’altra app speech-to-text che mira a fare di più che registrare la vostra voce in un file di testo. Questa app è costruita specificamente per lavorare con i social media, in modo che piuttosto che inviare messaggi, email, Tweets, e simili, potete registrare la vostra voce direttamente sui siti di social media e inviare. Ci sono anche una serie di pacchetti di lingue che è possibile scaricare per lavorare offline se si desidera utilizzare più di un semplice inglese, che è comodo.
Voice Notes è una semplice applicazione che mira a convertire il discorso in testo per prendere appunti. Questo è rinfrescante, in quanto mescola la tecnologia di riconoscimento vocale di Google con una semplice app per prendere appunti, quindi ci sono più funzioni con cui giocare. È possibile categorizzare le note, impostare promemoria, e importare/esportare il testo di conseguenza.
ListNote Speech-to-Text Notes è un’altra applicazione speech-to-text che utilizza il software di riconoscimento vocale di Google, ma questa volta fa un lavoro più completo di integrazione con un programma per prendere appunti rispetto a molte altre applicazioni. Le note di testo registrate sono ricercabili, e si possono importare/esportare con altre applicazioni di testo. Inoltre c’è un’opzione di protezione con password, che cripta le note dopo i primi 20 caratteri in modo che l’inizio delle note sia ricercabile da voi. C’è anche una funzione di organizzatore per le tue note, utilizzando la categoria o il colore assegnato. L’app è gratuita su Android, ma include pubblicità.
iTranslate Translator è un’app speech-to-text per iOS con una differenza, in quanto si concentra sulla traduzione delle lingue vocali. Non solo mira a tradurre le diverse lingue che si sentono in testo per la propria lingua, ma lavora anche per tradurre le immagini come le foto che si potrebbero scattare di segni in un paese straniero e ottenere una traduzione per loro. In questo modo, iTranslate è un’applicazione molto diversa, che prende l’idea del discorso-testo in una direzione nuova e, a detta di tutti, lo fa bene. Lavorando con più di 100 lingue, la versione di base è gratuita, ma la versione pro costa 4,99 dollari per un mese, o è possibile abbonarsi annualmente per 39,99 dollari.
Altri servizi vocali/testuali
Si consideri anche la lettura di queste guide relative a software e app:
- Il miglior software text to speech
- I migliori servizi di trascrizione
- Le migliori cuffie Bluetooth