Si apre l’era delle tecnologie testo voce. Delle potenzialità ne parliamo con Valeria Sandei, ceo di Almawave.
Quale il valore aggiunto per le imprese che adottano le tecnologie testo-voce?
Le tecnologie di Natural Language processing testuali e vocali sono ormai pervasive nella vita di tutti i giorni. Pensiamo ai dispositivi mobili che permettono di interagire, facendo domande in linguaggio naturale e ricercando contenuti di varia natura, per arrivare ai vari ambiti di comando e controllo che permettono di attivare funzioni ed eseguire task soltanto utilizzando la voce. Queste tecnologie sono ormai sempre più determinanti per disegnare nuovi modelli di interazione che le aziende possano mettere in campo per migliorare l’experience dei loro clienti, rendere più efficiente la struttura produttiva e disegnare un progressivo “lift to digital” efficace. Queste piattaforme, che prevedono componenti di interazione vocale o testuale in linguaggio naturale, consentono all’utente di esprimersi come nelle conversazioni di tutti i giorni e necessitano dunque di una grande capacità di interpretazione contestualizzata del contenuto e del dialogo.
Come si sta muovendo Almawave su questo fronte?
Su questi aspetti cruciali per il successo dei servizi digitali, Almawave ha investito molto, sviluppando tecnologie state of the art e distintive che permettono di cogliere molto efficacemente non solo l’intent del cliente, ovvero che cosa realmente il cliente sta comunicando, ma anche di gestire i diversi momenti della conversazione, permettendogli di risolvere la propria esigenza facilmente. Comprendere le intenzioni del cliente nel contesto dell’intera conversazione, permettendo di gestire l’alternarsi dello scambio è infatti l’aspetto essenziale per poter correttamente abilitare funzionalità, fornire informazioni o eseguire transazioni. È su questa partita che Almawave gioca una sfida importante con risultati di eccellenza, in oltre 30 lingue e un assoluto dominio in lingua italiana, che ci permettono di operare a tutto tondo sulle tematiche di natural language processing e understanding.
Che tipo di soluzioni mette a disposizione Almawave?
L’offerta di Almawave copre tutta la filiera delle componenti che permettono di abilitare servizi basati sulla comprensione del linguaggio naturale, inclusa la parte di automatic speech recognition. Su quest’ultima attività Almawave, attraverso la controllata PerVoice, è particolarmente competitiva e si è aggiudicata importanti contratti internazionali negli ultimi mesi. Il riconoscimento della voce viene efficacemente completato da una componente distintiva di natural language understanding. Si rendono così disponibili ai clienti piattaforme convergenti di agente virtuale testo e voce che permettono una interazione semplice e risolutiva e consistente sui vari canali di contatto. Ciò rappresenta un ulteriore elemento di particolare distinzione in quanto implica la possibilità di avere risultati uniformi, creando delle esperienze self o “blended” con i canali tradizionali coerenti. Un elemento distintivo, che ci premia quando lavoriamo in Italia, è la grande accuratezza che raggiungiamo nella comprensione della lingua, specialmente in contesti complessi e verticali di dominio dove l’artificial intelligence necessita di specificità, non consentita dalle piattaforme dei large vendor, impostate su comprensione generalista, o in alcuni casi con investimenti più limitati rispetto ad altre lingue. Questo aspetto per il successo di un progetto fa la differenza.
Funzioni di comando e controllo in Natural Language: quali sono le criticità che le aziende si trovano ad affrontare e come si possono risolvere?
Quando si parla di uso della voce per attivare funzioni di comando e controllo, il tema diventa particolarmente interessante e sensibile, perché il risultato raggiungibile non è soltanto legato alla capacità delle tecnologie cognitive di interpretare un contenuto, ma anche all’ambiente in cui questo contenuto viene espresso. Almawave ha investito molto sull’implementazione di piattaforme verticali che consentano davvero di utilizzare la voce come driver per attivare processi e rendicontare attività o ricercare contenuti, anche in ambienti con più parlatori o rumorosi o integrati a vari device fisici. Un ambito di utilizzo su cui siamo avanzati molto è ad esempio quello del Field Service Management per la manutenzione in area Telecom, energia, media, trasportati o manifatturiero. Mi riferisco ad attività che si svolgono sul campo e che spesso richiedono di avere mani libere e di poter immediatamente rendicontare l’intervento svolto o di ricercare facilmente informazioni e contenuti utili allo svolgimento dell’intervento stesso. Solo uno studio estremamente approfondito ha permesso di integrare queste tecnologie all’interno dei device e permettere di acquisire delle performance adeguate nel trattamento dell’audio in ambiente aperto e rumoroso. Analogamente Almawave sta lavorando sull’integrazione con diversi dispositivi di realtà virtuale e realtà aumentata, nonché su tematiche di embedding delle tecnologie disponibili e degli algoritmi di natural language understanding, all’interno di dispositivi di grandi provider di mercato.
Usare la voce o il testo per il Field o per altri processi e attività: a che tipo di aziende si rivolge l’offerta?
Questo tipo di tecnologie e di capabilities altamente avanzate, rispetto alle quali sono ancora relativamente pochi i provider su scala mondiale che riescono a competere efficacemente, hanno un mercato estremamente vasto e in costante espansione. L’obiettivo – ed è evidentemente tematica di enorme attualità e di frontiera – è permettere un accesso altamente semplificato a qualunque tipo di sistema che sia però risolutivo per colui che lo usa – sia il cliente, sia un utente interno nell’ambito di un sistema aziendale corporate, sia un manutentore, sia una persona che all’interno del proprio modello domotico voglia interagire con un robot. Le sfide sono molteplici e, trovandoci di fronte ad un’opportunità di mercato vastissima, quello che premierà sarà delineare le opportune verticalizzazioni e la focalizzazione dei modelli da mettere a punto nei vari use case. Nonostante una crescita double-digit, questo settore è ancora all’inizio, con vaste potenzialità su scala mondiale. Le aziende che possono aver necessità di utilizzare questo tipo di tecnologie sono potenzialmente tutte, perché vanno a coprire sia la semplificazione dei servizi di caring, sia la semplificazione dei sistemi corporate all’interno di organizzazioni, sia l’integrazione con i device, ad esempio qualunque azienda produca un oggetto, potrà prevedere di comandarlo vocalmente. Sul mercato quello che premierà sarà la capacità di adattare queste capacità al dominio. La sfida è comprendere bene la lingua, l’intento, le informazioni fornite spontaneamente nella conversazione e il contesto entro cui una richiesta di un cliente, di un utente, di un cittadino, viene posta.
Quali collaborazioni avete avviato con altri vendor e quali gli obiettivi di queste intese?
Poiché la tecnologia funziona in un ecosistema, avendo Almawave messo a punto una distintività facilmente percepibile sulle tematiche di natural language understanding, riesce ad essere un partner valido anche di grandi software vendors, come ad esempio Microsoft, con cui stiamo sviluppando importanti collaborazioni o Tibco, per le attività di supporto all’analisi dei processi. Almawave è riuscita a mettere a disposizione competenze e tecnologia distintive che permettono anche alle tecnologie di large vendors di funzionare in maniera ancora più efficace nella comprensione del linguaggio naturale, soprattutto nello specifico del mercato italiano. Sempre di più per Almawave questo tipo di collaborazioni diventerà essenziale, perché l’unicità della nostra capacità nel comprendere il contenuto e la lingua su voce e testo, e’ un vantaggio competitivo essenziale per la creazione di soluzioni di successo, con risultati apprezzati da chi le usa.