Voglio presentare all'utente una funzione di "sintesi vocale" (simile al pulsante google translate "ascolta").
Sto pensando a un pulsante che mostra un volto umano che parla. Ecco una bozza fatta da sé (sì, il ragazzo sembra un po 'spaventoso).
Sarebbe autoesplicativo?
O quale potrebbe essere una grande UX per tale funzione?
Sono d'accordo con Vitaly. L'immagine che hai pubblicato sembra opposta a ciò che vuoi effettivamente rappresentare. Questi sono alcuni esempi che puoi usare per inventare il tuo. Sono abbastanza simili, ma dovrebbero darti un'idea
da http://practicalandroidapps.com/pdf_to_speech.php
da http://storymind.com/final_draft.htm
da https://labs.ericsson.com/developer-community/blog/text-speech-tts-api-released
Penso che trasmetta esattamente il messaggio opposto: questa è un'icona per la sintesi vocale o per alcuni software di riconoscimento vocale. Prova una bolla che esce da un altoparlante o dallo schermo di un computer.
Immagino che posizionerai questo simbolo vicino al testo che verrà pronunciato. In tal caso, è sufficiente solo un simbolo audio standard. La chiave qui è il contesto. Hai del testo, un indicatore audio implica l'audio. Il discorso non deve necessariamente essere chiamato.
Ora, se hai del testo con registrazioni umane reali e altro testo con generazioni TTS, allora userei due simboli diversi che indicano il tipo di audio presentato.