Verso la fine del XIII secolo, il termine indicava "il suono prodotto dagli organi vocali della bocca umana." Derivava dall'antico francese voiz, che significava "voce, discorso; parola, detto, rumor, notizia" (in francese moderno voix). Questo, a sua volta, proveniva dal latino vocem (nominativo vox), che significava "voce, suono, espressione, grido, chiamata, discorso, frase, lingua, parola." La stessa radice è all'origine dell'italiano voce e dello spagnolo voz. È legata al verbo vocare, che significa "chiamare," e risale alla radice proto-indoeuropea *wekw-, che significava "parlare."
Intorno al 1300, il termine cominciò a essere usato anche per descrivere "il tono, il carattere o la qualità particolare di una voce." All'inizio del XIV secolo, si riferiva specificamente alla voce di un individuo. L'accezione "abilità di un cantante" è attestata a partire dal 1600.
In medio inglese, il termine era usato anche per descrivere la voce di fantasmi, divinità, centauri, rane, e simili. Già all'inizio del XIV secolo, era impiegato per esprimere il modo in cui oggetti inanimati (come il vento, le acque, il tuono) comunicavano, e successivamente anche per astrazioni (come la legge, la fama, l'onore, la verità) e in senso figurato per il sangue e il cuore. Nel 1865, il termine venne usato per riferirsi anche agli aragoste.
In ambito grammaticale, a partire dalla fine del XIV secolo, il termine indicava "la forma di un verbo o le sue inflessioni che mostrano la relazione tra soggetto e azione."
Verso la fine del XIV secolo, il termine assunse anche il significato di "espressione di sentimenti, emozioni," in particolare riferito a Dio e simili. L'espressione common voice si traduceva allora come "voce del popolo." A metà del XV secolo, cominciò a indicare il "diritto o privilegio di parlare o votare in un'assemblea legislativa." Nel 1855, il significato si evolse ulteriormente, indicando "l'opinione o la scelta espressa." Nel 1590, il termine assunse il significato di "chi parla, un oratore," mentre in precedenza era usato in senso figurato per descrivere "chi esprime qualcosa, un sostenitore" (fine XIV secolo). Nei Sermoni di Wycliffe (circa 1425), Giovanni Battista è descritto come "vois of Goddis werd." Da qui deriva anche Voice of America, e simili.
Il significato di "spirito o forza invisibile che guida o suggerisce" (soprattutto in contesti legati alla follia, come in hear voices (sentire voci) è attestato dal 1911.
Il termine ha sostituito l'antico inglese stefn, che significava "voce," derivante dal proto-germanico *stemno, e dalla radice proto-indoeuropea *stomen- (vedi stoma).