À la fin du XIIIe siècle, le terme désigne « le son produit par les organes vocaux de la bouche humaine ». Il provient de l'ancien français voiz, qui signifie « voix, parole ; mot, dicton, rumeur, rapport » (en français moderne, voix). Ce mot lui-même dérive du latin vocem (au nominatif vox), signifiant « voix, son, énoncé, cri, appel, discours, phrase, langue, mot » (à l'origine également de l'italien voce et de l'espagnol voz). Ce terme est lié à vocare, qui signifie « appeler », et remonte à la racine indo-européenne *wekw-, qui évoque l'idée de « parler ».
Vers 1300, le mot commence à désigner « le ton particulier, le caractère ou la qualité d'une voix ». Au début du XIVe siècle, il fait référence à la voix d'un individu. L'acception « capacité vocale d'un chanteur » apparaît vers 1600.
En moyen anglais, le terme est aussi utilisé pour désigner une voix de fantôme, de Dieu, d'un centaure, d'une grenouille, etc. Dès le début du XIVe siècle, il sert à exprimer la voix des objets inanimés (vent, eaux, tonnerre) et, par extension, des abstractions (loi, renommée, honneur, vérité), ainsi que de manière figurée pour évoquer le sang ou le cœur. En 1865, il est même utilisé pour parler des homards.
En grammaire, il désigne « la forme d'un verbe ou les inflexions qui montrent la relation entre le sujet et l'action », une acception qui apparaît à la fin du XIVe siècle.
Le sens « expression des sentiments, etc. » émerge à la fin du XIVe siècle, souvent en lien avec des entités divines. À cette époque, l'expression common voice désigne « la voix du peuple ». Au milieu du XVe siècle, le terme prend le sens de « droit ou privilège de parole ou de vote dans une assemblée législative ». En 1855, il évolue pour signifier « opinion ou choix exprimé ». Dans les années 1590, il désigne « celui qui parle, un orateur », après avoir eu une acception plus figurée au XIVe siècle, où il désignait « une personne qui exprime quelque chose, un défenseur ». Dans les Sermons wyclifistes (vers 1425), Jean-Baptiste est décrit comme un « vois of Goddis werd ». C'est ainsi qu'est née l'expression Voice of America, entre autres.
Le sens « esprit ou force invisible qui guide ou suggère » (surtout dans le contexte de la folie, comme dans hear voices, « entendre des voix ») apparaît en 1911.
Ce terme a remplacé l'ancien anglais stefn, qui signifiait « voix » et provenait du proto-germanique *stemno, lui-même issu de la racine indo-européenne *stomen- (voir stoma).