大約在13世紀末,「人類口腔發出的聲音」,來自古法語 voiz,意指「聲音、言語;詞語、說法、謠言、報告」(現代法語為 voix)。這又源自拉丁語 vocem(主格為 vox),意指「聲音、發聲、呼喊、語言、詞語」(同源詞還有意大利語 voce、西班牙語 voz),而這些詞都與 vocare(「呼叫」)有關,最終源自原始印歐語根 *wekw-,意為「說話」。
到了1300年左右,「特定的音調、聲音特質或語調」的意思開始出現。14世紀初期,這個詞專指個體的聲音。約1600年,「歌唱者的能力」這一含義也被證實。
在中世英語中,這個詞有時用來形容鬼魂、神祇、半人馬、青蛙等。在14世紀初,它還被用作表達無生命物體(如風、水、雷聲)的媒介,甚至抽象概念(如法律、名聲、榮譽、真理),以及比喻意義上的血液和心臟。到1865年,這個詞甚至被用來指龍蝦。
在語法學中,「動詞的形式或變化,顯示主語與動作之間的關係」的含義出現於14世紀末。
14世紀末,「表達情感等的方式」的意思開始流行,最初多用於形容神祇等。當時的 common voice 意指「人民的聲音」。到了15世紀中期,它被用來指「在立法機構中發言或投票的權利」。1855年,這個詞進一步演變為「表達的意見或選擇」。1590年代,它開始專指「發言者、講者」,而在此之前,它還有比喻意義,指「表達某種觀點的人,倡導者」(約14世紀末)。在《懷克里夫講道集》(約1425年)中,施洗約翰被稱為「vois of Goddis werd」(上帝話語的聲音)。因此,後來出現了 Voice of America(美國之音)等表達。
1911年,這個詞被用來指「看不見的靈魂或力量,特別是在精神疾病的語境中,如 hear voices(聽到聲音)」。
這個詞取代了古英語的 stefn(「聲音」),該詞源自原始日耳曼語 *stemno,最終來自原始印歐語 *stomen-(參見 stoma)。