13世紀後半には「人間の口の声帯が発する音」を意味し、古フランス語の voiz(現代フランス語では voix)から派生しています。この言葉は、ラテン語の vocem(主格は vox)に由来し、「声、音、発声、叫び、呼びかけ、言語、言葉」といった意味を持ち、イタリア語の voce やスペイン語の voz も同じ語源です。さらに、このラテン語は「呼ぶ」という意味の vocare(印欧祖語の *wekw-「話す」に由来)とも関連しています。
1300年頃からは「特定の音色、声の特性や質」を指すようになり、14世紀初頭には「個々の声」を表すようになりました。「歌手の能力」を意味する用法は1600年頃から確認されています。
中英語では、幽霊や神、ケンタウロス、カエルなどの声を指すこともありました。また、14世紀初頭には風や水、雷などの無生物の声として、さらには法や名声、名誉、真実といった抽象的な概念の声や、比喩的に血や心臓の声を表すようにも使われました。1865年にはロブスターのことを指すようになりました。
文法用語として「動詞の形や活用で、主語と動作の関係を示すもの」を指すようになったのは14世紀後半です。
「感情の表現」といった意味は14世紀後半から神や神聖な存在に関連して使われるようになり、この頃には common voice(民衆の声)という表現も生まれました。15世紀中頃には「立法機関での発言権や投票権」を意味するようになり、1855年には「意見や選択の表明」を指すようになりました。1590年代には「話す人、スピーカー」を意味するようになり、14世紀後半には「何かを表現する人、擁護者」という比喩的な用法もありました。ウィクリフ派の説教(約1425年)では、洗礼者ヨハネが「vois of Goddis werd」(神の言葉の声)と表現されています。これにより、Voice of America(アメリカの声)などの表現が生まれました。
「見えない霊や力が導いたり、提案したりする存在」、特に精神的な問題に関連する「声が聞こえる」(頭の中で声を聞く)という意味は1911年から使われるようになりました。
この言葉は、古英語の stefn(声)を置き換えました。stefn は、原始ゲルマン語の *stemno に由来し、印欧祖語の *stomen-(stoma を参照)から派生しています。