Wenn man die Voice over IP Sprechqualität beurteilen möchte, dann sollte man sich vor Augen halten, dass sie vielen Einflüssen ausgesetzt ist. Das beginnt schon bei der Aufnahmequalität des verwendeten Mikrofons. Zwar ist hier die Entwicklung schon sehr weit fortgeschritten, aber dennoch sind die Minimikrofone in vielen Notebooks nicht ganz so empfindlich wie die, die in den Sprechmuscheln von Telefonen verwendet werden. Ein weiterer Einflussfaktor ist die Umwandlung der analogen Signale in digitale sowie die für den Transport der Daten notwendige Kodierung. Dadurch und den eigentlichen Transport durch die Leitungswege entsteht eine Verzögerung, die in der Fachsprache auch Latenz genannt wird. Überschreitet die Latenz einen gewissen Toleranzbereich, ist eine gute Voice over IP Sprechqualität nicht mehr erzielbar.
Deshalb legt man bei der Übermittlung digitalisierter Sprache auch sehr großen Wert darauf, diese Verzögerungen möglichst gering zu halten. Das kommt auch in der Gestaltung der bei Voice over IP verwendeten Übertragungsprotokolle zum Ausdruck. Hier steht die erzielbare Geschwindigkeit der Umwandlung, Kodierung und des Transports der Daten eindeutig im Vordergrund. Deshalb erfolgt auch keine Rückmeldung, in der der Erhalt der vollständigen Datenpakete bestätigt oder der erneute Versand einzelner Datenpakete gefordert wird. Das ist für die Erzielung einer guten Voice over IP Sprechqualität auch nicht erforderlich. Das Fehlen einzelner Datenpakete wird vom Nutzer gar nicht bemerkt. Einerseits umfassen die Datenpakete sowieso nicht mehr als maximal zwanzig Millisekunden übertragener Sprache und andererseits gibt es Möglichkeiten, dies durch den Einsatz intelligenter Software ausgleichen zu können. Dazu werden die Lücken entweder mit den aus benachbarten Paketen ermittelten Signalen aufgefüllt oder man greift zu dem Trick mit dem Komfortrauschen, das dem Anrufer signalisieren soll, dass die Verbindung zum Gesprächspartner noch immer besteht.
Ein weiteres Kriterium bei der Beurteilung der erreichbaren Voice over IP Sprechqualität ist die Nutzdatenrate der Leitungswege, über die die Datenpakete übertragen werden. Je nach aushandelten Bedingungen, für die SIP alias Session Initiation Protocol verantwortlich ist, werden bestimmte Codecs verwendet. Einige der Codecs für die Sprachübermittlung kommen auch mit niedrigen Nutzdatenraten sehr gut zurecht. Dazu gehört unter anderem MELP, das genau wegen dieser Eigenschaft in den Netzwerken des amerikanischen Militärs angewendet wird. Die größte Herausforderung bei einer guten Voice over IP Sprechqualität besteht immer noch überall dort, wo mobile Endgeräte verwendet werden. In diesem Bereich konnte sich die GSM Technologie durchsetzen, die aber zunehmend vom wesentlich leistungsfähigeren UMTS abgelöst wird. Hier kommen Faktoren wie die Entfernung vom jeweiligen Sendemast und die Geschwindigkeit der Bewegung hinzu.
Eines der größten Probleme bei der Voice over IP Sprechqualität ist die Dämpfung auf den Übertragungswegen. Diese wird durch den elektrischen Widerstand der Leitungswege und dem der dazwischen geschalteten Hardware beeinflusst. Sie wiederum sind dafür verantwortlich, dass vor allem bei längeren Leitungswegen von der Vermittlungsstelle zum Netzabschlussgerät viel Leistung verloren gehen kann, die sich wiederum negativ auf die Nutzdatenrate auswirkt. Bei Voice over IP in internen Netzwerken wirkt sich auch die vom Kommunikationsserver zur Verfügung gestellte Rechenleistung und die Art der für die Koordinierung verwendeten Software aus. Eine pauschale und allgemein gültige Aussage für die Voice over IP Sprechqualität ohne Kenntnis der individuellen Faktoren ist demzufolge nicht möglich.