Die VoIP Sprechqualität wird auch als QOS, also Quality of Service, angegeben. In der Vergangenheit bestand hier das Problem, dass die Verarbeitung und Übertragung der Sprache zu große Verzögerungen verursachte. Das schränkt den Komfort bei Voice over IP oft sehr stark ein. Mit der Entwicklung verschiedener Codecs zur Verschlüsselung und Komprimierung der zu übertragenen Sprachdaten versuchte man erfolgreich, hier Abhilfe zu schaffen. Das gelang unter anderem auch mit der Entwicklung von Codierungsverfahren, die mit niedrigen Nutzdatenraten klarkommen. Dazu gehört unter anderem MELP. Im Bereich der VoIP Sprechqualität im Mobilfunk war ein erster wichtiger Schritt GSM, das jetzt durch die Einführung der UMTS Technologie noch einmal zusätzlich verbessert werden konnte.
Die VoIP Sprechqualität wird von vielen Faktoren beeinflusst. Das wird deutlich, wenn man sich einmal die Kette an Geräten und Verbindungen anschaut, die die Sprachsignale vom Absender bis zum Empfänger durchlaufen muss. Dort sind Mikrofone, Verschlüsselungsprogramme, Funkverbindungen, Kabelverbindungen und Server mit eingebunden. Überall kommt es zu kleinen Verlusten und Verzögerungen. Diese Faktoren wurden bei der Entwicklung der Sprachcodecs alle mit berücksichtigt. Sie setzen auf eine möglichst reibungslose Übertragung, Verschlüsselung und Dekodierung der Sprache, um die Latenzen möglichst niedrig zu halten. Kommen hier Verzögerungen von mehr als zweihundert Millisekunden zusammen, geht man davon aus, dass eine qualitativ hochwertige Echtzeittelefonie nicht mehr erreicht werden kann. Deshalb wurden die Transportprotokolle und die Dekodierungssoftware auch verlustresistent gestaltet. Bis zu fünf Prozent verloren gegangener Datenpakete werden hier billigend in Kauf genommen. Das ist möglich, weil ein einzelnes Datenpaket ohnehin nur maximal zwanzig Millisekunden der Sprache aufnehmen kann. Ein Fehlen eines solchen Paketes würde auch ohne den durch die Dekodierung geschaffenen Ersatz vom menschlichen Ohr kaum wahrgenommen werden.
Einen Fortschritt auf dem Weg zu einer guten VoIP Sprechqualität brachte auch SIP. Bei SIP handelt es sich um ein internetkonformes Protokoll für den Verbindungsaufbau und -abbau. Deshalb trägt es auch die englische Bezeichnung Session Initiation Protocol. SIP handelt die Bedingungen jeweils nur für den Zeitraum einer konkreten Verbindung aus. Damit kann man sich wesentlich flexibler an sich ändernde Verbindungen einstellen, wie sie beispielsweise aus Witterungseinflüssen auf frei verlegte Telefonleitungen oder veränderte Bedingungen durch ausgetauschte Geräte auf dem Übertragungsweg ergeben können. Auch ergeben sich oft große Unterschiede zwischen den einzelnen Kunden einer Telefongesellschaft oder eines Internetproviders, die sich allein schon aus der Länge eines Leitungsweges bis zum Übergabepunkt ergeben können.
Im Bereich der VoIP Sprechqualität brachten zuerst GSM und dann UMTS große Vorteile. UMTS setzt darauf, dass für den Upload der Daten und der Download der digitalisierten und verschlüsselten Sprachsignale getrennte Frequenzen benutzt werden. Diese Frequenzbereiche werden innerhalb einer bestimmten Bandbreite fest zugewiesen. Man stellt also einen vollduplexfähigen Datenaustausch quasi durchs Hintertürchen her. Dieser kleine technische Trick hatte zur Folge, dass die Nutzdatenrate sehr deutlich erhöht werden konnte. Auch trägt SIP in Kombination mit UMTS dem Fakt Rechnung, dass sich die Übertragungsbedingungen bei sich bewegenden Endgeräten schnell verändern können. Das stellte bisher bei der praktischen Anwendung der Internettelefonie im Mobilfunk noch ein ernstes Problem dar. Mit UMTS lassen sich relativ stabile Bedingungen für jeweils eine Verbindung herstellen.