Beim Real Time Transport Protocol, abgekürzt RTP, handelt es sich um ein Datenübertragungsprotokoll, das speziell für den Austausch echtzeitsensitiver, audiovisueller Daten in IP-basierten Netzen konzipiert wurde. Häufig wird RTP bei der Voice-over-IP-Telefonie (VoIP-Telefonie) verwendet. Deshalb beherrschen auch IP-fähige Telefonanlagen das Real Time Transport Protocol. Die erste Standardisierung wurde bereits im Jahr 1996 im RFC 1889 festgehalten. Seit 2003 ist RTP im RFC 3550 spezifiziert.
Das Real Time Transport Protocol ist in der Lage, Multimediadatenströme wie Audio oder Video zu kodieren, in Pakete zu unterteilen und über ein IP-Netzwerk zu übertragen. Auf der Transportebene verwendet das Real Time Transport Protocol in der Regel das verbindungslos arbeitende UDP (User Datagram Protocol). Mit Hilfe von RTP lassen sich die Daten sowohl in Unicast- als auch in Multicast-Kommunikationsbeziehungen austauschen. Um bei der Übertragung die geforderten Quality-of-Service-Parameter (QoS-Parameter) aushandeln und einhalten zu können, arbeitet RTP mit dem Real Time Control Protocol (RTCP) zusammen.
RTP hat sich bei den IP-Telefonieprotokollen SIP und H.323 als Standard zur Übertragung der Audio- oder Videoströme der Kommunikationsverbindungen etabliert.
Jedes RTP-Paket ist mit einem Header versehen, der verschiedene Informationen zum Inhalt des Pakets und dessen Übertragung enthält. So beinhaltet der Header unter anderem Versions- und Sequenznummern, die eindeutige Sender-ID, Zeitstempel und Informationen zum Datenformat. Der Rest des Pakets ist mit Nutzdaten gefüllt.
Für die Übertragung der Medienströme sind in der Real-Time-Transport-Protocol-Architektur einzelne Komponenten definiert. Die wichtigsten dieser Komponenten sind die Synchronization Source, der Translator und der Mixer. Während die Synchronization Source die eigentliche Datenquelle darstellt und mit einem 32-Bit-Identifikator gekennzeichnet wird, ist der Translator in der Lage, RTP-Pakete weiterzuleiten und bei Bedarf die Kodierung der zu übertragenden Daten zu verändern. Der Mixer schließlich kann die Datenströme mehrerer Quellen zusammen führen und in einem neuen Datenstrom weiterleiten.