MMT(MPEG Media Transport)

TECH & TREND 김용한 서울시립대학교 전자전기컴퓨터공학부 교수 TECH & MMT(MPEG Media TREND Transport) 표준의 이해 + 김용한 서울시립대학교 전자전기컴퓨터공학부 교수 MPEG(Moving Picture Experts Group)은 ISO/IEC JTC 1/SC 29/WG 11의 별칭으로서, 디지털 방송, 인터넷 멀티미디어 전송, 멀티미디어 저장 매체 등의 분야에서 널리 활용되고 있는 MPEG-1, MPEG-2, MPEG-4 등의 표준을 제정한 국제표준화 그룹이다. 특히 MPEG에서 제정한 표 준 중에서 ISO/IEC 13818-1이라는 공식 표준번호를 갖고 있는 MPEG-2 시스템 표준은 초기 디지털 방송 방식에서부터 HDTV, DMB 등에 이 르기까지 압축된 비디오, 오디오, 부가 데이터를 다중화하고 비디오와 오디오의 동기화를 달성하며 송신 측에서 수신 측으로 필요한 제어 정 보를 전달하는 방식으로 널리 활용되어 왔다. 올해 제정되고 있는 국내 4K UHDTV 표준들에도 이 MPEG-2 시스템 표준이 채택될 예정이 다. MPEG-2 시스템 표준에 맞게 구성된 비트스트림을 트랜스포트 스트림(Transport Stream, TS)이라 부르는 관계로, 많은 이들이 이 표준을 MPEG-2 TS 표준이라 부르기도 한다. MPEG-2 TS 표준이 제정된 것은 1990년대 초반으로, 인터넷이 아직 글로벌 네트워크로서 일반화되기 전이었다. 당시에는 ATM(Asynchronous Transfer Mode, 비동기 전송 모드)에 의한 차세대 네트워크가 인터넷을 대체하여 새로운 글로벌 네트워크가 될 수 있도 록 여러 나라에서 연구개발 역량을 집중하고 있을 때였다. IP 기반의 네트워크에 비해, ATM 기반 네트워크는 여러 가지 측면에서 최적화된 구조를 가지고 있었음에도 불구하고, 아이러니하게도 이러한 최적화된 기능의 장점을 무색하게 만들 정도로 고속 전송이 가능한 패스트 이 더넷이 출현하면서, IP 기반의 인터넷이 ATM 기반의 네트워크보다 더욱 널리 사용되게 되었고 그야말로 현재 인터넷은 유일한 글로벌 네트 워크가 되었다. 이에 따라 모든 통신망은 IP가 대세인 시대가 지속되고 있다. 급속한 통신 기술의 발전과 환경의 변화로 말미암아 20여 년 전 MPEG-2 TS 표준이 제정되던 때의 환경과 지금의 환경은 너무도 달라졌다. 글로벌 인터넷과 무선 휴대통신망이 없이는 일상적인 생활이 어 려울 정도로 유무선 인터넷과 휴대통신, 그리고 스마트 기기가 활성화된 것이 오늘의 상황이다. 특히 방송과 통신의 융합 시대를 맞아 방송 에서 사용하는 TS 패킷과 통신에서 사용하는 IP 패킷은 그 구조가 너무 다르기 때문에 여러 가지로 기술적인 불편함을 초래하고 있다. MPEG 내부에서도 이러한 불편함을 해소할 수 있는 새로운 멀티미디어 전달 표준이 필요하다는 목소리가 커지면서, 마침내 이러한 이슈들 을 집중적으로 논의하기 위한 1차 내부 워크숍이 2009년 7월 영국 런던에서 개최된 89차 MPEG 회의 기간 중 개최되기에 이르렀다. 그리 고 6개월 후 2010년 1월 일본 교토에서 개최된 91차 MPEG 회의에서 같은 이슈에 대한 2차 내부 워크숍이 개최되었다. 이러한 워크숍에서 주로 논의된 것은 MPEG-2 TS 표준이 현재의 환경을 고려할 때 어떤 점에서 부족한지에 대한 것과 MPEG-2 TS 표준 제정 이후 달성된 관련 기술개발 결과를 리뷰한 후, 새로운 멀티미디어 전달 표준에 대한 요구사항에 대한 것이었다. 두 차례 워크숍의 결론은 MPEG-2 TS 표준을 대체하여 방송과 인터넷 그리고 이들의 융합 환경에서 널리 활용될 수 있는 새로운 멀티미디어 전달 표준이 필요하다는 것이었다. 이에 따 154 BROADCASTING & TECHNOLOGY 라 MPEG에서는 2010년부터 공식적으로 MMT 표준화에 착수하게 되었으며, 만 5년이 경과한 올해 2014년 3월에 ISO/IEC 23008–1이라는 공식 표준번호를 갖는 MMT 표준의 첫 파트(Part)를 완성하게 되었다. 실제 MMT 표준은 여러 파트로 구성되며 주된 표준에 해당하는 파트 1(Part 1)을 제외한 나머지 파트들은 아직도 그 표준화가 진행 중에 있다. MMT 표준의 현재 모습을 거시적으로 이해하기 위해서는 상기 MPEG 내부 워크숍을 통해 정리되었던 MPEG-2 시스템의 한계와 새로운 멀 티미디어 전달 표준에 대한 요구사항들을 이해하는 것이 가장 빠른 길이라 생각한다. 그 요구사항들을 정리하면 다음과 같다. • MPEG-2 TS 표준에서는 188바이트 크기의 TS 패킷을 사용하고 있는데 이는 ATM의 한 셀(cell) 크기인 53바이트를 기준으로 그 유료부 하(payload)인 47바이트의 정수배, 즉 4 × 47 = 188바이트가 되는 크기이다. 하나의 TS 패킷을 4개의 ATM 셀에 담아 전송할 수 있도록TS 패킷의 크기를 정하였다. 현재 IP 기반의 망에서 MTU(Maximum Transmission Unit)를 기준으로 IP 패킷의 크기를 정한다고 했 을때, 이는 보통 188바이트보다는 훨씬 더 크기 때문에, TS 패킷에 비해 IP 패킷의 전송 효율이 훨씬 더 클 수 있다. • MPEG-2 TS 표준에서는 오디오 및 비디오(Audio-Video, AV) 동기화를 위한 클록을 송신 측에서 수신 측으로 TS 내에 밴드 내(In-band) 로 전송한다. 이를 위해 송신 측의 시스템 시간 클록(System Time Clock, STC)을 0.1ms 내외의 주기로 샘플링하여 그 결과를 프로그램 클록 참조치(Program Clock Reference, PCR)라고 불리는 타임스탬프(timestamp)로써 수신 측으로 전달하며, 수신 측에서는 이를 받아 PLL(Phase Locked Loop)을 통해 STC를 복원하여 AV 동기화에 활용한다. 이렇게 MPEG-2 TS 표준에서 STC를 직접 수신 측으로 전달하도 록 한 이유는 당시의 하드웨어 기술의 정밀도가 부족하여 여러 수신기가 사용하는 클록의 편차가 컸기 때문인데 오늘날에는 클록의 정밀 도가 많이 개선되었고, 인터넷에서는 NTP(Network Time Protocol)를 활용하여 정확한 클록을 전송받을 수 있는 환경이 되어 있기 때문에 AV 동기화를 위해 별도의 클록을 송신 측으로부터 수신 측으로 전달할 필요가 없게 되었다. MPEG-2 시스템 표준의 STC를 전달하는 방법 에서는 비트스트림 상에서 PCR이 전송되는 위치가 중요하기 때문에 주어진 MPEG-2 TS에 데이터를 임의로 추가하거나 삭제하면 PCR의 위치가 바뀌어 정확한 동작을 달성할 수 없게 되므로 PCR 값을 적절히 재조정해 주는 과정이 필요한 데 이를 재다중화(remux) 과정이라 부른다. 재다중화 과정은 복잡하고 어렵기 때문에 MPEG-2 TS에 대한 편집은 매우 까다로운 과정이다. 따라서 새로운 미디어 전달 표준에 서는 다중화된 비트스트림에 데이터를 추가하거나 삭제하는 것이 매우 용이하도록 하여야 한다. • MPEG-2 TS 표준 제정 당시에는 충분하다고 생각되었던 각종 식별자(identifier, ID)나 태그(tag) 필드의 크기가 작아서 실제로는 할당 할 수 있는 값이 부족하여 매우 불편한 상황에 있다. 즉 대부분의 식별자나 태그의 크기가 8비트로 되어 있는데 새로운 미디어 전달 표 준에서는 이를 최소한 16비트로 하여 미래의 수요에 잘 대처할 수 있도록 하여야 한다. • MPEG-2 TS 표준 제정 당시, 여러 기관에서 여러 가지 구문 요소(syntax element)가 필요하다고 주장하는 바람에 이후 결과적으로 사 용되지 않는 여러 가지 구문 요소들이 MPEG-2 TS 구문에 포함되었다. 실제 사용되지 않을 구문 요소들의 기능을 검증하고 시스템 부호기 및 시스템 복호기를 구현하느라 비용과 시간이 과다하게 소요되었다. 따라서 새로운 미디어 전달 표준에서는 필수 구문 요소들만 포함하 고 표준 제정 이후 꼭 필요하다면 이를 확장 가능한 형태로 비트스트림 구문을 정할 필요가 있다. • MPEG-2 TS 표준 제정 당시에는 인터넷이 느리고 지금과 같이 멀티미디어 전달을 위해 널리 사용되지 않았었기 때문에, 여러 멀티미디 어 콘텐츠 제공자로부터 콘텐츠 구성요소들을 공급받아 종합적인 하나의 콘텐츠로써 소비자에게 제공하는 서비스가 없었다. 현재는 매쉬 업(mash-up) 서비스와 같이 그러한 서비스가 일상화될 수 있는 시대이기 때문에 새로운 멀티미디어 전달 시스템은 이러한 서비스를 쉽게 제공할 수 있는 형태로 고안되어야 한다. 이를 위해 새로운 멀티미디어 전달 표준을 통해 전달되는 콘텐츠 혹은 이를 구성하는 세부 콘텐 츠들을 글로벌하게 구분할 수 있도록 할 필요가 있다. 즉 전 세계적으로 유일무이한 식별자를 부여할 수 있도록 하여야 한다. 또 스마트TV 를 고려하여, HTML 페이지와 유사한 다중 영역을 지원하고, 스마트 리모컨이나 2차 디스플레이를 사용할 수 있도록 다중스크린 기능을 방 송 과 기 술 Vol.224 155 TECH & TREND 김용한 서울시립대학교 전자전기컴퓨터공학부 교수 제공하며, 위젯을 지원하는 기능 등이 필요하다. • MPEG-2 TS 표준 제정 당시에는 고전적인 방송 시스템을 통해서만 멀티미디어를 전달할 수 있었지만 현재는 방송망, 유무선 인터넷, 휴대통신망 등의 다양한 망을 통해서 멀티미디어를 전달할 수 있는 시대이므로 이러한 이종망 환경에서 다양한 망을 동시에 이 용하여 멀티미디어 전체 또는 그 구성요소를 쉽게 전달할 수 있는 새로운 멀티미디어 전달 시스템이 필요하다. MPEG-2 TS 표준을 사용하 더라도 이종망 전달을 달성할 수 있기는 하지만, 매우 복잡한 과정이 필요하며 이를 달성할 수 있는 간단하지 않은 기술적 스펙을 필요로 한다. 새로운 멀티미디어 전달 표준은 이종망 전달이 매우 쉽게 가능해야 한다. 특히 이 요구 사항은 MPEG에서 별도로 제정한 MPEG- DASH(Dynamic Adaptive Streaming over HTTP) 표준과 밀접한 관계가 있다. MPEG-DASH 표준의 내용은 초기에 MMT에 들어 있다가 산 업적인 수요가 급박하다는 주장에 따라 별도의 표준으로 분리하여 제정된 표준이다. MPEG-DASH 표준화 이전에 이미 애플, 마이크로소 프트 등에서 적응 스트리밍 솔루션에 판매되고 있었는데, 이에 대한 표준화가 급하다는 것이 업계의 주장이었다. 과거에는 RTP에 의한 멀 티미디어 스트리밍이 주로 시행되었지만, 파이어월에 의해 쉽게 차단된다든지 사용자가 증가함에 비례하여 서버를 증설해야 하는 단점을 극복하고자 HTTP를 사용하는 적응 스트리밍 기술이 등장하게 되었다. HTTP를 사용하는 한, 파이어월에 의해 차단될 염려가 없다. HTTP 포트를 차단하면 모든 웹서비스가 차단되므로, 어떤 기관이 이렇게 하지는 못하기 때문이다. 또 현재의 인터넷은 빠른 웹서비스를 위해 매 우 최적화되어 있기 때문에 HTTP를 사용하는 한 인터넷 내부 캐시(cache)에 의해 빠른 지원을 받는 멀티미디어 스트리밍을 달성할 수 있 다. 따라서 빠른 웹서비스를 유지하기 위해 인터넷 사업자가 투자를 계속하는 한, 적응 스트리밍의 사용자가 증가하더라도 이에 비례하여 서버를 증설할 필요가 없다. 현재 인터넷 멀티미디어 스트리밍은 적응 스트리밍이 대세라 할 수 있다. MPEG-DASH 표준은 HTTP를 사용 하여 멀티미디어를 스트리밍하기 위해 필요한 메타데이터와 멀티미디어 세그먼트(segment)에 대해 규정한 표준이다. MMT 표준은 이러 한 MPEG-DASH 표준에 의한 적응 스트리밍을 효율적으로 지원하여야 한다. • 지금은 명실상부하게 IP의 시대라 할 수 있다. 인터넷뿐만 아니라 거의 모든 방송/통신망에서 IP 패킷 전달이 가능한 시대이다. 따라서 새로운 멀티미디어 전달 시스템은 IP 친화적이 되어야만 효율적으로 멀티미디어를 전달할 수 있다. 예를 들어 인터넷을 통해 멀티미디어 를 전달한다고 할 때, 현재의 인터넷은 내부적으로 많은 캐시를 갖고 있기 때문에 이러한 캐시에 일시적으로 저장하였다가 다시 전송하는 것이 효율적으로 달성되려면 전송 포맷과 저장용 포맷 간의 변환이 아주 쉬워야 한다. • 효율적이고 견고하며 안전하게 멀티미디어를 전달하기 위해서는 MPEG-2 TS 표준 제정 이후 개발된 새로운 기술들을 적극적으로 채택하거나 수용이 가능하도록 지원할 필요가 있다. 이러한 기술들의 예로서는 응용 계층 순방향 오류 정정 부호(Application– Layer Forward Error Correction, AL–FEC), 계층 간 인터페이스(Cross–Layer Interface, CLI), 다운로드 가능한 디지털 권리 관리 기술 (Downloadable Digital Rights Management, DDRM) 등이 있다. AL–FEC는 전송 중 손실된 IP 패킷을 복구하는 데 사용되는 기술이고, CLI는 하위 통신 계위의 파라미터를 활용하여 상위 통신 계위의 기능을 효율적으로 제어하는 기술이며, DDRM은 특정한 콘텐츠 보호 방식에 지배되지 않은 상태로 멀티미디어 콘텐츠를 보호할 수 있는 기술이다. 상기 요구사항들 이외에도 MMT 표준화 과정에서 다음의 내용들이 추가되었다. • MPEG-2 TS 표준에서는 프로그램 채널(예를 들어, KBS1, KBS2, MBC, SBS, EBS 등에 해당하는 데이터 통로)까지만 구분하고, 각 프 로그램 채널 내의 프로그램들(예를 들어, 저녁 뉴스, 드라마A, 시사토론B 등)을 구분하는 기능이 없다. 방송방식에서는 예를 들어 우리 나라가 HDTV 방송에서 사용하고 있는 ATSC 표준에서는 시스템 정보 전달과 전자 프로그램 안내를 위해 PSIP(Program and System Information Protocol)를 추가로 규정하고 있는데, 여기서는 각 프로그램을 이벤트(event)라는 용어로 부르고 이를 구분할 수 있게 하고 있다. MMT 표준에서는 이러한 이벤트에 해당하는 콘텐츠 또는 어떤 프로그램 채널로 전달되는 일부 시구간 동안의 콘텐츠를 패키지 156 BROADCASTING & TECHNOLOGY (Package)라고 부른다.

MMT(MPEG Media Transport)

(L3) - Audio/Picture Coding

Scene-Based Audio and Higher Order Ambisonics

Final Report of the ATSC Planning Team on Internet-Enhanced Television

Design and Implementation for Media-Aware Transmission Method Based on Mmt

Multipath MMT-Based Approach for Streaming High Quality Video Over Multiple Wireless Access Networks

Ts 103 589 V1.1.1 (2018-06)

Iso/Iec Jtc 1 N 13155

Hevc/H.265 Codec System and Transmission Experiments Aimed at 8K Broadcasting

Service Configuration, Media Transport Protocol, and Signalling Information for MMT-Based Broadcasting Systems

JTC 1 SC29 WG1 and WG11 Meetings: Below Are Some Brief Notes on Work in MPEG and JPEG That Could Be Relevant to IEC TC100 1

Understanding Timelines Within MPEG Standards

NTT Technical Review, May 2015, Vol. 13, No. 5