비디오 전용 ASIC, NETINT Smart VPU
라이브 · FAST · AV1 시대, 폭증하는 영상 처리 비용을 비디오 전용 프로세서 한 대로 해결합니다.엠브레이스의 제품을 확인해 보세요.
Video Processing Unit · Quadra
비디오 전용 ASIC Quadra 도입으로 AI와 비디오 인프라를 독립적으로 확장하세요.
인코딩부터 AI 추론, 출력까지 하나의 칩에서 처리해 자원 경합 없는 안정적인 파이프라인을 구축합니다.
더 높은 서버 밀도
1,250대 → 32대
소비 전력
GPU 대비
서버 랙 공간
절감
라이브 채널 증가, FAST 서비스 확대, AV1 도입 가속.
기존 CPU·GPU 기반 인프라로는 늘어나는 영상 처리 수요를 감당하기 어렵습니다.
증가하는 영상 처리 수요로 기존 CPU·GPU 기반 인프라의 운영 비용 부담이 빠르게 커지고 있습니다.
라이브 채널과 FAST 서비스 확대로 서버 규모와 인코딩 리소스 요구가 지속적으로 증가합니다.
전력과 데이터센터 공간 효율을 높이는 고밀도·저전력 인프라에 대한 요구가 확대되고 있습니다.
Market Shift
비디오 비즈니스에는 두 종류의 회사가 있습니다.— David Ronca · Meta 비디오 인프라
비디오 처리 ASIC을 쓰는 회사, 그리고 앞으로 쓰게 될 회사입니다.
Google과 Meta는 비용 절감과 처리량 증대를 위해 독자적인 VPU 구축을 이미 완료했고, 글로벌 CDN Akamai는 자사 클라우드에 VPU 인스턴스를 상용 도입했습니다. 비디오 인프라의 표준이 빠르게 전환되고 있습니다.
NETINT Quadra는 비디오 처리에 특화된 전용 ASIC입니다. 범용 칩과는 아키텍처부터 다릅니다.
비디오 워크로드를 VPU로 오프로드해, 고가의 GPU 자원을 AI 모델 학습·추론에 집중시킵니다.
AI와 비디오 인프라를 독립적으로 확장할 수 있습니다.
입력부터 AI·인코드·출력까지 하나의 칩에서 처리합니다.
CPU·GPU 간 반복적인 메모리 전송이 없어, 스트림이 늘어도 지연과 대역폭 오버헤드가 발생하지 않습니다.
저대역폭 환경에서도 화질을 유지합니다.
1080p→360p 다운스케일 시 NVIDIA는 VMAF 41.1% 하락, NETINT는 34.9% 하락. 432p·360p 구간에서 NVIDIA 대비 +4~6 VMAF 포인트를 기록합니다.
비디오 데이터가 각 아키텍처를 통과하는 방식
메모리 전송 횟수가 인프라 확장성을 좌우합니다CPU·GPU 간 반복 전송이 지연·대역폭 오버헤드를 유발,
스트림이 늘수록 확장성이 저하됩니다.
메모리 전송
2회
중간 메모리 전송 없음 · 자원 공유 없는 전용 처리 ·
비디오·AI 독립 확장
메모리 전송
0회
범용 GPU가 아닌, 고밀도 라이브 비디오 인코딩에 특화 설계된 Video Processing Unit.
→ Quadra ASIC10,000 HD 스트림 처리에 CPU는 1,250대, VPU는 단 32대. 약 40배 높은 밀도.
→ 1,250대 → 32대모든 코덱에서 GPU 대비 4~6배 높은 전력 효율. H.264 스트림당 0.61W.
→ 1/6 에너지입력·AI·인코드·출력을 한 칩에서. 중간 메모리 전송이 없는 무복사 구조.
→ No Memory CopyAV1 · HEVC 하드웨어 트랜스코딩 가속. H.264 운영에서 AV1으로 단계 전환.
→ AV1 Ready최악의 네트워크에서도 프레임 뭉개짐 최소화. NVIDIA 대비 VMAF +4~6 포인트.
→ VMAF +4~6| 비교 항목 | NVIDIA GPU (NVENC/NVDEC) | NETINT Quadra |
|---|---|---|
| 하드웨어 카테고리 | GPU + 고정 기능 미디어 엔진 | 전용 비디오 처리 ASIC |
| 주요 목적 | AI 컴퓨트 + 비디오 인코드 번들 | 고밀도 라이브 비디오 인코딩 |
| AI · 비디오 확장성 | 동일 카드 내 자원 경합 | AI와 비디오 독립 확장 가능 |
| 전력 효율 (AV1 1080p) | 4.1W / 스트림 | 0.68W / 스트림 (약 6배) |
| 저대역폭 화질 (VMAF) | 41.1% 하락 — 급격한 저하 | 34.9% 하락 — 완만한 유지 |
| 서버 밀도 (10K 스트림) | 250대 규모 | 32대 — 약 8배 고밀도 |
GPU 렌더링 데이터를 CPU를 거치지 않고 VPU로 직접 전달하는 P2P DMA 구조로, 지연을 최소화한 클라우드 게이밍 환경을 구현합니다.
4K60 10비트 HEVC 소스로 다중 해상도 ABR Ladder를 생성해, 다양한 네트워크 환경에 대응하는 적응형 스트리밍을 지원합니다.
고밀도 비디오 처리로 대규모 CCTV·영상 감시 환경을 효율적으로 운영하고, 고효율 인코딩으로 저장 공간과 네트워크 사용량을 최적화합니다.
온칩 AI 엔진과 연계해 객체 감지·영상 분석을 지원합니다. 기존 카메라 인프라를 그대로 활용하며 AI 기반 영상 분석 환경을 구축합니다.
서버 밀도
1,250대 → 32대
서버 랙
공간 절감
에너지 소비
GPU 대비
H.264 스트림당
전력 소비
VMAF 포인트
저대역폭 우위
※ 1080p30 HD 스트림 10,000개 동시 처리 기준 · 자료: NETINT 벤치마크(Quadra T1A)
Make It Scale · 엠브레이스와 함께
엠브레이스 기술팀이 귀사 환경에 맞는 벤치마크와 무상 PoC를 직접 지원합니다.
서버 밀도·전력 절감 분석부터 구축·운영까지 전 과정을 함께합니다.