Shanghai Neardi Technology Co., Ltd. sales@neardi.com +86 17612192553
NPU와 보조 프로세서에 대해 이야기하는 엣지 장치가 점점 더 많아지는 이유는 무엇입니까? RK3588은 이미 강력한 6TOPS(INT8) SoC이지만 다중 작업 추론, 모델 병렬성 및 비디오 AI 분석과 같은 복잡한 장면에서는 단일 칩의 컴퓨팅 한도가 여전히 유지됩니다. RK1820은 해당 부하를 담당하고 기본 SoC의 "컴퓨팅 불안"을 완화하기 위해 정확하게 만들어졌습니다. 엣지 AI 장비에서 호스트 프로세서는 더 이상 혼자 싸우지 않습니다. AI 작업이 기존 CPU/NPU의 예약 용량을 초과하면 보조 프로세서가 조용히 개입하여 지능형 작업 부하의 일부를 맡습니다.
![]()
RK1820은 AI 추론 및 컴퓨팅 확장을 위해 특별히 제작된 보조 프로세서입니다. RK3588 및 RK3576과 같은 호스트 SoC와 유연하게 페어링되며 PCIe 또는 USB 인터페이스를 통해 효율적으로 통신합니다.
| 역량 카테고리 | 주요 매개변수 및 기능 |
|---|---|
| 프로세서 아키텍처 | 3× 64비트 RISC-V 코어; 32KB L1 I-캐시 + 코어당 32KB L1 D-캐시, 128KB 공유 L2 캐시; RISC-V H/F/D-정밀 FPU |
| 메모리 | 2.5GB 온칩 고대역폭 DRAM + 512KB SRAM; eMMC 4.51(HS200), SD 3.0, SPI 플래시에 대한 외부 지원 |
| 코덱 | JPEG 인코딩: 16×16–65520×65520, YUV400/420/422/444; JPEG 디코드: 48×48–65520×65520, 다양한 YUV/RGB 형식 |
| NPU | 20 탑 INT8; 혼합 정밀도 INT4/INT8/INT16/FP8/FP16/BF16; 프레임워크: TensorFlow/MXNet/PyTorch/Caffe; Qwen2.5-3B(INT4) 67 토큰/초, YOLOv8n(INT8) 125 FPS |
| 의사소통 | PCIe 2.1(2레인, 2.5/5Gbps), USB 3.0(5Gbps, PCIe와 공유) |
| 주요 기능 | Edge-AI 추론(감지/분류/LLM), RISC-V 일반 컴퓨팅, 2D 그래픽 가속(크기 조정/회전), AES/SM4 보안 |
RK3588 + RK1820 시스템에서 AI 작업 파이프라인은 4계층 아키텍처로 분해됩니다.
애플리케이션 → 미들웨어 → 보조 프로세서 실행 → 제어 및 프리젠테이션.
RK3588 호스트: 작업 예약, 데이터 사전 처리 및 결과 출력을 처리하여 전체 워크플로를 관리합니다.
RK1820 보조 프로세서: 고성능 컴퓨팅 AI 추론 전용이며 PCIe를 통해 호스트에 결합되어 "가벼운 제어 + 대용량 컴퓨팅" 협업 모델을 형성합니다.
| 단계 | 배우 | 행동 |
|---|---|---|
| 앱 요청 | RK3588 | 앱 레이어에서 발행된 AI 작업 호출(인식/탐지) |
| 보내다 | RK3588 디스패처 | 보조 프로세서로 오프로드할지 결정 |
| 추론 | RK1820 | 딥러닝 모델 계산 실행 |
| 반품 | RK1820 → RK3588 | 추론 결과를 다시 보냅니다. 호스트는 로직을 표시하거나 계속합니다. |
애플리케이션 계층은 모든 AI 작업이 시작되는 곳입니다. 이미지 분석, 개체 감지, 에지 측 LLM Q&A 등 사용자 요구 사항을 시스템 실행 가능한 작업 명령으로 변환하고 이를 표준화된 API를 통해 미들웨어 계층에 전달합니다. 이 계층은 사용자 상호 작용, 비즈니스 로직 및 주변 데이터를 관리하는 RK3588 호스트에 의해 전적으로 처리됩니다.
![]()
작업 수신: 카메라, 터치 패널, 이더넷, UART 등을 통해 사용자 명령을 획득합니다.
명령 표준화: 구조화되지 않은 입력을 구조화된 작업 매개변수로 전환합니다.
미들웨어 계층은 협업 허브입니다. 각 작업을 판단하고, 리소스를 할당하고, 데이터를 전처리하고, 버스 트래픽을 관리합니다. 작업이 호스트에서 실행되는지 아니면 보조 프로세서로 오프로드되는지 여부를 결정합니다.
RK3588만 해당; RK1820은 PCIe 구성이나 인터럽트 관리에 참여하지 않으며 단순히 호스트에서 디스패치한 추론 작업을 실행합니다.
작업 분류 및 예약
데이터 전처리
![]()
버스 통신 제어
이 레이어는 고성능 AI 추론 전용인 RK1820 보조 프로세서에 의해 독점적으로 구동되는 추론 코어입니다.
RK1820 활성; RK3588은 추론을 방해하지 않으며 결과만 기다립니다. 시간 초과 또는 예외는 PCIe 재설정 명령을 통해 RK3588에서 처리됩니다.
과제접수 및 준비
RK3588에서 발송한 데이터, 모델 가중치 및 명령을 수신합니다. 이를 로컬 고대역폭 DRAM에 쓰고 모델을 로드한 다음 NPU를 구성합니다.
NPU 추론 컴퓨팅
결과 반환
이 레이어는 모든 AI 작업의 종착점입니다. RK1820의 원시 추론 결과를 시각적 또는 비즈니스용 출력으로 변환하고 루프를 닫습니다.
RK3588 활성; RK1820은 원시 추론 데이터만 제공합니다.
![]()
결과 후처리
시스템 제어 및 피드백 출력
시너지의 가치: 단지 더 빠르기만 한 것이 아니라 더 스마트하게
| 단계 | 배우 | 행동 |
|---|---|---|
| 앱 요청 | RK3588 | 앱 레이어에서 발행된 AI 작업 호출(인식/탐지) |
| 보내다 | RK3588 디스패처 | 보조 프로세서로 오프로드할지 결정 |
| 추론 | RK1820 | 딥러닝 모델 계산 실행 |
| 반품 | RK1820 → RK3588 | 추론 결과를 다시 보냅니다. 호스트는 로직을 표시하거나 계속합니다. |
간단히 말해서, RK3588은 쇼를 운영하고 모든 것을 순조롭게 유지하는 반면 RK1820은 원시 컴퓨팅 버스트를 제공합니다. 함께 엣지 AI 장치를 "더 스마트하고 빠르며 번거롭지 않게" 만듭니다.
더 많은 RK1820 뉴스와 SDK 업데이트, 새로운 튜토리얼, 즉시 실행 가능한 데모를 보려면 우리를 팔로우하세요.