Production Architecture

Bagaimana demo ini di-scale ke produksi di Alibaba Cloud — sambil mempertahankan workflow human-in-the-loop yang sama.

Ingest Layer

Hari ini: upload CSV / sampel. Produksi: streaming real-time dari switching Rintis.

ApsaraMQ for KafkaRealtime Compute for Apache FlinkDataWorks

AI Layer

Qwen-Max untuk reasoning aturan dalam, Qwen-Plus/Flash untuk triage cepat, Qwen Embedding untuk vektor. LLM hanya untuk rekomendasi — tidak per-transaksi.

Alibaba Cloud Model StudioQwen-Max · Qwen-Plus · Qwen-FlashQwen Embedding

Data Layer

PostgreSQL + pgvector untuk vektor pola, AnalyticDB untuk analitik skala besar, MaxCompute untuk backtest historis, OSS untuk raw logs.

ApsaraDB RDS for PostgreSQL + pgvectorAnalyticDB for PostgreSQLMaxComputeObject Storage Service (OSS)

Serving Layer

Container Service for Kubernetes (ACK) di Jakarta region, API Gateway + RAM auth, PrivateLink & Express Connect ke on-prem Rintis.

Container Service for Kubernetes (ACK)API Gateway + RAMPrivateLink · Express ConnectRegion: ap-southeast-5 (Jakarta)

Demo Hari Ini vs. Produksi

Aspek	Demo Hari Ini	Produksi (Alibaba Cloud)
Ingest data	CSV upload / dataset sampel 2.000 baris	Streaming real-time dari switching Rintis via Kafka + Flink
AI rekomendasi	Engine deterministik berbasis statistik aturan	Qwen via Alibaba Model Studio dengan reasoning trace
Data store	In-memory store	ApsaraDB PostgreSQL + pgvector + AnalyticDB
Backtest	Compute langsung dari seed	MaxCompute (historis multi-tahun)
Approval workflow	Sama — analyst approve/reject	Sama — tidak ada deploy otomatis
Audit trail	Sama — setiap aksi tercatat	Sama — disinkronisasi ke SIEM Rintis

Transparansi

Saat ini rekomendasi AI dihitung secara deterministik dari statistik aturan pada data seed — ini adalah persis logika yang akan dibantu LLM Qwen di produksi. UI, workflow approval, dan audit trail identik antara demo dan produksi. Yang berubah hanyalah sumber data (streaming) dan sumber reasoning (Qwen via Model Studio).