Production Architecture
Bagaimana demo ini di-scale ke produksi di Alibaba Cloud — sambil mempertahankan workflow human-in-the-loop yang sama.
Hari ini: upload CSV / sampel. Produksi: streaming real-time dari switching Rintis.
Qwen-Max untuk reasoning aturan dalam, Qwen-Plus/Flash untuk triage cepat, Qwen Embedding untuk vektor. LLM hanya untuk rekomendasi — tidak per-transaksi.
PostgreSQL + pgvector untuk vektor pola, AnalyticDB untuk analitik skala besar, MaxCompute untuk backtest historis, OSS untuk raw logs.
Container Service for Kubernetes (ACK) di Jakarta region, API Gateway + RAM auth, PrivateLink & Express Connect ke on-prem Rintis.
Demo Hari Ini vs. Produksi
| Aspek | Demo Hari Ini | Produksi (Alibaba Cloud) |
|---|---|---|
| Ingest data | CSV upload / dataset sampel 2.000 baris | Streaming real-time dari switching Rintis via Kafka + Flink |
| AI rekomendasi | Engine deterministik berbasis statistik aturan | Qwen via Alibaba Model Studio dengan reasoning trace |
| Data store | In-memory store | ApsaraDB PostgreSQL + pgvector + AnalyticDB |
| Backtest | Compute langsung dari seed | MaxCompute (historis multi-tahun) |
| Approval workflow | Sama — analyst approve/reject | Sama — tidak ada deploy otomatis |
| Audit trail | Sama — setiap aksi tercatat | Sama — disinkronisasi ke SIEM Rintis |
Saat ini rekomendasi AI dihitung secara deterministik dari statistik aturan pada data seed — ini adalah persis logika yang akan dibantu LLM Qwen di produksi. UI, workflow approval, dan audit trail identik antara demo dan produksi. Yang berubah hanyalah sumber data (streaming) dan sumber reasoning (Qwen via Model Studio).