DAS demo
Domus Analytics · Termékáttekintés · 2026

DOMUS
ANALYTICS
SYSTEM

Egységes adat-, modell- és felületréteg a magyar lakóingatlan-piacra —
Deal score, piaci monitorozás és MI-alapú döntéstámogatás egy helyen.
⬛ Belső / partner
DAS · v2.3 · 2026 Q2
Grecz Balázs
Fejlesztő
700k+ hirdetés
Aktív hirdetés az adatbázisban
Qdrant 551k pont
Vektor keresés (Qdrant + FAISS)
Qwen3 0.6B
Fine-tuned LLM query parser (GGUF)
0.81
Összesített modell pontosság
169 db
Gépi tanulási feature
A piac problémája — és a megoldásunk
A jelenlegi helyzet
Szétszórt adatok: befektetők 13+ portált figyelnek manuálisan, párhuzamosan
Marketing zaj: az alulározott ingatlanok napok alatt eltűnnek, mire valaki észreveszi
Nincs predikció: statikus listák, nincs automatizált árértékelés, nincs deal score
Excel-alapú döntés: hibalehetőség magas, nem skálázható, lassú
A DAS megoldása
Egyetlen platform: 13+ forrás egy MySQL-alapú DAS adatbázisban, REST API és webes felület (React)
Deal Score + ármodell: hirdetés-szintű rangsorolás, több típusra tanított predikció, confidence réteg
Piaci index & előrejelzés: ország / szegment / város napi index, Holt–Winters + priorok, walk-forward OOS metrika
Smart Search: BGE-M3 dense + sparse + cross-encoder reranker + MLP profil. Qdrant vektor keresés payload szűréssel (kerület, utca, szoba), Qwen3-0.6B fine-tuned LLM query parser feature kinyeréssel (GGUF CPU-n). Street boost, district scoring.
RAG & hírek: városi hír-flow, szentiment, kulcsszó-súlyok; asszisztens a DAS-ban dokumentum-alapon. Qdrant + FAISS dual index.
AI Modell teljesítmény
Lakások (Budapest + vidék) R²=0.80
MAPE: 12.3% · ~12%-os átlagos eltérés
Házak – Budapest R²=0.78
MAPE: 12.9%
Kombinált összesített R²=0.81
MAPE: 15.2% · 3 modell ensemble
A predikció NLP-t, demográfiai és likviditási jelzőket, eladott-hirdetés-statisztikákat és időbeli trendeket használ; a Market nézetben külön idősor a napi indexre, KSH-szerű havi háttérrel és opcionális előrejelzéssel.
Technikai differenciátorok
Valós idejű monitoring
13 portál automatikus scraping-je, törlés-detektálás, 2+ hónap árhistória
🧠
NLP leírás-elemzés
Automatikus szövegértelmezés kiszűri a marketing-duma és félrevezető adatokat
📊
Eladott hirdetések analitikája
Városonkénti átfolyási idő, árcsökkentési ráta, likviditási score a deal-értékelésben
🔒
Confidence Score rendszer
Minden deal-nél megbízhatósági jelző: galéria-torzítás, telek kockázat, jogi problémák
🔍
Smart Search — LLM + Qdrant
Szabad szavas keresés: BGE-M3 dense + lexical + cross-encoder reranker + MLP profil. Qdrant vektor DB payload szűréssel. Qwen3-0.6B GGUF query parser (CPU-n 3-6 mp). Kerület, utca, feature boost.
📈
DAS Market modul
Országos és szegmentált napi index, piaci jelzők (volatilitás, likviditás, breadth), előrejelzés valós illesztéssel; auth + kvóta az API-n
💬
RAG & asszisztens
Visszakereshető dokumentumok és kontextus-alapú válaszok; hír és szentiment réteg városonként. Qdrant + FAISS dual index, inkrementális frissítés
ONNX + GGUF optimalizálás
BGE-M3 ONNX export (2-4x gyorsabb CPU-n), Qwen3 GGUF Q4_K_M quantizáció (397MB), label masking, Flash Attention 2 (A40)
v2.3 Keresési pipeline
1. Intent parser — regex strukturált (ár, nm, szoba, év, kerület, utcatípus)
2. LLM parser — Qwen3-0.6B GGUF (4-8 mp, ChatML, think nélkül) → features, streets
3. Hybrid merge — regex pontos + LLM szabad szavas → intent dict
4. Dense recall — Qdrant vektor + payload filter (FAISS fallback)
5. Sparse/MLP recall — BGE-M3 lexical + SemanticMLP bottleneck
6. Szűrők — intent (ár/nm/szoba) + location (kerület) + content (erkély stb.)
7. Reranker — BGE reranker-v2-m3 cross-encoder (desc[:1200])
8. Scoring — relevance(50% rerank) + loc_bonus + street_boost + content_pen + final_score
9. EstateNet — text_premium + base/full price m² + verdict
10. Cache + dedup — memory/disk cache, property_id/short_id/fp dedup
District scoring: +0.20 (exact) / +0.05 (same city) / -0.25 (wrong). Street boost: +0.12 (name+type) / +0.06 (name). Content coverage: features (weight 1.5) → reranker expectations.
Infrastruktúra & optimalizálás
Qdrant v1.18 — Docker, 551K pont, 1024d COSINE, 17 mezős payload, KEYWORD/INTEGER/FLOAT indexek
FAISS index — BGE-M3 1024d IVF, sparse_lexical.pkl, nightly cron rebuild
Qwen3-0.6B — LoRA fine-tune (r=16), GGUF Q4_K_M (397MB), label masking, A40/CPU auto-detect
ONNX + FlashAttn — BGE-M3 ONNX export (2-4x CPU), Flash Attention 2 (A40), torch.set_num_threads
Inkrementális frissítés — FAISS: embedding cache diff → nightly. Qdrant: --incremental flag. RAG: heti cron.
Scoring optimalizálás — _blend_semantic_relevance vektorizált, combined final_score, _minmax 0.5 fallback, Qdrant client cache, chunked SQL
Versenyelőny
Képesség DAS Ingatlanportálok Excel / manuális Külföldi SaaS
Valós idejű deal score minden hirdetésre ✗ (HU piac)
13 forrás aggregálva, deduplikálva részben
AI árpredikció + megbízhatósági jelző korlátozott
Eladott hirdetések alapú piaci analitika
Piaci index, előrejelzés, városi / országos monitor részben
Más piacokra skálázható architektúra részben

A DAS architektúra nem szorultan magyar-specifikus. Új piac bekötése scraping és jogi keretek igazítását jelenti; a predikciós pipeline, a deal score és az üzleti logika nagy része újrafelhasználható.

Potenciális következő piacok: Románia · Csehország · Lengyelország · Szlovákia · Ausztria
Fejlesztési ütemterv
Jelenlegi
Technikai mag
700k+ hirdetés · 17 forrás · DAS web (React) · REST API · Market index + előrejelzés · Deal score · MySQL · Qdrant + FAISS · RAG / hírek · Qwen3 LLM parser
Q3 2026
Smart Search · ONNX
Qdrant payload szűrés finomhangolása · ONNX minden modellnél · Qwen3 model retrain · Keresési relevantia A/B teszt
Q4 2026
API & partnerségek
Banki API · white label · ingatlaniroda integráció
2026
Régió-bővítés
CEE piacok · román és lengyel scraperek · helyi partner