AI Price Estimation From Images: 3 Attempts, 1 Working Solution — GridGarden

Estimare de preț AI din imagini: 3 încercări, 1 soluție funcțională

PE SCURT: Modelele AI de viziune greșesc măsurătorile în 63% din cazuri. Toate bunele practici spun „nu măsura din imagini – clasifică în schimb”. Am încercat ambele. Clasificarea a însemnat constrângerea generatorului nostru AI de imagini la un catalog fix, ceea ce a ucis rezultatul creativ. Așa că am găsit o a treia cale: folosim produsul în sine ca riglă. Fiecare strat al sistemului nostru modular are exact 12 cm. AI numără straturile, noi facem calculele, tu primești o estimare de preț în 5 secunde pentru 0,001 $.

De ce spun toți „AI-ul nu poate măsura din fotografii”?

În 2024, cercetătorii de la Google au publicat SpatialVLM – un benchmark care testează cât de bine înțeleg modelele viziune-limbaj relațiile spațiale. Rezultatele au fost sobre: când li s-a cerut să estimeze distanțe și dimensiuni din fotografii, modelele de ultimă generație au intrat în intervalul corect (0,5× până la 2× din realitate) doar 37,2% din timp. Aproape două treimi din estimări au fost greșite cu mai mult de dublu.

Un studiu ulterior, SpatiaLab (2026), a confirmat că problema este profundă – benchmark-urile anterioare au supraestimat de fapt cât de bine percep modelele spațiul. Numerele reale sunt mai rele.

Problema fundamentală se numește ambiguitate monoculară: dintr-o singură imagine 2D fără un punct de referință, este fizic imposibil să recuperezi dimensiuni 3D absolute. Un ghiveci de 30 cm fotografiat de aproape arată identic cu un jardinier de 3 m fotografiat de la distanță. Nicio cantitate de date de antrenament nu schimbă acest lucru – nu este o limitare a AI, ci geometrie.

Iar imaginile generate de AI fac lucrurile și mai grele. Fotografiile reale au cel puțin metadate EXIF (distanță focală, dimensiunea senzorului) care ar putea teoretic să ancoreze calculele de perspectivă. Imaginile generate nu au nimic din toate acestea.

Interesant este că cercetarea a relevat și unde se află de fapt blocajul: problema transferului viziune-limbaj. Encoderul vizual reprezintă corect informația spațială intern – dar modelul lingvistic nu o poate extrage atunci când generează răspunsuri text. Modelul „vede” dimensiunile mai precis decât le poate „spune”.

Deci, când am decis să construim estimări automate de preț pentru design-uri de grădină generate de AI, consensul academic a fost clar: nu măsura. Clasifică.

Iată ce face industria în schimb:

Companie Abordare Măsoară din fotografii?
Zillow Zestimate Clasifică caracteristicile (granit vs. laminat), folosește date comparabile de vânzare Nu — peste 1 milion de eșantioane de antrenament, doar clasificare
SimplyWise Clasifică tipul proiectului → tabele de prețuri regionale Nu — precizie ±10-15%, fără măsurare pixel cu pixel
Hover 8-10 fotografii → reconstrucție 3D + QA uman Da — dar necesită unghiuri multiple și durează ~1 oră
AI Garden Planner, Planner 5D, etc. Doar vizualizare — fără prețuri N/A

Nimeni din spațiul de design de grădină AI (piață de 1,72 miliarde USD, în creștere cu 21,4% CAGR) nu oferă estimări de preț din design-uri generate. Niciun concurent. Am decis să încercăm oricum.

Cum generează AI-ul nostru design-uri de grădină (și de ce face asta dificilă stabilirea prețurilor)

Înainte de a intra în detalii despre prețuri, este util să înțelegem ce prețuim. AI Garden Designer nostru permite utilizatorilor să încarce o fotografie a grădinii lor reale. AI-ul generează apoi o vizualizare fotorealistă a modului în care acel spațiu ar putea arăta cu straturi înălțate modulare.

Generatorul de imagini (Gemini Imagen) primește două tipuri de input:

  • Constrângeri de produs: Trei fotografii de referință ale sistemului nostru Brick real – fotografii de produs reale care arată construcția cu scânduri suprapuse, colțuri în stil „cabana din bușteni”, textură de larice îmbătrânit. Plus o descriere text detaliată: „scânduri groase (120 mm înălțime × 60 mm grosime), suprapuse orizontal cu rosturile decalate rând cu rând, ca la zidărie.”
  • Libertate creativă: Tot restul – câte structuri, unde sunt plasate, ce forme au, cum se relaționează cu grădina existentă. AI-ul decide dispunerea, aranjamentul, tipurile de straturi. O formă în L în jurul unui copac? O bancă integrată într-un zid de sprijin? Un set de scări care urmează un pante? Totul depinde de model.

Utilizatorii controlează un glisor de densitate (0-100) care corespunde aproximativ la 0-20 structuri. La densitatea 25, obții o grădină naturală cu câteva straturi subtile integrate printre flori sălbatice. La densitatea 80, obții un spațiu de locuit exterior complet organizat, cu zone distincte conectate prin alei. AI-ul alege ce tipuri de structuri se potrivesc scenei.

Această libertate creativă este scopul principal al instrumentului. Nimeni nu dorește un configurator care să genereze mereu aceleași trei straturi dreptunghiulare. Dar creează o problemă fundamentală de preț: fiecare imagine generată este unică. Nu există o listă de materiale predefinită. Niciun cod SKU. Doar o imagine fotorealistă a structurilor din lemn care ar putea fi orice, de la un singur jardinier la o elaborată grădină multi-zonă.

Deci, cum stabilești prețul pentru ceva ce nu există încă, dintr-o imagine generată acum 5 secunde?

Încercarea #1: Pur și simplu întreabă AI-ul pentru dimensiuni

Prima noastră abordare a fost cea mai naivă: am dat Gemini 2.5 Pro imaginea generată a grădinii și i-am cerut să estimeze dimensiunile în metri.

// Promptul pe care l-am lansat în producție
Ești un expert în estimarea dimensiunilor structurilor de grădină
din fotografii.

Pentru FIECARE structură distinctă din lemn pe care o poți identifica
(straturi înălțate, bănci, ziduri, scări, jardiniere),
estimează-i dimensiunile în metri:
- lungime_m: cea mai lungă dimensiune orizontală
- latime_m: dimensiunea orizontală mai scurtă (adâncime)
- inaltime_m: dimensiunea verticală

Returnează JSON:
{ "structures": [
    { "type": "strat_incaltat",
      "lungime_m": 2.0, "latime_m": 1.0, "inaltime_m": 0.6 }
]}

Stabilirea prețului a fost o geometrie simplă – calcularea suprafeței vizibile a peretelui și înmulțirea cu 125 €/m²:

// Calcul suprafață perete per tip de structură:
// strat_incaltat: 2 × (lungime + lățime) × înălțime
// zid: 2 × lungime × înălțime
// scări: lungime × înălțime × 1.5
const suprafataPerete = 2 * (s.lungime_m + s.latime_m) * s.inaltime_m;
const pret = suprafataPerete * 125; // EUR per m²

A funcționat. Mai bine decât ne așteptam. Un strat care avea de fapt 1,8 m lungime revenea ca 1,4 m sau 2,2 m – dimensiunile individuale erau imprecise, dar geometria compensa: când lungimea era supraestimată, înălțimea tindea să fie subestimată. Estimarea prețului a ajuns în intervalul ±20-25% din realitate. Pentru o estimare gratuită și instantanee dintr-o imagine generată de AI, asta părea surprinzător de util.

Modelul a fost deosebit de bun la numărarea structurilor – dacă imaginea arăta 3 straturi înălțate și o bancă, găsea în general 3 straturi înălțate și o bancă. A înțeles cum arată sistemul nostru Brick. Dimensiunile erau neclare, dar detectarea structurii a fost solidă.

Dar apoi am citit lucrările. Rata de acuratețe de 37,2% a SpatialVLM. Documentația proprie a Google care avertizează împotriva măsurării spațiale din imagini unice. Firele de pe Stack Overflow pline de „acest lucru este fundamental imposibil”. Ne-am speriat.

„Acest lucru nu poate funcționa pe termen lung”, ne-am spus. „Avem noroc. Să o facem corect – așa cum recomandă toată lumea.”

Încercarea #2: Calea „corectă” — Clasificarea în catalog

Abordarea recomandată este clară: nu măsura, clasifică. Identifică tipul de structură, atribuie-l unei categorii de dimensiuni, caută un preț fix. Fără măsurare, fără ambiguitate. Așa face Zillow. Așa face SimplyWise. Așa spune cercetarea.

Ideea a fost simplă:

// Clasifică tipul structurii + dimensiunea → căutare preț fix
const TABEL_PRET = {
  strat_incaltat: { mic: 50, mediu: 100, mare: 180 },
  zid:       { mic: 25, mediu: 50,  mare: 90 },
  banca:      { mic: 30, mediu: 60,  mare: 100 },
  scari:     { mic: 45, mediu: 90,  mare: 140 },
  jardiniera:    { mic: 15, mediu: 30,  mare: 55 }
};

Dar am întâmpinat o problemă pe care nu am anticipat-o – și nu avea legătură cu precizia AI.

Generatorul nostru AI de grădină creează design-uri creative. Un utilizator încarcă o fotografie a grădinii sale, iar Gemini Imagen creează o vizualizare unică cu straturi înălțate modulare aranjate pentru a se potrivi acelui spațiu specific. Structurile pe care le generează sunt variate – forme în L, curbe care urmează o potecă de grădină, straturi integrate în pante, bănci conectate la straturi înălțate, aranjamente pe niveluri care estompează linia dintre „scară” și „zid”.

Pentru ca clasificarea în catalog să funcționeze, ar fi trebuit să constrângem generatorul de imagini. „Generează doar aceste 5 tipuri. Generează doar aceste 3 dimensiuni. Păstrează totul dreptunghiular.” Asta ar fi făcut prețurile precise – dar ar fi ucis lucrul care face instrumentul valoros: design-urile creative și personalizate.

Ne confruntam cu un compromis fundamental: prețuri precise vs. libertate creativă în imaginile generate.

Și chiar și când am încercat să facem clasificarea să funcționeze fără a constrânge generatorul, rezultatele au fost slabe:

  • „Mic/Mediu/Mare” nu însemna nimic pentru model. Fără un obiect de referință în imagine, același strat era „mic” într-o analiză și „mare” în următoarea. Nu există un punct de ancorare fizic pentru aceste cuvinte – „mediu” este un concept lingvistic, nu o măsurătoare.
  • Structurile creative nu se încadrează în categorii clare. Un strat în formă de L este un strat înălțat „mare” sau două „medii”? O bancă integrată într-un strat înălțat este o „bancă” sau parte a stratului? Categoriile erau prea rigide pentru ceea ce genera de fapt generatorul.
  • Ne-am trezit adăugând soluții improvizate. Un discount pentru supraestimare (-15% pentru fiecare structură peste 3, deoarece modelul a halucinat elemente suplimentare). Un pas de reclasificare. Un tabel de suprascriere manuală. Fiecare soluție improvizată era un semn că abordarea nu se potrivește cazului nostru de utilizare.

Problema de bază: prețurile din catalog presupun un catalog. Funcționează pentru Zillow deoarece casele au tipuri cunoscute (ranch, colonial, split-level) cu decenii de date comparabile de vânzare. Funcționează pentru SimplyWise deoarece proiectele de construcții se mapează pe categorii standardizate. AI-ul nostru generează design-uri unice de fiecare dată – nu există un catalog pe care să-l clasificăm.

Nu am lansat niciodată această versiune. În schimb, ne-am întors la ceea ce a funcționat de fapt – măsurarea – dar cu o perspectivă crucială.

Încercarea #3: Produsul devine rigla

Cercetarea a avut dreptate într-un singur lucru: nu poți recupera dimensiuni absolute dintr-o singură imagine fără un punct de referință. Dar a greșit într-o presupunere – că nu există niciun punct de referință.

Produsul nostru are o riglă încorporată.

Sistemul modular Brick folosește scânduri de lemn de 60 mm grosime care se suprapun. Fiecare strat orizontal – vizibil ca o linie distinctă în fiecare imagine generată – are exact 12 cm (0,12 m) înălțime. Aceasta este o constantă fizică a produsului. Este aceeași în fiecare imagine, fiecare design, fiecare unghi. Și generatorul de imagini știe deja despre asta – fiecare prompt specifică „sistem Brick de 60 mm”, așa că scândurile sunt redate consecvent.

Cu V1, am întrebat: „Câți metri are acest strat?” – o întrebare care necesită rezolvarea problemei ambiguității monoculare.

Cu V3, întrebăm: „Câte straturi de scânduri vezi și de câte ori este zidul mai lung decât înălțimea sa?” – întrebări care necesită doar numărare și estimarea unei proporții. Ambele sunt lucruri pe care modelele de viziune le fac bine.

// Promptul real din producție (v3)
REFERINȚĂ SCALĂ: Fiecare strat orizontal de scândură = exact 12cm
(0,12m) înălțime. Numără straturile pentru a obține înălțimea, apoi estimează
lungimea în raport cu înălțimea cunoscută.

MĂSOARĂ fiecare structură:
- straturi: numără straturile orizontale vizibile de scândură (fiecare = 12cm)
- raport_lungime: de câte ori este zidul mai lung decât înălțimea sa
- fețe_vizibile: câte fețe de zid sunt vizibile

VERIFICĂ: Grădinile tipice au 2-5 structuri.
Dacă ai găsit >6, probabil ai numărat greșit.

Returnează JSON:
{"structures": [
  {"reasoning": "4 straturi orizontale vizibile, zidul se extinde
    aproximativ 3,5x înălțimea, fața și latura vizibile",
   "type": "strat_incaltat",
   "straturi": 4,
   "raport_lungime": 3.5,
   "fete_vizibile": 2}
]}

Motorul de prețuri face calculele:

const INALTIME_STRAT_M = 0.12;
const PRET_PER_M2 = 120;

function calculeazaPret(structura) {
  const inaltime = structura.straturi * INALTIME_STRAT_M;
  // 4 straturi = 0,48m

  const lungime = inaltime * structura.raport_lungime;
  // 0,48m × 3,5 = 1,68m

  const suprafataFata = inaltime * lungime;
  // 0,48 × 1,68 = 0,81 m²

  const totalM2 = suprafataFata * structura.fete_vizibile;
  // 2 fețe = 1,61 m²

  return totalM2 * PRET_PER_M2;
  // 1,61 × 120 € = 193 €
}

De ce funcționează aici unde V1 și V2 nu au reușit:

  • Numărarea este ceea ce modelele de viziune fac bine. Liniile orizontale în structurile cu scânduri suprapuse sunt caracteristici vizuale repetitive, cu contrast ridicat. Numărarea straturilor discrete este fundamental diferită de estimarea „câți metri” – este recunoaștere de tipare, nu raționament spațial.
  • Raporturile sunt mai ușoare decât valorile absolute. „Acest zid este de aproximativ 3,5 ori mai lung decât este de înalt” este un judecată de proporție vizuală. Modelul nu trebuie să știe dimensiunea absolută – doar forma. Acest lucru ocolește complet ambiguitatea monoculară.
  • Referința de scară este reală. 12 cm pe strat nu este o presupunere – este o specificație de fabricație încorporată atât în produsul fizic, cât și în promptul de generare a imaginii. AI-ul „știe” grosimea scândurii pentru că a generat imaginea cu acea constrângere.
  • Libertatea creativă este păstrată. Spre deosebire de abordarea bazată pe catalog a V2, nu constrângem ce structuri poate crea generatorul. Forme în L, curbe, bănci integrate – orice este permis. Abordarea numărării straturilor funcționează pe orice formă, deoarece măsoară suprafața vizibilă a peretelui, nu categorii predefinite.
  • AI-ul observă, codul calculează. Am separat sarcina în ceea ce AI-ul face bine (recunoaștere vizuală a tiparelor) și ceea ce codul face bine (aritmetică). Niciunul nu face treaba celuilalt. Câmpul reasoning forțează modelul să descrie ce vede înainte de a oferi numere, ceea ce scoate la iveală estimări proaste în log-uri și menține rezultatele ancorate.

Ce s-a schimbat între abordări

V1: Măsurare directă V2: Clasificare în catalog V3: Numărare straturi
Ce întrebăm AI-ul „Câți metri?” „Ce tip și dimensiune?” „Câte straturi? Ce raport?”
Punct de ancorare Niciunul (ghicire) Catalog fix (constrângere) Strat de scândură de 12 cm (fizic)
Libertate creativă Completă Constrânsă (necesită tipuri predefinite) Completă
Precizie ±20-25% (imprevizibil) Inconsistentă (nu a fost lansată) ±20% (previzibil, conservator)
Interval de preț ±20% simetric Căutare fixă (fără interval) -20% / +10% (intenționat conservator)
Model Gemini 2.5 Pro (~0,005 $) Gemini 2.5 Flash (~0,001 $) Gemini 2.5 Flash (~0,001 $)
Status A funcționat, dar abandonat după cercetare Nu a fost lansat — prea restrictiv În producție

Intervalul de preț asimetric în V3 merită o mențiune. Biasăm în mod deliberat spre subestimare: -20% la limita inferioară, +10% la limita superioară. Am prefera să cotăm 160-210 € și prețul real să fie 190 € decât să cotăm 190-250 € și să speriem pe cineva înainte ca măcar să întrebe. Sub-promitere și supra-livrare este mai bine decât invers.

De la imagine generată la estimare de preț în 5 secunde

Iată ce se întâmplă după ce un utilizator generează un design de grădină:

Pentru utilizatorii înregistrați, estimarea prețului se declanșează automat – fără a fi nevoie de apăsarea unui buton. Imaginea generată este redimensionată la 1024px și trimisă unui al doilea model AI (Gemini 2.5 Flash, configurat pentru analiză vizuală la temperatura 0.2 pentru numărare deterministă). Aceasta este o apelare de model diferită de cea care a generat imaginea – generatorul creează, analistul măsoară.

Analistul returnează un JSON cu raționamentul său pentru fiecare structură: „4 straturi orizontale vizibile, zidul se extinde aproximativ 3,5× înălțimea, fața și latura vizibile.” Codul nostru înmulțește straturile cu 0,12m, aplică raportul, calculează m² și însumează totul.

Rezultatul apare direct sub imaginea generată – un panou verde cu un tabel de defalcare per structură. Fiecare rând arată: tipul structurii, dimensiunile (înălțime × lungime), fețele vizibile, suprafața zidului în m² și prețul estimat. Totalul arată X.XX m² × 120 €/m² cu intervalul de preț în text mare. Fără cutie neagră – utilizatorii pot vedea exact cum a fost calculată estimarea și pot judeca singuri dacă numărul de straturi pare corect.

Simultan, ajunge un e-mail cu aceeași defalcare plus imaginea grădinii. Dacă utilizatorul nu răspunde în 3 zile, urmează un singur memento: „Încă te gândești la grădina ta?” cu un buton cu un singur clic pentru a solicita o cotație exactă de la un om. Întregul lanț – generarea imaginii până la estimarea prețului și e-mail – costă sub 0,01 $.

Economia: 0,135 $ per imagine, 0,001 $ per cotație de preț

Construirea unui instrument bazat pe AI este un lucru. A-l face sustenabil economic este altceva. Iată cum arată cifrele în realitate.

Generarea imaginilor costă 0,134 $ per imagine. Folosim modelul de imagine Pro al Gemini – cel mai scump nivel. Am încercat modelul Flash mai ieftin la început. Calitatea rezultatului nu a fost suficient de bună: texturile arătau plate, granulația lemnului era inconsistentă, proporțiile scândurilor Brick se deviiau. Pentru un instrument unde calitatea vizuală este produsul, economisirea a 60% din costul de generare producând imagini care nu arată convingător nu a fost un compromis care să merite făcut. Doar Pro, fără alternativă.

Estimarea prețului costă 0,001 $ per cotație. Aici calculul este inversat – folosim Gemini 2.5 Flash pentru analiza vizuală. Numărarea straturilor de scânduri și estimarea proporțiilor nu necesită același model care generează imagini fotorealiste. Flash gestionează sarcinile de numărare în mod fiabil la o fracțiune din cost. Alegerea modelului potrivit pentru fiecare sarcină – Pro unde contează calitatea, Flash unde contează precizia unei sarcini specifice înguste – este diferența dintre un produs sustenabil și unul nesustenabil.

O sesiune tipică de utilizator arată așa:

Pas Model Cost
Generează design grădină (×2 gratuit) Gemini Pro (imagine) 0,268 $
Estimare preț Gemini 2.5 Flash (viziune) 0,001 $
Calcul preț + e-mail Node.js (fără apel API) 0,000 $
Total per sesiune ~0,27 $

Fiecare utilizator primește 2 generații gratuite fără înregistrare. Furnizarea unei adrese de e-mail deblochează încă 3 (5 în total pe zi). Dincolo de acestea, utilizatorii cumpără pachete de credite – 3 imagini pentru 1 € până la 50 pentru 10 €. La 0,134 $ per generație, marjele se ridică la aproximativ 40-60%, în funcție de dimensiunea pachetului.

Estimarea prețului în sine este întotdeauna gratuită – la 0,001 $ per cotație, blocarea acesteia în spatele unui paywall ar costa mai mult în pierderea de angajament decât economisește în taxe API. Și matematica prețurilor (straturi × 0,12m × raport × fețe × 120 €/m²) rulează în întregime în codul nostru, fără apeluri API. Odată ce Gemini Flash returnează numărul de straturi, tot restul este aritmetică deterministă.

De asemenea, optimizăm costurile de input la fiecare pas. Fotografiile încărcate de utilizatori sunt pre-procesate cu Sharp – redimensionate la maxim 2048px și golite de metadate EXIF înainte de a ajunge la API. Pentru analiza cotațiilor de preț, imaginea generată este comprimată suplimentar la 1024px JPEG. Trei fotografii de produs de referință sunt stocate în cache local și servite de pe disc, în loc să fie preluate de pe CDN la fiecare cerere. Promptul de generare este menținut sub 150 de cuvinte – peste 200, modelul de imagine începe să ignore părți din instrucțiune.

Modelul de afaceri: Pierdem bani din generare. Acesta este scopul.

Să fim sinceri în privința economiei. Majoritatea utilizatorilor generează 2-5 imagini folosind alocația lor gratuită și nu cumpără niciodată un pachet de credite. Cei puțini care cumpără credite nu acoperă nici pe departe costurile API totale pentru toți utilizatorii. Pe baza veniturilor pure din generare, operăm în pierdere.

Acest lucru este intenționat. AI Garden Designer nu este un produs – este un pâlnie.

Iată ce obținem de fapt de la un utilizator care generează un design de grădină și introduce adresa sa de e-mail:

  • Un lead „cald” cu intenție de cumpărare. Cineva care încarcă o fotografie a grădinii sale, generează un design cu straturi înălțate și revizuiește o estimare de preț nu este un simplu vizitator. El/ea ia în considerare activ un proiect de grădină. Acest lucru este calitativ diferit de cineva care a dat clic pe o reclamă.
  • Un punct de ancorare personalizat al prețului. Utilizatorul are acum un număr specific în minte – „grădina mea ar costa în jur de 350 €.” Acest lucru este mult mai eficient decât o pagină de produs generică care listează prețurile scândurilor pe bucată.
  • O imagine de care s-a îndrăgostit deja. A generat singur design-ul. A ales densitatea, stilul, aranjamentul. Există o proprietate în acea imagine pe care nicio fotografie de catalog nu o poate egala.

Secvența de e-mailuri consolidează acest lucru. Imediat după generarea unui design, utilizatorul primește un e-mail cu cotația de preț, cu imaginea grădinii încorporată – design-ul specific pe care l-a creat, nu o fotografie de stoc. E-mailul include o defalcare per structură (tip, suprafață zid, preț estimat) și un buton proeminent pentru a solicita o cotație exactă de la un om.

Dacă nu răspund în trei zile, ajunge un singur memento: „Încă te gândești la grădina ta?” – aceeași imagine, același interval de preț, același buton cu un singur clic. Doar un singur memento, nu o campanie de tip „drip”. Vrem să fim de ajutor, nu enervanți.

Sub design-ul generat pe site, există întotdeauna două CTA-uri: un link către Configuratorul 3D unde pot specifica dimensiuni exacte, și un link către magazinul electronic. Călătoria de la „Mă întreb cum ar putea arăta grădina mea” la „Configurez comanda mea” se poate întâmpla într-o singură sesiune.

Despre confidențialitate: trimiterea e-mailului este întotdeauna însoțită de un link către politica noastră de confidențialitate și o notă clară că utilizatorii se pot dezabona oricând. E-mailul cu cotația de preț este tranzacțional – utilizatorul a solicitat în mod explicit o estimare de preț. E-mailurile de marketing (newsletter) necesită o bifă separată de consimțământ explicit. Stocăm doar ceea ce este necesar: e-mail, localitate, imaginea design-ului și defalcarea prețului. Conformitatea GDPR nu este doar o cerință legală – este singura modalitate de a construi încredere cu oamenii care îți oferă datele lor de contact alături de o fotografie a casei lor.

Lecția mai mare: Cere AI-ului să observe, nu să răspundă

Greșeala din V1 nu a fost utilizarea AI pentru sarcini spațiale – ci cererea ca modelul să producă direct răspunsul final. „Câți metri are asta?” necesită ca modelul să rezolve ambiguitatea monoculară, să convertească caracteristicile vizuale în unități fizice și să producă un număr calibrat. Aceasta sunt trei probleme dificile suprapuse.

V3 o descompune în bucăți. „Câte straturi orizontale?” este o sarcină de numărare – unul dintre cele mai fiabile lucruri pe care le fac modelele de viziune. „De câte ori mai lung decât înalt?” este o estimare de proporție – de asemenea, fiabilă, deoarece rapoartele sunt invariante la scară. Conversia din straturi în metri și din rapoarte în dimensiuni absolute este un cod determinist cu o constantă fizică cunoscută.

Același principiu se aplică dincolo de cazul nostru de utilizare:

  • Nu întreba „cât de înalt este acest clădire?” – întreabă „câte etaje?” și înmulțește cu înălțimea standard a unui etaj.
  • Nu întreba „cât de lată este această cameră?” – întreabă „câte plăci pe lățime?” și înmulțește cu dimensiunea unei plăci.
  • Nu întreba „cât de lung este acest gard?” – întreabă „câți stâlpi?” și înmulțește cu distanța standard dintre stâlpi.

Dacă produsul sau scena ta conține orice element repetat, vizibil, consistent dimensional, ai deja o riglă. Nu ai nevoie ca AI-ul să măsoare – ai nevoie doar ca el să numere.

Încearcă singur

Încarcă o fotografie a grădinii tale, lasă AI-ul să o proiecteze cu straturi înălțate modulare și obține o estimare instantanee de preț. Întregul proces durează aproximativ 30 de secunde. Design-ul și estimarea prețului sunt gratuite.

Obține o estimare de preț în 30 de secunde

Încarcă o fotografie → AI generează design-ul grădinii tale → defalcare instantanee a prețului.

Încearcă AI Garden Designer Sau folosește configuratorul 3D

Întrebări frecvente

Cât de precise sunt estimările de preț generate de AI din imaginile grădinilor?

Sistemul nostru atinge o precizie de aproximativ ±20%, cu un interval asimetric intenționat conservator (-20%/+10%). Acest lucru înseamnă că estimările tind să fie ușor mai mici decât prețul real, mai degrabă decât mai mari – preferăm să sub-promitem decât să supra-estimăm.

Ce model AI este folosit pentru estimarea prețului?

Folosim Gemini 2.5 Flash de la Google pentru analiza vizuală. Fiecare estimare costă aproximativ 0,001 $ (o zecime de cent). Am trecut de la mai scumpul Gemini 2.5 Pro după ce am constatat că Flash performează comparabil pentru cazul nostru specific de numărare a straturilor structurale.

Poate AI-ul să măsoare cu adevărat dimensiuni dintr-o singură fotografie?

Nu direct – cercetările arată că modelele AI de viziune greșesc măsurătorile absolute în 63% din cazuri. Abordarea noastră ocolește acest lucru folosind structura proprie a produsului (straturi de scânduri de 12 cm) ca referință de scară încorporată. AI-ul numără straturile și estimează proporții, apoi codul nostru face calculele.

De ce să nu folosiți GPT-4 Vision în loc de Gemini?

Gemini Flash este aproximativ de 4 ori mai ieftin, cu performanțe comparabile de raționament spațial pentru cazul nostru specific de utilizare. Deoarece facem un apel API per estimare, costul per apel contează – la 0,001 $ fiecare, putem oferi estimări gratuite nelimitate.

Poate această abordare să funcționeze și pentru alte produse?

Da – dacă produsul dvs. are orice caracteristică cunoscută, vizibilă, consistentă dimensional, care apare în imagini. Cursurile de cărămidă în zidărie, plăcile de pardoseală, lățimile standard ale cherestelei, blocurile de beton – orice cu o dimensiune fixă în lumea reală pe care AI-ul o poate număra poate servi ca referință de scară.

Este estimarea prețului o cotație fermă?

Nu, este o estimare indicativă pentru a vă ajuta să planificați. Puteți solicita o cotație exactă printr-un singur clic – un om revizuiește design-ul și oferă un preț precis în 24 de ore.

Înapoi la blog