AI Price Estimation From Images: 3 Attempts, 1 Working Solution — GridGarden

Stima Prezzi AI da Immagini: 3 Tentativi, 1 Soluzione Funzionante

TL;DR: I modelli di visione AI, secondo quanto riportato, sbagliano le misurazioni il 63% delle volte. Ogni buona pratica consiglia "non misurare dalle immagini — classifica invece". Abbiamo provato entrambi. La classificazione significava limitare il nostro generatore di immagini AI a un catalogo fisso, il che ha ucciso la produzione creativa. Così abbiamo trovato una terza via: usare il prodotto stesso come righello. Ogni strato del nostro sistema modulare è esattamente di 12 cm. L'AI conta gli strati, noi facciamo i calcoli, tu ottieni una stima del prezzo in 5 secondi per $0.001.

Perché Tutti Dicono "L'AI Non Può Misurare Dalle Foto"?

Nel 2024, i ricercatori di Google hanno pubblicato SpatialVLM — un benchmark che testa quanto bene i modelli di visione-linguaggio comprendono le relazioni spaziali. I risultati sono stati sconfortanti: quando è stato chiesto di stimare distanze e dimensioni da foto, i modelli all'avanguardia rientravano nell'intervallo corretto (da 0,5× a 2× della realtà) solo il 37,2% delle volte. Quasi due terzi delle stime erano sbagliate di oltre il doppio.

Uno studio successivo, SpatiaLab (2026), ha confermato che il problema è profondo — i benchmark precedenti in realtà sovrastimavano quanto bene questi modelli percepiscono lo spazio. I numeri reali sono peggiori.

Il problema fondamentale è chiamato ambiguità monoculare: da una singola immagine 2D senza un punto di riferimento, è fisicamente impossibile recuperare dimensioni 3D assolute. Un vaso di 30 cm fotografato da vicino appare identico a una fioriera di 3 m ripresa da lontano. Nessuna quantità di dati di training cambia questo — non è una limitazione dell'AI, è geometria.

E le immagini generate dall'AI lo rendono ancora più difficile. Le foto reali almeno contengono metadati EXIF (lunghezza focale, dimensione del sensore) che potrebbero teoricamente ancorare i calcoli prospettici. Le immagini generate non ne hanno.

È interessante notare che la ricerca ha anche rivelato dove si trova effettivamente il collo di bottiglia: il problema del passaggio visione-linguaggio. L'encoder visivo rappresenta correttamente le informazioni spaziali internamente — ma il modello linguistico non riesce a estrarle quando genera risposte testuali. Il modello "vede" le dimensioni più accuratamente di quanto possa "dirle".

Quindi, quando abbiamo deciso di costruire stime automatiche dei prezzi per i design di giardini generati dall'AI, il consenso accademico era chiaro: non misurare. Classificare.

Ecco cosa fa invece l'industria:

Azienda Approccio Misura da foto?
Zillow Zestimate Classifica le caratteristiche (granito vs laminato), usa dati di vendita comparabili No — oltre 1M di campioni di training, solo classificazione
SimplyWise Classifica il tipo di progetto → tabelle prezzi regionali No — precisione ±10-15%, nessuna misurazione pixel
Hover 8-10 foto → ricostruzione 3D + QA umano Sì — ma richiede angolazioni multiple e impiega circa 1 ora
Pianificatore di Giardini AI, Planner 5D, ecc. Solo visualizzazione — nessun prezzo N/A

Nessuno nello spazio del design di giardini AI (mercato da 1,72 miliardi di dollari, in crescita con un CAGR del 21,4%) offre stime di prezzo da design generati. Nessun concorrente. Abbiamo deciso di provare comunque.

Come la Nostra AI Genera Design di Giardini (E Perché Questo Rende Difficile la Stima dei Prezzi)

Prima di addentrarci nella stima dei prezzi, è utile capire cosa stiamo prezzando. Il nostro Designer di Giardini AI consente agli utenti di caricare una foto del loro giardino reale. L'AI genera quindi una visualizzazione fotorealistica di come quello spazio potrebbe apparire con orti rialzati modulari.

Il generatore di immagini (Gemini Imagen) riceve due tipi di input:

  • Vincoli di prodotto: Tre foto di riferimento del nostro sistema Brick — scatti reali del prodotto che mostrano la costruzione a strati di assi, gli angoli a incastro, la texture del larice invecchiato. Più una descrizione testuale dettagliata: "assi spesse (120 mm di altezza × 60 mm di spessore), impilate orizzontalmente con giunti sfalsati riga per riga come una muratura a mattoni".
  • Libertà creativa: Tutto il resto — quante strutture, dove vanno, che forme assumono, come si relazionano al giardino esistente. L'AI decide il layout, la disposizione, i tipi di orti rialzati. Una forma a L che avvolge un albero? Una panca integrata in un muro di contenimento? Una serie di scale che seguono una pendenza? Tutto dipende dal modello.

Gli utenti controllano uno slider di densità (0-100) che corrisponde a circa 0-20 strutture. Con densità 25, si ottiene un giardino naturalistico con alcuni orti rialzati discreti annidati tra i fiori selvatici. Con densità 80, si ottiene uno spazio abitativo esterno completamente organizzato con zone distinte collegate da sentieri. L'AI sceglie quali tipi di strutture hanno senso per la scena.

Questa libertà creativa è il punto focale dello strumento. Nessuno vuole un configuratore che produce sempre gli stessi tre orti rialzati rettangolari. Ma crea un problema fondamentale di prezzo: ogni immagine generata è unica. Non esiste una distinta base predefinita. Nessun elenco di SKU. Solo un'immagine fotorealistica di strutture in legno che potrebbero essere qualsiasi cosa, da una singola fioriera a un elaborato giardino multi-zona.

Quindi, come si valuta qualcosa che non esiste ancora, da un'immagine generata 5 secondi fa?

Tentativo #1: Chiedere Semplicemente all'AI le Dimensioni

Il nostro primo approccio è stato il più ingenuo: dare a Gemini 2.5 Pro l'immagine del giardino generata e chiedergli di stimare le dimensioni in metri.

// Il prompt che abbiamo messo in produzione
You are an expert at estimating dimensions of garden structures
from photographs.

For EACH distinct wooden structure you can identify
(raised beds, benches, walls, stairs, planters),
estimate its dimensions in meters:
- length_m: the longest horizontal dimension
- width_m: the shorter horizontal dimension (depth)
- height_m: the vertical dimension

Return JSON:
{ "structures": [
    { "type": "raised_bed",
      "length_m": 2.0, "width_m": 1.0, "height_m": 0.6 }
]}

La stima dei prezzi era una geometria semplice — calcolare l'area superficiale visibile della parete e moltiplicare per €125/m²:

// Calcolo dell'area della parete per tipo di struttura:
// raised_bed: 2 × (length + width) × height
// wall: 2 × length × height
// stairs: length × height × 1.5
const wallArea = 2 * (s.length_m + s.width_m) * s.height_m;
const price = wallArea * 125; // EUR per m²

Ha funzionato. Meglio di quanto ci aspettassimo. Un orto rialzato che era effettivamente lungo 1,8 m tornava come 1,4 m o 2,2 m — le singole dimensioni erano imprecise, ma la geometria compensava: quando la lunghezza era sovrastimata, l'altezza tendeva a essere sottostimata. La stima del prezzo finiva entro ±20-25% della realtà. Per una stima gratuita e istantanea da un'immagine generata dall'AI, sembrava sorprendentemente utile.

Il modello era particolarmente bravo a contare le strutture — se l'immagine mostrava 3 orti rialzati e una panca, generalmente trovava 3 orti rialzati e una panca. Capiva come appariva il nostro sistema Brick. Le dimensioni erano approssimative, ma il rilevamento delle strutture era solido.

Ma poi abbiamo letto i documenti. Il tasso di accuratezza del 37,2% di SpatialVLM. La documentazione di Google stessa che metteva in guardia contro la misurazione spaziale da singole immagini. Thread di Stack Overflow pieni di "questo è fondamentalmente impossibile". Ci siamo spaventati.

"Questo non può funzionare a lungo termine", ci siamo detti. "Stiamo solo avendo fortuna. Facciamolo nel modo giusto — nel modo che tutti raccomandano."

Tentativo #2: Il Modo "Corretto" — Classificazione del Catalogo

L'approccio raccomandato è chiaro: non misurare, classificare. Identificare il tipo di struttura, assegnarla a una categoria di dimensioni, cercare un prezzo fisso. Nessuna misurazione, nessuna ambiguità. Questo è ciò che fa Zillow. Questo è ciò che fa SimplyWise. Questo è ciò che la ricerca dice di fare.

L'idea era semplice:

// Classifica il tipo di struttura + dimensione → ricerca prezzo fisso
const PRICE_TABLE = {
  raised_bed: { small: 50, medium: 100, large: 180 },
  wall:       { small: 25, medium: 50,  large: 90 },
  bench:      { small: 30, medium: 60,  large: 100 },
  stairs:     { small: 45, medium: 90,  large: 140 },
  planter:    { small: 15, medium: 30,  large: 55 }
};

Ma abbiamo incontrato un problema che non avevamo previsto — e non aveva nulla a che fare con l'accuratezza dell'AI.

Il nostro designer di giardini AI genera design creativi. Un utente carica una foto del suo giardino, e Gemini Imagen crea una visualizzazione unica con orti rialzati modulari disposti per adattarsi a quello specifico spazio. Le strutture che genera sono varie — forme a L, curve che seguono un sentiero del giardino, orti rialzati integrati in pendenze, panche collegate a orti rialzati, disposizioni a più livelli che sfumano il confine tra "scale" e "muro".

Per far funzionare la classificazione del catalogo, avremmo dovuto vincolare il generatore di immagini. "Genera solo questi 5 tipi. Genera solo queste 3 dimensioni. Mantieni tutto rettangolare." Questo avrebbe reso la stima dei prezzi accurata — ma avrebbe ucciso ciò che rende lo strumento prezioso: i design creativi e personalizzati.

Stavamo affrontando un compromesso fondamentale: prezzi accurati vs. libertà creativa nelle immagini generate.

E anche quando abbiamo cercato di far funzionare la classificazione senza vincolare il generatore, i risultati sono stati scarsi:

  • "Piccolo/Medio/Grande" non significava nulla per il modello. Senza un oggetto di riferimento nell'immagine, lo stesso orto rialzato era "piccolo" in un'analisi e "grande" nella successiva. Non esiste un ancoraggio fisico per queste parole — "medio" è un concetto linguistico, non una misurazione.
  • Le strutture creative non rientrano in categorie precise. Un orto rialzato a forma di L è un "grande" orto rialzato o due "medi"? Una panca integrata in un orto rialzato è una "panca" o parte dell'orto rialzato? Le categorie erano troppo rigide per ciò che il generatore produceva effettivamente.
  • Ci siamo ritrovati ad aggiungere hack. Uno sconto per sovracontaggio (-15% per ogni struttura oltre 3, perché il modello allucinava extra). Un passaggio di riclassificazione. Una tabella di override manuale. Ogni hack era un segno che l'approccio non si adattava al nostro caso d'uso.

Il problema centrale: la stima dei prezzi da catalogo presuppone un catalogo. Funziona per Zillow perché le case hanno tipi noti (ranch, coloniale, a più livelli) con decenni di dati di vendita comparabili. Funziona per SimplyWise perché i progetti di costruzione si mappano a categorie standardizzate. La nostra AI genera design unici ogni volta — non c'è un catalogo contro cui classificare.

Non abbiamo mai rilasciato questa versione. Invece, siamo tornati a ciò che funzionava effettivamente — la misurazione — ma con un'intuizione cruciale.

Tentativo #3: Rendere il Prodotto il Righello

La ricerca aveva ragione su una cosa: non si possono recuperare dimensioni assolute da una singola immagine senza un punto di riferimento. Ma si sbagliava su un'ipotesi — che non esistesse alcun punto di riferimento.

Il nostro prodotto ha un righello integrato.

Il sistema modulare Brick utilizza assi di legno spesse 60 mm che si impilano l'una sull'altra. Ogni strato orizzontale — visibile come una linea distinta in ogni immagine generata — è esattamente alto 12 cm (0,12 m). Questa è una costante fisica del prodotto. È la stessa in ogni immagine, ogni design, ogni angolazione. E il generatore di immagini lo sa già — ogni prompt specifica "sistema Brick da 60 mm", quindi le assi vengono renderizzate in modo coerente.

Con la V1, avevamo chiesto: "Quanti metri è lungo questo orto rialzato?" — una domanda che richiede la risoluzione del problema dell'ambiguità monoculare.

Con la V3, chiediamo: "Quanti strati di assi vedi, e quante volte la parete è più lunga rispetto alla sua altezza?" — domande che richiedono solo conteggio e stima di una proporzione. Entrambe sono cose che i modelli di visione fanno bene.

// Il prompt effettivo in produzione (v3)
SCALE REFERENCE: Each horizontal plank layer = exactly 12cm
(0.12m) tall. Count layers to get the height, then estimate
length relative to the known height.

MEASURE each structure:
- layers: count visible horizontal plank layers (each = 12cm)
- length_ratio: how many times longer the wall is vs its height
- visible_faces: how many wall faces are visible

VERIFY: Typical gardens have 2-5 structures.
If you found >6, you likely overcounted.

Return JSON:
{"structures": [
  {"reasoning": "4 horizontal layers visible, wall extends
    about 3.5x the height, front and side visible",
   "type": "raised_bed",
   "layers": 4,
   "length_ratio": 3.5,
   "visible_faces": 2}
]}

Il motore di stima dei prezzi esegue l'aritmetica:

const LAYER_HEIGHT_M = 0.12;
const PRICE_PER_M2 = 120;

function calculatePrice(structure) {
  const height = structure.layers * LAYER_HEIGHT_M;
  // 4 layers = 0.48m

  const length = height * structure.length_ratio;
  // 0.48m × 3.5 = 1.68m

  const faceArea = height * length;
  // 0.48 × 1.68 = 0.81 m²

  const totalM2 = faceArea * structure.visible_faces;
  // 2 faces = 1.61 m²

  return totalM2 * PRICE_PER_M2;
  // 1.61 × €120 = €193
}

Perché questo funziona dove V1 e V2 non funzionavano:

  • Il conteggio è ciò che i modelli di visione fanno bene. Le linee orizzontali nelle strutture di assi impilate sono caratteristiche visive ad alto contrasto e ripetitive. Contare strati discreti è fondamentalmente diverso dallo stimare "quanti metri" — è riconoscimento di pattern, non ragionamento spaziale.
  • I rapporti sono più facili degli assoluti. "Questa parete è circa 3,5 volte più lunga che alta" è un giudizio di proporzione visiva. Il modello non ha bisogno di conoscere la dimensione assoluta — solo la forma. Questo aggira completamente l'ambiguità monoculare.
  • Il riferimento di scala è reale. 12 cm per strato non è un'ipotesi — è una specifica di produzione incorporata sia nel prodotto fisico che nel prompt di generazione dell'immagine. L'AI "conosce" lo spessore dell'asse perché ha generato l'immagine con quel vincolo.
  • La libertà creativa è preservata. A differenza dell'approccio del catalogo della V2, non vincoliamo quali strutture il generatore può creare. Forme a L, curve, panche integrate — tutto è permesso. L'approccio del conteggio degli strati funziona su qualsiasi forma perché misura la superficie visibile della parete, non categorie predefinite.
  • L'AI osserva, il codice calcola. Abbiamo separato il compito in ciò che l'AI fa bene (riconoscimento di pattern visivi) e ciò che il codice fa bene (aritmetica). Nessuno dei due fa il lavoro dell'altro. Il campo reasoning costringe il modello a descrivere ciò che vede prima di fornire numeri, il che evidenzia stime errate nei log e mantiene gli output ancorati alla realtà.

Cosa è Cambiato Tra gli Approcci

V1: Misurazione Diretta V2: Classificazione del Catalogo V3: Conteggio degli Strati
Cosa chiediamo all'AI "Quanti metri?" "Che tipo e dimensione?" "Quanti strati? Che rapporto?"
Punto di ancoraggio Nessuno (indovinando) Catalogo fisso (vincolante) Strato di assi da 12 cm (fisico)
Libertà creativa Completa Vincolata (richiede tipi predefiniti) Completa
Accuratezza ±20-25% (imprevedibile) Inconsistente (mai rilasciata) ±20% (prevedibile, conservativa)
Intervallo di prezzo ±20% simmetrico Ricerca fissa (nessun intervallo) -20% / +10% (intenzionalmente conservativo)
Modello Gemini 2.5 Pro (~$0.005) Gemini 2.5 Flash (~$0.001) Gemini 2.5 Flash (~$0.001)
Stato Ha funzionato, ma abbandonato dopo la ricerca Mai rilasciata — troppo vincolante In produzione

L'intervallo di prezzo asimmetrico nella V3 merita una nota. Abbiamo deliberatamente una tendenza alla sottostima: -20% all'estremità inferiore, +10% all'estremità superiore. Preferiamo quotare €160-€210 e avere il prezzo reale di €190 piuttosto che quotare €190-€250 e spaventare qualcuno prima ancora che chieda. Promettere di meno e fornire di più è meglio del contrario.

Dall'Immagine Generata alla Stima del Prezzo in 5 Secondi

Ecco cosa succede dopo che un utente genera un design di giardino:

Per gli utenti registrati, la stima del prezzo si attiva automaticamente — nessun clic su un pulsante necessario. L'immagine generata viene ridimensionata a 1024px e inviata a un secondo modello AI (Gemini 2.5 Flash, configurato per l'analisi visiva a temperatura 0.2 per un conteggio deterministico). Questa è una chiamata a un modello diverso da quello che ha generato l'immagine — il generatore crea, l'analizzatore misura.

L'analizzatore restituisce un JSON con il suo ragionamento per ogni struttura: "4 strati orizzontali visibili, la parete si estende circa 3,5 volte l'altezza, fronte e lato visibili". Il nostro codice moltiplica gli strati per 0,12 m, applica il rapporto, calcola i m² e somma tutto.

Il risultato appare direttamente sotto l'immagine generata — un pannello verde con una tabella di ripartizione per struttura. Ogni riga mostra: tipo di struttura, dimensioni (altezza × lunghezza), facce visibili, area della parete in m² e prezzo stimato. Il totale mostra X.XX m² × €120/m² con l'intervallo di prezzo in testo grande. Nessuna scatola nera — gli utenti possono vedere esattamente come è stata calcolata la stima e giudicare da soli se il conteggio degli strati sembra corretto.

Contemporaneamente, arriva un'email con la stessa ripartizione più l'immagine del giardino. Se l'utente non risponde entro 3 giorni, segue un unico promemoria: "Stai ancora pensando al tuo giardino?" con un pulsante a un clic per richiedere un preventivo esatto da un essere umano. L'intera catena — dalla generazione dell'immagine alla stima del prezzo all'email — costa meno di $0.01.

L'Economia: $0.135 Per Immagine, $0.001 Per Preventivo

Costruire uno strumento basato sull'AI è una cosa. Renderlo economicamente sostenibile è un'altra. Ecco come appaiono effettivamente i numeri.

La generazione di immagini costa $0.134 per immagine. Utilizziamo il modello di immagine Pro di Gemini — il livello più costoso. Abbiamo provato il modello Flash più economico all'inizio. La qualità dell'output non era abbastanza buona: le texture apparivano piatte, la venatura del legno era inconsistente, le proporzioni delle assi Brick si discostavano. Per uno strumento in cui la qualità visiva è il prodotto, risparmiare il 60% sul costo di generazione producendo immagini che non sembrano convincenti non era un compromesso che valeva la pena fare. Solo Pro, nessun fallback.

La stima del prezzo costa $0.001 per preventivo. Qui il calcolo è invertito — utilizziamo Gemini 2.5 Flash per l'analisi visiva. Contare gli strati di assi e stimare le proporzioni non richiede lo stesso modello che genera immagini fotorealistiche. Flash gestisce in modo affidabile i compiti di conteggio a una frazione del costo. Scegliere il modello giusto per ogni compito — Pro dove la qualità conta, Flash dove conta l'accuratezza di un compito specifico e ristretto — è la differenza tra un prodotto sostenibile e uno insostenibile.

Una tipica sessione utente si presenta così:

Passo Modello Costo
Genera design del giardino (×2 gratuiti) Gemini Pro (immagine) $0.268
Stima del prezzo Gemini 2.5 Flash (visione) $0.001
Calcolo del prezzo + email Node.js (nessuna chiamata API) $0.000
Totale per sessione ~$0.27

Ogni utente riceve 2 generazioni gratuite senza registrazione. Fornire un'email sblocca altre 3 (5 totali al giorno). Oltre a ciò, gli utenti acquistano pacchetti di crediti — 3 immagini per €1 fino a 50 per €10. A $0.134 per generazione, i margini si attestano a circa il 40-60% a seconda della dimensione del pacchetto.

La stima del prezzo in sé è sempre gratuita — a $0.001 per preventivo, limitarla dietro un paywall costerebbe più in termini di engagement perso di quanto risparmi in commissioni API. E il calcolo del prezzo (strati × 0,12 m × rapporto × facce × €120/m²) viene eseguito interamente nel nostro codice con zero chiamate API. Una volta che Gemini Flash restituisce il conteggio degli strati, tutto il resto è aritmetica deterministica.

Ottimizziamo anche i costi di input ad ogni passaggio. Le foto caricate dagli utenti vengono pre-elaborate con Sharp — ridimensionate a un massimo di 2048px e private dei dati EXIF prima di raggiungere l'API. Per l'analisi del preventivo, l'immagine generata viene ulteriormente compressa a 1024px JPEG. Tre foto di riferimento del prodotto vengono memorizzate nella cache localmente e servite dal disco anziché essere recuperate da CDN ad ogni richiesta. Il prompt di generazione è mantenuto sotto le 150 parole — sopra le 200, il modello di immagine inizia a ignorare parti dell'istruzione.

Il Modello di Business: Perdiamo Soldi sulla Generazione. Questo è il Punto.

Siamo onesti riguardo all'economia. La maggior parte degli utenti genera 2-5 immagini utilizzando la loro quota gratuita e non acquista mai un pacchetto di crediti. I pochi che acquistano crediti non si avvicinano a coprire i costi totali dell'API per tutti gli utenti. Sul puro ricavo da generazione, operiamo in perdita.

Questo è intenzionale. Il Designer di Giardini AI non è un prodotto — è un imbuto.

Ecco cosa otteniamo effettivamente da un utente che genera un design di giardino e inserisce la sua email:

  • Un lead "caldo" con intento di acquisto. Qualcuno che carica una foto del suo giardino, genera un design con orti rialzati e rivede una stima del prezzo non è un semplice navigatore. Sta attivamente considerando un progetto di giardino. Questo è qualitativamente diverso da qualcuno che ha cliccato su un annuncio.
  • Un ancoraggio di prezzo personalizzato. L'utente ora ha un numero specifico in testa — "il mio giardino costerebbe circa €350". Questo è molto più efficace di una pagina di prodotto generica che elenca i prezzi delle assi al pezzo.
  • Una visualizzazione di cui si è già innamorato. Ha generato il design da solo. Ha scelto la densità, lo stile, la disposizione. C'è un senso di proprietà in quell'immagine che nessuna foto di catalogo può eguagliare.

La sequenza di email rafforza questo. Immediatamente dopo aver generato un design, l'utente riceve un'email con la stima del prezzo e l'immagine del suo giardino incorporata — il design specifico che ha creato, non una foto stock. L'email include una ripartizione per struttura (tipo, area della parete, prezzo stimato) e un pulsante prominente per richiedere un preventivo esatto da un essere umano.

Se non risponde entro tre giorni, arriva un unico promemoria: "Stai ancora pensando al tuo giardino?" — stessa immagine, stesso intervallo di prezzo, stesso pulsante a un clic. Solo un promemoria, non una campagna a goccia. Vogliamo essere utili, non fastidiosi.

Sotto il design generato sul sito web, ci sono sempre due CTA: un link al Configuratore 3D dove possono specificare le dimensioni esatte, e un link per sfogliare l'e-shop. Il percorso da "Mi chiedo come potrebbe apparire il mio giardino" a "Sto configurando il mio ordine" può avvenire in una singola sessione.

Sulla privacy: l'invio dell'email è sempre accompagnato da un link alla nostra politica sulla privacy e da una chiara nota che gli utenti possono disiscriversi in qualsiasi momento. L'email di preventivo è transazionale — l'utente ha esplicitamente richiesto una stima del prezzo. Le email di marketing (newsletter) richiedono una casella di spunta di opt-in esplicita separata. Memorizziamo solo ciò che è necessario: email, locale, l'immagine del design e la ripartizione del prezzo. La conformità al GDPR non è solo un requisito legale — è l'unico modo per costruire fiducia con le persone che ti forniscono i loro dettagli di contatto insieme a una foto della loro casa.

La Lezione Più Grande: Chiedi all'AI di Osservare, Non di Rispondere

L'errore nella V1 non è stato usare l'AI per compiti spaziali — è stato chiedere al modello di produrre direttamente la risposta finale. "Quanto è lungo questo?" richiede al modello di risolvere l'ambiguità monoculare, convertire le caratteristiche visive in unità fisiche e produrre un numero calibrato. Sono tre problemi difficili impilati insieme.

La V3 lo scompone in pezzi. "Quanti strati orizzontali?" è un compito di conteggio — una delle cose più affidabili che i modelli di visione fanno. "Quante volte più lungo che alto?" è una stima di proporzione — anch'essa affidabile, perché i rapporti sono invarianti alla scala. La conversione da strati a metri, e da rapporti a dimensioni assolute, è codice deterministico con una costante fisica nota.

Lo stesso principio si applica oltre il nostro caso d'uso:

  • Non chiedere "quanto è alto questo edificio?" — chiedi "quanti piani?" e moltiplica per l'altezza standard del piano.
  • Non chiedere "quanto è larga questa stanza?" — chiedi "quante piastrelle in larghezza?" e moltiplica per la dimensione della piastrella.
  • Non chiedere "quanto è lunga questa recinzione?" — chiedi "quanti pali?" e moltiplica per la spaziatura standard.

Se il tuo prodotto o scena contiene un elemento ripetuto, visibile e dimensionalmente coerente, hai già un righello. Non hai bisogno che l'AI misuri — hai solo bisogno che conti.

Provalo Tu Stesso

Carica una foto del tuo giardino, lascia che l'AI lo progetti con orti rialzati modulari e ottieni una stima del prezzo istantanea. L'intero processo richiede circa 30 secondi. Il design e la stima del prezzo sono gratuiti.

Ottieni una Stima del Prezzo in 30 Secondi

Carica una foto → l'AI genera il design del tuo giardino → ripartizione istantanea del prezzo.

Prova il Designer di Giardini AI O Usa il Configuratore 3D

Domande Frequenti

Quanto sono accurate le stime di prezzo generate dall'AI per le immagini di giardini?

Il nostro sistema raggiunge un'accuratezza di circa ±20%, con un intervallo asimmetrico intenzionalmente conservativo (-20%/+10%). Ciò significa che le stime tendono ad essere leggermente inferiori al prezzo effettivo piuttosto che superiori — preferiamo promettere di meno che sovrastimare.

Quale modello AI viene utilizzato per la stima del prezzo?

Utilizziamo Gemini 2.5 Flash di Google per l'analisi visiva. Ogni stima costa circa $0.001 (un decimo di centesimo). Siamo passati dal più costoso Gemini 2.5 Pro dopo aver scoperto che Flash si comporta in modo comparabile per il nostro caso d'uso specifico di conteggio degli strati strutturali.

L'AI può davvero misurare le dimensioni da una singola foto?

Non direttamente — la ricerca mostra che i modelli di visione AI sbagliano le misurazioni assolute il 63% delle volte. Il nostro approccio aggira questo problema utilizzando la struttura del prodotto stesso (strati di assi da 12 cm) come riferimento di scala integrato. L'AI conta gli strati e stima le proporzioni, quindi il nostro codice esegue i calcoli.

Perché non usare GPT-4 Vision invece di Gemini?

Gemini Flash è circa 4 volte più economico con prestazioni di ragionamento spaziale comparabili per il nostro caso d'uso specifico. Dato che effettuiamo una chiamata API per stima, il costo per chiamata è importante — a $0.001 ciascuno, possiamo offrire stime gratuite illimitate.

Questo approccio può funzionare per altri prodotti?

Sì — se il tuo prodotto ha una caratteristica nota, visibile e dimensionalmente coerente che appare nelle immagini. Corsi di mattoni in muratura, piastrelle, larghezze standard del legname, blocchi di cemento — qualsiasi cosa con una dimensione fissa nel mondo reale che l'AI può contare può servire come riferimento di scala.

La stima del prezzo è un preventivo vincolante?

No, è una stima indicativa per aiutarti a pianificare. Puoi richiedere un preventivo esatto con un clic — un essere umano esamina il design e fornisce un prezzo preciso entro 24 ore.

Torna al blog