AI Price Estimation From Images: 3 Attempts, 1 Working Solution — GridGarden

AI odhad ceny z fotek: 3 pokusy, 1 funkční řešení

TL;DR: Modely AI pro zpracování obrazu údajně chybují v měření v 63 % případů. Každá osvědčená praxe říká „neměřte z obrázků – místo toho klasifikujte.“ Vyzkoušeli jsme obojí. Klasifikace znamenala omezení našeho generátoru obrázků AI na pevný katalog, což zabilo kreativní výstup. Našli jsme tedy třetí cestu: použít samotný produkt jako pravítko. Každá vrstva našeho modulárního systému je přesně 12 cm. AI spočítá vrstvy, my provedeme výpočet a vy získáte odhad ceny za 5 sekund za 0,001 USD.

Proč všichni říkají, že „AI neumí měřit z fotografií“?

V roce 2024 vědci z Google publikovali SpatialVLM – benchmark testující, jak dobře vizuálně-jazykové modely rozumí prostorovým vztahům. Výsledky byly střízlivé: při požadavku na odhad vzdáleností a rozměrů z fotografií se nejmodernější modely trefily do správného rozsahu (0,5× až 2× reality) pouze ve 37,2 % případů. Téměř dvě třetiny odhadů se lišily více než dvojnásobně.

Následná studie, SpatiaLab (2026), potvrdila, že problém je hluboký – dřívější benchmarky ve skutečnosti přeceňovaly, jak dobře tyto modely vnímají prostor. Skutečná čísla jsou horší.

Základní problém se nazývá monokulární nejednoznačnost: z jediného 2D obrázku bez referenčního bodu je fyzicky nemožné obnovit absolutní 3D rozměry. 30cm květináč vyfotografovaný zblízka vypadá identicky jako 3m truhlík vyfocený z dálky. Žádné množství tréninkových dat to nezmění – nejde o omezení AI, ale o geometrii.

A obrázky generované AI to ještě ztěžují. Skutečné fotografie alespoň nesou EXIF metadata (ohnisková vzdálenost, velikost snímače), která by teoreticky mohla ukotvit výpočty perspektivy. Generované obrázky nic z toho nemají.

Zajímavé je, že výzkum také odhalil, kde skutečně leží úzké hrdlo: problém předávání vizuálně-jazykových informací. Vizuální kodér skutečně správně reprezentuje prostorové informace interně – ale jazykový model je nedokáže extrahovat při generování textových odpovědí. Model „vidí“ rozměry přesněji, než je dokáže „vyjádřit“.

Když jsme se tedy rozhodli vytvořit automatické odhady cen pro AI-generované návrhy zahrad, akademický konsensus byl jasný: neměřte. Klasifikujte.

Zde je to, co dělá průmysl místo toho:

Společnost Přístup Měří z fotografií?
Zillow Zestimate Klasifikuje prvky (žula vs. laminát), používá srovnatelná prodejní data Ne – 1M+ tréninkových vzorků, pouze klasifikace
SimplyWise Klasifikuje typ projektu → regionální cenové tabulky Ne – ±10-15% přesnost, žádné měření pixelů
Hover 8-10 fotografií → 3D rekonstrukce + lidská kontrola kvality Ano – ale potřebuje více úhlů a trvá ~1 hodinu
AI Garden Planner, Planner 5D, atd. Pouze vizualizace – žádné oceňování N/A

Nikdo v oblasti AI zahradního designu (trh 1,72 miliardy USD, rostoucí o 21,4 % CAGR) nenabízí odhady cen z generovaných návrhů. Žádný konkurent. Rozhodli jsme se to přesto zkusit.

Jak naše AI generuje návrhy zahrad (a proč to ztěžuje oceňování)

Předtím, než se ponoříme do oceňování, je užitečné pochopit, co vlastně oceňujeme. Náš AI Garden Designer umožňuje uživatelům nahrát fotografii jejich skutečné zahrady. AI pak vygeneruje fotorealistickou vizualizaci toho, jak by tento prostor mohl vypadat s modulárními vyvýšenými záhony.

Generátor obrázků (Gemini Imagen) přijímá dva typy vstupů:

  • Produktová omezení: Tři referenční fotografie našeho skutečného systému Brick – skutečné produktové snímky ukazující konstrukci ze skládaných prken, rohy srubového typu, texturu zvětralého modřínu. Plus podrobný textový popis: „silná prkna (120 mm vysoká × 60 mm tlustá), skládaná vodorovně s posunutými spoji řadu po řadě jako zdivo.“
  • Kreativní svoboda: Vše ostatní – kolik struktur, kam jdou, jaké tvary mají, jak se vztahují k existující zahradě. AI rozhoduje o rozvržení, uspořádání, typech záhonů. Záhon ve tvaru L obepínající strom? Lavička integrovaná do opěrné zdi? Sada schodů sledující svah? Vše záleží na modelu.

Uživatelé ovládají posuvník hustoty (0-100), který odpovídá přibližně 0-20 strukturám. Při hustotě 25 získáte přírodní zahradu s několika jemnými záhony zasazenými mezi divoké květiny. Při hustotě 80 získáte plně organizovaný venkovní obytný prostor s odlišnými zónami propojenými cestami. AI vybírá, jaké typy struktur dávají smysl pro danou scénu.

Tato kreativní svoboda je celým smyslem nástroje. Nikdo nechce konfigurátor, který pokaždé vygeneruje stejné tři obdélníkové záhony. Ale vytváří to zásadní problém s oceňováním: každý vygenerovaný obrázek je jedinečný. Neexistuje žádný předdefinovaný seznam materiálů. Žádný seznam SKU. Jen fotorealistický obrázek dřevěných konstrukcí, které mohou být cokoli od jednoho květináče po propracovanou vícezónovou zahradu.

Jak tedy ocenit něco, co ještě neexistuje, z obrázku, který byl vygenerován před 5 sekundami?

Pokus č. 1: Jednoduše požádat AI o rozměry

Náš první přístup byl ten nejnaivnější: dát Gemini 2.5 Pro vygenerovaný obrázek zahrady a požádat ho o odhad rozměrů v metrech.

// The prompt we shipped to production
You are an expert at estimating dimensions of garden structures
from photographs.

For EACH distinct wooden structure you can identify
(raised beds, benches, walls, stairs, planters),
estimate its dimensions in meters:
- length_m: the longest horizontal dimension
- width_m: the shorter horizontal dimension (depth)
- height_m: the vertical dimension

Return JSON:
{ "structures": [
    { "type": "raised_bed",
      "length_m": 2.0, "width_m": 1.0, "height_m": 0.6 }
]}

Oceňování bylo přímočará geometrie – vypočítat viditelnou plochu stěny a vynásobit 125 €/m²:

// Wall area calculation per structure type:
// raised_bed: 2 × (length + width) × height
// wall: 2 × length × height
// stairs: length × height × 1.5
const wallArea = 2 * (s.length_m + s.width_m) * s.height_m;
const price = wallArea * 125; // EUR per m²

Fungovalo to. Lépe, než jsme čekali. Záhon, který byl ve skutečnosti dlouhý 1,8 m, se vrátil jako 1,4 m nebo 2,2 m – jednotlivé rozměry byly nepřesné, ale geometrie to kompenzovala: když byla délka přeceněna, výška bývala podceněna. Odhad ceny se nakonec pohyboval v rozmezí ±20-25 % reality. Pro bezplatný, okamžitý odhad z obrázku generovaného AI to bylo překvapivě užitečné.

Model byl obzvláště slušný v počítání struktur – pokud obrázek ukazoval 3 vyvýšené záhony a lavičku, obecně našel 3 vyvýšené záhony a lavičku. Rozuměl, jak vypadá náš systém Brick. Rozměry byly nejasné, ale detekce struktury byla pevná.

Ale pak jsme si přečetli články. Míra přesnosti SpatialVLM 37,2 %. Vlastní dokumentace Google varující před prostorovým měřením z jednotlivých obrázků. Vlákna na Stack Overflow plná „to je zásadně nemožné.“ Vyděsili jsme se.

„Tohle nemůže dlouhodobě fungovat,“ řekli jsme si. „Máme jen štěstí. Udělejme to správně – tak, jak všichni doporučují.“

Pokus č. 2: „Správná“ cesta – klasifikace podle katalogu

Doporučený přístup je jasný: neměřte, klasifikujte. Identifikujte, o jaký typ struktury se jedná, přiřaďte ji do kategorie velikosti, vyhledejte pevnou cenu. Žádné měření, žádná nejednoznačnost. To dělá Zillow. To dělá SimplyWise. To říká výzkum.

Myšlenka byla jednoduchá:

// Classify structure type + size → fixed price lookup
const PRICE_TABLE = {
  raised_bed: { small: 50, medium: 100, large: 180 },
  wall:       { small: 25, medium: 50,  large: 90 },
  bench:      { small: 30, medium: 60,  large: 100 },
  stairs:     { small: 45, medium: 90,  large: 140 },
  planter:    { small: 15, medium: 30,  large: 55 }
};

Ale narazili jsme na problém, který jsme nepředpokládali – a neměl nic společného s přesností AI.

Náš AI zahradní designér generuje kreativní návrhy. Uživatel nahraje fotografii své zahrady a Gemini Imagen vytvoří jedinečnou vizualizaci s modulárními vyvýšenými záhony uspořádanými tak, aby se vešly do konkrétního prostoru. Struktury, které generuje, jsou rozmanité – tvary L, křivky, které sledují zahradní cestu, záhony integrované do svahů, lavičky spojené s vyvýšenými záhony, stupňovité uspořádání, které stírá hranici mezi „schody“ a „zdí“.

Aby klasifikace podle katalogu fungovala, museli bychom omezit generátor obrázků. „Generujte pouze těchto 5 typů. Generujte pouze tyto 3 velikosti. Vše udržujte obdélníkové.“ To by sice zpřesnilo oceňování – ale zabilo by to to, co dělá nástroj cenným: kreativní, personalizované návrhy.

Čelili jsme zásadnímu kompromisu: přesné oceňování vs. kreativní svoboda v generovaných obrázcích.

A i když jsme se snažili, aby klasifikace fungovala bez omezení generátoru, výsledky byly špatné:

  • „Malý/Střední/Velký“ pro model nic neznamenalo. Bez referenčního objektu v obrázku byl stejný záhon v jedné analýze „malý“ a v další „velký“. Pro tato slova neexistuje žádná fyzická kotva – „střední“ je jazykový koncept, nikoli měření.
  • Kreativní struktury se nehodí do úhledných kategorií. Je záhon ve tvaru L jeden „velký“ vyvýšený záhon nebo dva „střední“? Je lavička integrovaná do vyvýšeného záhonu „lavička“ nebo součást záhonu? Kategorie byly příliš rigidní pro to, co generátor skutečně produkoval.
  • Přidávali jsme hacky. Sleva za přečtení (-15 % za každou strukturu nad 3, protože model halucinoval navíc). Krok překlasifikace. Tabulka ručního přepsání. Každý hack byl znamením, že přístup neodpovídá našemu případu použití.

Hlavní problém: katalogové oceňování předpokládá katalog. Funguje to pro Zillow, protože domy mají známé typy (ranč, koloniální, patrový) s desetiletími srovnatelných prodejních dat. Funguje to pro SimplyWise, protože stavební projekty se mapují na standardizované kategorie. Naše AI generuje pokaždé jedinečné návrhy – neexistuje žádný katalog, proti kterému by se klasifikovalo.

Tuto verzi jsme nikdy nespustili. Místo toho jsme se vrátili k tomu, co skutečně fungovalo – měření – ale s klíčovým poznatkem.

Pokus č. 3: Udělejte z produktu pravítko

Výzkum měl pravdu v jedné věci: z jednoho obrázku nelze obnovit absolutní rozměry bez referenčního bodu. Ale mýlil se v jednom předpokladu – že žádný referenční bod neexistuje.

Náš produkt má vestavěné pravítko.

Modulární systém Brick používá 60 mm tlustá dřevěná prkna, která se skládají na sebe. Každá vodorovná vrstva – viditelná jako zřetelná čára v každém generovaném obrázku – je přesně 12 cm (0,12 m) vysoká. To je fyzická konstanta produktu. Je stejná v každém obrázku, každém designu, každém úhlu. A generátor obrázků o tom už ví – každý prompt specifikuje „60mm systém Brick“, takže prkna jsou vykreslena konzistentně.

S V1 jsme se ptali: „Kolik metrů je tento záhon dlouhý?“ – otázka, která vyžaduje řešení problému monokulární nejednoznačnosti.

S V3 se ptáme: „Kolik vrstev prken vidíte a kolikrát je stěna delší než její výška?“ – otázky, které vyžadují pouze počítání a odhad poměru. Obojí jsou věci, které vizuální modely dělají dobře.

// The actual prompt in production (v3)
SCALE REFERENCE: Each horizontal plank layer = exactly 12cm
(0.12m) tall. Count layers to get the height, then estimate
length relative to the known height.

MEASURE each structure:
- layers: count visible horizontal plank layers (each = 12cm)
- length_ratio: how many times longer the wall is vs its height
- visible_faces: how many wall faces are visible

VERIFY: Typical gardens have 2-5 structures.
If you found >6, you likely overcounted.

Return JSON:
{"structures": [
  {"reasoning": "4 horizontal layers visible, wall extends
    about 3.5x the height, front and side visible",
   "type": "raised_bed",
   "layers": 4,
   "length_ratio": 3.5,
   "visible_faces": 2}
]}

Cenový engine provádí aritmetiku:

const LAYER_HEIGHT_M = 0.12;
const PRICE_PER_M2 = 120;

function calculatePrice(structure) {
  const height = structure.layers * LAYER_HEIGHT_M;
  // 4 layers = 0.48m

  const length = height * structure.length_ratio;
  // 0.48m × 3.5 = 1.68m

  const faceArea = height * length;
  // 0.48 × 1.68 = 0.81 m²

  const totalM2 = faceArea * structure.visible_faces;
  // 2 faces = 1.61 m²

  return totalM2 * PRICE_PER_M2;
  // 1.61 × €120 = €193
}

Proč to funguje tam, kde V1 a V2 nefungovaly:

  • Počítání je to, co vizuální modely dělají dobře. Vodorovné čáry ve skládaných prkenných konstrukcích jsou vysoce kontrastní, opakující se vizuální prvky. Počítání diskrétních vrstev se zásadně liší od odhadování „kolik metrů“ – je to rozpoznávání vzorů, nikoli prostorové uvažování.
  • Poměry jsou snazší než absolutní hodnoty. „Tato stěna je asi 3,5krát delší než vysoká“ je vizuální posouzení proporcí. Model nemusí znát absolutní velikost – jen tvar. To zcela obchází monokulární nejednoznačnost.
  • Referenční měřítko je skutečné. 12 cm na vrstvu není předpoklad – je to výrobní specifikace zakotvená jak ve fyzickém produktu, tak v promptu pro generování obrázků. AI „ví“ tloušťku prkna, protože obrázek vygenerovala s tímto omezením.
  • Kreativní svoboda je zachována. Na rozdíl od katalogového přístupu V2 neomezujeme, jaké struktury může generátor vytvářet. Tvary L, křivky, integrované lavičky – cokoli je možné. Přístup počítání vrstev funguje na jakémkoli tvaru, protože měří viditelnou plochu stěny, nikoli předdefinované kategorie.
  • AI pozoruje, kód počítá. Rozdělili jsme úlohu na to, co AI dělá dobře (vizuální rozpoznávání vzorů) a co dělá dobře kód (aritmetika). Ani jeden nedělá práci toho druhého. Pole reasoning nutí model popsat, co vidí, než uvede čísla, což odhaluje špatné odhady v logech a udržuje výstupy opodstatněné.

Co se změnilo mezi přístupy

V1: Přímé měření V2: Klasifikace podle katalogu V3: Počítání vrstev
Co se ptáme AI „Kolik metrů?“ „Jaký typ a velikost?“ „Kolik vrstev? Jaký poměr?“
Kotevní bod Žádný (hádání) Pevný katalog (omezující) 12cm vrstva prkna (fyzická)
Kreativní svoboda Plná Omezená (potřebuje předdefinované typy) Plná
Přesnost ±20-25 % (nepředvídatelná) Nekonzistentní (nikdy nespustila) ±20 % (předvídatelná, konzervativní)
Cenové rozpětí ±20 % symetrické Pevné vyhledávání (bez rozpětí) -20 % / +10 % (záměrně konzervativní)
Model Gemini 2.5 Pro (~0,005 USD) Gemini 2.5 Flash (~0,001 USD) Gemini 2.5 Flash (~0,001 USD)
Stav Fungovalo, ale opuštěno po výzkumu Nikdy nespustila – příliš omezující Ve výrobě

Asymetrické cenové rozpětí ve V3 si zaslouží poznámku. Záměrně se přikláníme k podhodnocení: -20 % na dolním konci, +10 % na horním konci. Raději bychom uvedli cenu 160–210 € a skutečná cena by byla 190 €, než abychom uvedli 190–250 € a někoho odradili, než se vůbec zeptá. Podslibování a nadplňování je lepší než opak.

Od vygenerovaného obrázku k odhadu ceny za 5 sekund

Zde je to, co se stane poté, co uživatel vygeneruje návrh zahrady:

Pro registrované uživatele se odhad ceny spustí automaticky – není potřeba klikat na tlačítko. Vygenerovaný obrázek je změněn na velikost 1024px a odeslán do druhého modelu AI (Gemini 2.5 Flash, nakonfigurovaného pro vizuální analýzu při teplotě 0,2 pro deterministické počítání). Jedná se o jiné volání modelu než to, které vygenerovalo obrázek – generátor vytváří, analyzátor měří.

Analyzátor vrátí JSON s odůvodněním pro každou strukturu: „4 vodorovné vrstvy viditelné, stěna se táhne asi 3,5krát výše, viditelná přední a boční strana.“ Náš kód vynásobí vrstvy 0,12 m, aplikuje poměr, vypočítá m² a vše sečte.

Výsledek se objeví přímo pod vygenerovaným obrázkem – zelený panel s tabulkou rozdělení podle struktury. Každý řádek ukazuje: typ struktury, rozměry (výška × délka), viditelné plochy, plocha stěny v m² a odhadovanou cenu. Celkem se zobrazí X.XX m² × 120 €/m² s cenovým rozpětím velkým písmem. Žádná černá skříňka – uživatelé mohou přesně vidět, jak byl odhad vypočítán, a sami posoudit, zda počet vrstev vypadá správně.

Současně dorazí e-mail se stejným rozpisem a obrázkem zahrady. Pokud uživatel neodpoví do 3 dnů, následuje jedna připomínka: „Stále přemýšlíte o své zahradě?“ s tlačítkem na jedno kliknutí pro vyžádání přesné cenové nabídky od člověka. Celý řetězec – generování obrázku k odhadu ceny k e-mailu – stojí méně než 0,01 USD.

Ekonomika: 0,135 USD za obrázek, 0,001 USD za cenovou nabídku

Vytvoření nástroje poháněného AI je jedna věc. Zajištění jeho ekonomické udržitelnosti je věc druhá. Zde jsou skutečná čísla.

Generování obrázků stojí 0,134 USD za obrázek. Používáme model Gemini Pro pro obrázky – nejdražší úroveň. Levnější model Flash jsme zkoušeli na začátku. Kvalita výstupu nebyla dostatečně dobrá: textury vypadaly ploše, kresba dřeva byla nekonzistentní, proporce prken Brick se lišily. Pro nástroj, kde vizuální kvalita je produktem, úspora 60 % na nákladech na generování při produkci obrázků, které nevypadají přesvědčivě, nestála za to. Pouze Pro, žádný fallback.

Odhad ceny stojí 0,001 USD za nabídku. Zde je kalkulace obrácená – pro vizuální analýzu používáme Gemini 2.5 Flash. Počítání vrstev prken a odhad proporcí nevyžaduje stejný model, který generuje fotorealistické obrázky. Flash spolehlivě zvládá úlohy počítání za zlomek nákladů. Volba správného modelu pro každý úkol – Pro tam, kde záleží na kvalitě, Flash tam, kde záleží na přesnosti konkrétního úzkého úkolu – je rozdílem mezi udržitelným a neudržitelným produktem.

Typická uživatelská relace vypadá takto:

Krok Model Cena
Generování návrhu zahrady (2× zdarma) Gemini Pro (obrázek) 0,268 USD
Odhad ceny Gemini 2.5 Flash (vize) 0,001 USD
Výpočet ceny + e-mail Node.js (žádné volání API) 0,000 USD
Celkem za relaci ~0,27 USD

Každý uživatel získá 2 bezplatné generace bez registrace. Poskytnutí e-mailu odemkne další 3 (celkem 5 denně). Kromě toho si uživatelé kupují balíčky kreditů – 3 obrázky za 1 € až 50 za 10 €. Při 0,134 USD za generaci se marže pohybují zhruba mezi 40-60 % v závislosti na velikosti balíčku.

Samotný odhad ceny je vždy zdarma – při 0,001 USD za nabídku by jeho zpoplatnění stálo více na ztracené angažovanosti než by ušetřilo na poplatcích za API. A výpočet ceny (vrstvy × 0,12 m × poměr × plochy × 120 €/m²) probíhá zcela v našem kódu s nulovými voláními API. Jakmile Gemini Flash vrátí počty vrstev, vše ostatní je deterministická aritmetika.

Optimalizujeme také vstupní náklady na každém kroku. Uživatelem nahrané fotografie jsou předzpracovány pomocí Sharp – zmenšeny na max. 2048px a zbaveny EXIF dat před odesláním do API. Pro analýzu cenové nabídky je vygenerovaný obrázek dále komprimován na 1024px JPEG. Tři referenční produktové fotografie jsou lokálně uloženy v mezipaměti a načítány z disku namísto stahování z CDN při každém požadavku. Generační prompt je udržován pod 150 slovy – nad 200 slov začne model obrázků ignorovat části instrukce.

Obchodní model: Na generování proděláváme. A to je ten smysl.

Buďme upřímní ohledně ekonomiky. Většina uživatelů vygeneruje 2-5 obrázků pomocí svého bezplatného limitu a nikdy si nekoupí balíček kreditů. Ti, kteří si kredity koupí, se ani zdaleka nepřiblíží pokrytí celkových nákladů na API pro všechny uživatele. Z čistě příjmů z generování pracujeme se ztrátou.

To je záměrné. AI Garden Designer není produkt – je to trychtýř.

Zde je to, co skutečně získáme od uživatele, který vygeneruje návrh zahrady a zadá svůj e-mail:

  • Teplý lead s nákupním záměrem. Někdo, kdo nahraje fotografii své zahrady, vygeneruje návrh s vyvýšenými záhony a zkontroluje odhad ceny, není náhodný prohlížeč. Aktivně zvažuje zahradní projekt. To je kvalitativně odlišné od někoho, kdo klikl na reklamu.
  • Personalizovaná cenová kotva. Uživatel má nyní v hlavě konkrétní číslo – „moje zahrada by stála kolem 350 €.“ To je mnohem efektivnější než obecná produktová stránka s ceníkem prken za kus.
  • Vizuál, do kterého se už zamilovali. Návrh si vygenerovali sami. Zvolili hustotu, styl, uspořádání. V tomto obrázku je vlastnictví, které žádná katalogová fotografie nemůže překonat.

E-mailová sekvence to posiluje. Ihned po vygenerování návrhu obdrží uživatel e-mail s cenovou nabídkou s vloženým obrázkem své zahrady – konkrétní návrh, který vytvořil, nikoli stock fotografii. E-mail obsahuje rozpis podle struktury (typ, plocha stěny, odhadovaná cena) a výrazné tlačítko pro vyžádání přesné cenové nabídky od člověka.

Pokud neodpoví do tří dnů, dorazí jedna připomínka: „Stále přemýšlíte o své zahradě?“ – stejný obrázek, stejné cenové rozpětí, stejné tlačítko na jedno kliknutí. Jen jedna připomínka, žádná drip kampaň. Chceme být nápomocní, ne otravní.

Pod vygenerovaným návrhem na webu jsou vždy dvě CTA: odkaz na 3D konfigurátor, kde si mohou specifikovat přesné rozměry, a odkaz na prohlížení e-shopu. Cesta od „Zajímalo by mě, jak by mohla vypadat moje zahrada“ k „Konfiguruji svou objednávku“ se může odehrát v jedné relaci.

O soukromí: odeslání e-mailu je vždy doprovázeno odkazem na naše zásady ochrany osobních údajů a jasnou poznámkou, že se uživatelé mohou kdykoli odhlásit. E-mail s cenovou nabídkou je transakční – uživatel výslovně požádal o odhad ceny. Marketingové e-maily (newsletter) vyžadují samostatné výslovné zaškrtávací políčko pro souhlas. Ukládáme pouze to, co je potřeba: e-mail, lokalitu, obrázek návrhu a rozpis ceny. Soulad s GDPR není jen právní požadavek – je to jediný způsob, jak budovat důvěru u lidí, kteří vám dávají své kontaktní údaje spolu s fotografií svého domova.

Větší ponaučení: Požádejte AI, aby pozorovala, ne aby odpovídala

Chyba ve V1 nebyla v používání AI pro prostorové úkoly – bylo to v požadavku na model, aby přímo produkoval konečnou odpověď. „Kolik metrů je toto dlouhé?“ vyžaduje, aby model vyřešil monokulární nejednoznačnost, převedl vizuální prvky na fyzické jednotky a vygeneroval kalibrované číslo. To jsou tři obtížné problémy naskládané na sebe.

V3 to rozděluje na části. „Kolik vodorovných vrstev?“ je úloha počítání – jedna z nejspolehlivějších věcí, které vizuální modely dělají. „Kolikrát delší než vysoká?“ je odhad proporcí – také spolehlivý, protože poměry jsou invariantní vůči měřítku. Převod z vrstev na metry a z poměrů na absolutní rozměry je deterministický kód se známou fyzickou konstantou.

Stejný princip platí i mimo náš případ použití:

  • Neptejte se „jak vysoká je tato budova?“ – zeptejte se „kolik pater?“ a vynásobte standardní výškou patra.
  • Neptejte se „jak široká je tato místnost?“ – zeptejte se „kolik dlaždic napříč?“ a vynásobte velikostí dlaždice.
  • Neptejte se „jak dlouhý je tento plot?“ – zeptejte se „kolik sloupků?“ a vynásobte standardní roztečí.

Pokud váš produkt nebo scéna obsahuje jakýkoli opakující se, viditelný, rozměrově konzistentní prvek, už máte pravítko. Nepotřebujete, aby AI měřila – stačí, aby počítala.

Vyzkoušejte si to sami

Nahrajte fotografii své zahrady, nechte AI navrhnout ji s modulárními vyvýšenými záhony a získejte okamžitý odhad ceny. Celý proces trvá asi 30 sekund. Návrh i odhad ceny jsou zdarma.

Získejte odhad ceny za 30 sekund

Nahrajte fotku → AI vygeneruje design vaší zahrady → okamžitý rozpis ceny.

Vyzkoušejte AI Garden Designer Nebo použijte 3D konfigurátor

Často kladené otázky

Jak přesné jsou AI-generované odhady cen zahradních záhonů z obrázků?

Náš systém dosahuje přibližně ±20% přesnosti, se záměrně konzervativním asymetrickým rozsahem (-20%/+10%). To znamená, že odhady bývají spíše mírně nižší než skutečná cena, než vyšší – raději podslíbíme, než abychom přecenili.

Jaký model AI se používá pro odhad ceny?

Pro vizuální analýzu používáme Google Gemini 2.5 Flash. Každý odhad stojí přibližně 0,001 USD (jednu desetinu centu). Přešli jsme z dražšího Gemini 2.5 Pro poté, co jsme zjistili, že Flash funguje srovnatelně pro náš specifický případ použití počítání strukturálních vrstev.

Může AI skutečně měřit rozměry z jedné fotografie?

Ne přímo – výzkum ukazuje, že modely AI pro zpracování obrazu chybují v absolutních měřeních v 63 % případů. Náš přístup to obchází použitím vlastní struktury produktu (12cm vrstvy prken) jako vestavěné referenční stupnice. AI počítá vrstvy a odhaduje proporce, poté náš kód provede výpočet.

Proč nepoužívat GPT-4 Vision místo Gemini?

Gemini Flash je přibližně 4× levnější s srovnatelným výkonem prostorového uvažování pro náš specifický případ použití. Jelikož provádíme jedno volání API na odhad, záleží na ceně za volání – při 0,001 USD za jedno můžeme nabízet neomezené bezplatné odhady.

Může tento přístup fungovat i pro jiné produkty?

Ano – pokud váš produkt má jakýkoli známý, viditelný, rozměrově konzistentní prvek, který se objevuje na obrázcích. Zdivo, podlahové dlaždice, standardní šířky řeziva, betonové tvárnice – cokoli s pevnou reálnou dimenzí, kterou AI dokáže spočítat, může sloužit jako referenční stupnice.

Je odhad ceny závaznou nabídkou?

Ne, je to orientační odhad, který vám pomůže s plánováním. Přesnou cenovou nabídku si můžete vyžádat jedním kliknutím – člověk zkontroluje návrh a poskytne přesnou cenu do 24 hodin.

Zpět na blog