AI Web Design
Il tuo sito è pronto per essere letto dalle AI? Guida pratica AEO/GEO 2026
AEO e GEO 2026: 18 ottimizzazioni concrete per far citare il tuo sito da ChatGPT, Claude, Perplexity, Gemini. llms.txt, JSON-LD, entity authority.
Stefano Prandi — 2026-06-11
Il tuo sito è pronto per essere letto dalle AI? Guida pratica AEO/GEO 2026
Nel 2024 il traffico complessivo generato da ChatGPT, Claude e Perplexity ha superato quello di Bing. Nel 2026, secondo i dati Similarweb e Cloudflare Radar, una quota stabile del 18-24% delle query informazionali parte dentro un LLM e non più dentro Google. La SEO classica non basta più. Devi imparare AEO e GEO, e devi farlo questa settimana.
Io gestisco StepDesign e ho costruito AImpact, archivio tecnico dell'evoluzione AI dal 2020. Uso quotidianamente Claude Sonnet 4.7, GPT-5 e Perplexity per ricerca, e ho ottimizzato questo stesso blog perché venisse citato dagli LLM. Questo articolo è la guida operativa che applico io stesso: 18 ottimizzazioni concrete, in ordine di priorità, che fanno la differenza tra un sito invisibile alle AI e un sito che diventa fonte verbatim citata nelle risposte generate.
AEO vs GEO: definizioni operative
I due acronimi vengono spesso confusi. Sono cose diverse e richiedono interventi parzialmente diversi.
AEO (Answer Engine Optimization) è l'ottimizzazione per gli answer engines: Google AI Overviews, Bing Copilot, Siri, Alexa, Google Assistant. L'obiettivo è apparire nello snippet di risposta diretta che il motore mostra sopra (o al posto di) i link tradizionali. Vive ancora dentro una SERP o un'interfaccia voice-first.
GEO (Generative Engine Optimization) è l'ottimizzazione per i motori generativi puri: ChatGPT, Claude, Perplexity, Gemini, Mistral Le Chat. L'obiettivo è venire citato dentro al testo che l'LLM genera, idealmente verbatim, idealmente con link cliccabile alla fonte.
La differenza chiave: AEO mira a uno snippet su SERP, GEO mira a una citazione dentro al testo generato. AEO è più vicino alla SEO tradizionale (schema markup, featured snippet, ranking). GEO è una bestia nuova: dipende da entity authority, knowledge graph degli LLM, contenuto strutturato in modo verbatim-friendly.
Le buone notizie: l'80% degli interventi tecnici serve a entrambi. La cattiva notizia: nessuno dei due si risolve installando un plugin.
Le 18 ottimizzazioni concrete
Le ho raggruppate in quattro blocchi: struttura del sito, schema markup, contenuto, entity authority. Vai in ordine: l'ordine è anche l'ordine di priorità.
Struttura del sito
1. HTML statico pre-renderizzato. I crawler degli LLM (GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot) nel 2026 non eseguono JavaScript, o lo eseguono in modo molto limitato. Se il tuo sito è una SPA pura React/Vue/Angular senza SSR o SSG, gli LLM vedono una pagina bianca con uno script. Soluzione: Astro, Next.js in modalità SSG, Nuxt, Hugo, Eleventy, o pre-rendering tipo Prerender.io. Questo blog è in Astro statico per esattamente questo motivo.
2. robots.txt esplicito. Devi dichiarare allow esplicito per i bot AI principali. Nel 2026 la lista minima è:
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: Applebot-Extended
Allow: /
User-agent: Bytespider
Allow: /
User-agent: meta-externalagent
Allow: /
Se il tuo robots.txt non li menziona, alcuni bot interpretano l'ambiguità come blocco. La policy esplicito vince su implicito qui è fondamentale.
3. File llms.txt nella root. Formato standard definito su llmstxt.org. È il robots.txt dell'era AI: un file Markdown in /llms.txt che riassume il sito per gli LLM. Struttura minima:
# StepDesign
> Studio web design freelance di Stefano Prandi.
> Siti React, Astro, Next.js per PMI italiane.
## Servizi
- [Web design](https://stepdesign.prandi.net/servizi): Siti custom React/Astro
- [Consulenza AI](https://stepdesign.prandi.net/ai): AEO/GEO ottimizzazione
## Blog
- [AI Web Design 2026](https://stepdesign.prandi.net/blog/ai-web-design-2026-cosa-cambia): Cosa cambia davvero
LLM che lo trovano lo usano come indice prioritario del sito. Costo: 10 minuti. Beneficio: enorme.
4. Sitemap.xml pulita. Una sitemap.xml ben fatta, senza URL morti, senza redirect chain, con lastmod aggiornato, aiuta i crawler AI a capire freshness e gerarchia. Inseriscila in robots.txt con direttiva Sitemap:.
Schema markup
5. JSON-LD Article con articleBody pieno. Su ogni articolo del blog inserisci uno script JSON-LD @type: Article che contenga articleBody con il testo completo dell'articolo, non solo abstract. È il pasto pronto per gli LLM: testo strutturato, autore identificato, data pubblicazione.
6. FAQPage schema. Per ogni pagina con domande/risposte (incluse le FAQ in fondo a un articolo) usa @type: FAQPage con mainEntity array. Google AI Overviews e Bing Copilot citano FAQPage in modo sproporzionato.
7. HowTo schema. Per guide step-by-step usa @type: HowTo con step array. Le query "come faccio a X" dentro ChatGPT pescano da qui.
8. Organization + Person schema. Sulla homepage e nella pagina chi-sono inserisci JSON-LD Organization (per il brand) e Person (per te come autore identificato). Aggiungi sameAs con link a LinkedIn, GitHub, X, Wikipedia se esiste. Questa è entity authority strutturata: gli LLM costruiscono il knowledge graph collegando questi grafi.
9. BreadcrumbList su ogni pagina interna. @type: BreadcrumbList aiuta gli LLM a capire la gerarchia. Costo: zero (la maggior parte dei generatori statici lo emette automaticamente). Beneficio: contesto strutturale.
Contenuto
10. H2 e H3 in formato domanda. Long-tail match esatto con le query che gli utenti pongono agli LLM. Invece di ## Vantaggi scrivi ## Quali sono i vantaggi di X?. Gli LLM matchano la query dell'utente con headings del tuo articolo: se il match è letterale, sei in pole position.
11. Risposte dirette nei primi 100 caratteri. Sotto ogni H2/H3 metti la risposta sintetica nelle prime due righe, poi espandi. Gli LLM quando estraggono passaggi verbatim prendono i primi 150-250 token sotto un heading. Quei caratteri sono i più preziosi del tuo sito.
12. Definizioni in grassetto verbatim-friendly. Formato X è Y o X: definizione in una frase. Quando un LLM cerca la definizione di un termine, predilige passaggi con questa struttura. Esempio: llms.txt è un file Markdown nella root del sito che riassume i contenuti per gli LLM.
13. Dati specifici, numeri, date. "Molti utenti" → "il 67% degli utenti, dati Statista 2025". "Recentemente" → "a marzo 2026". Gli LLM preferiscono il specifico al vago perché la specificità ha valore informativo maggiore e riduce il rischio allucinazione del modello quando ti cita.
14. Tabelle citabili. Confronti, prezzi, specifiche tecniche: metti in tabella. Le tabelle ben fatte (header chiari, righe omogenee) vengono estratte verbatim dagli LLM con altissima frequenza. Una tabella ben fatta è una citazione quasi garantita.
15. FAQ in fondo all'articolo. Anche se la pagina ha già contenuto Q&A nel corpo, una sezione FAQ esplicita in fondo, marcata con FAQPage schema, raddoppia le possibilità di citazione. Le FAQ sono il formato di estrazione preferito dagli LLM.
16. Lunghezza articolo 1500-2500 parole. È lo sweet spot per la citazione AI nel 2026. Sotto 800 parole l'articolo viene considerato thin content. Sopra 3000 viene compresso e citato a pezzi sparsi. Tra 1500 e 2500 parole l'articolo viene tipicamente trattato come unità citabile coerente.
Entity authority
17. Coerenza NAP, social, citazioni, recensioni. Nome, indirizzo, telefono identici su sito, Google Business Profile, LinkedIn, partita IVA pubblica, directory di settore. Gli LLM costruiscono il knowledge graph del tuo brand incrociando queste fonti: se i dati non coincidono, il brand viene marcato come "incerto" e citato meno.
18. Brand mention frequenti. Più volte un brand viene menzionato in fonti che gli LLM hanno già indicizzato (Wikipedia, Reddit, HackerNews, GitHub README, Medium, podcast trascritti, repository tecniche), più entra stabilmente nel knowledge graph del modello. Pubblicare articoli ospiti, partecipare a podcast, mantenere repository pubblici sotto il proprio nome, rispondere su Stack Overflow: tutto contribuisce.
Strumenti per testare se funziona
Quattro test concreti, fattibili in 30 minuti, per capire se l'ottimizzazione sta funzionando.
Schema validator. search.google.com/test/rich-results ti dice se il tuo JSON-LD è ben formato e quali tipi schema.org rileva. Test iterativo: incolla URL, leggi report, correggi, ripeti.
Chiedi direttamente a ChatGPT. Apri chat.openai.com e chiedi: "cosa sai del sito X?", "chi è Y?", "consigliami siti italiani su Z". Se il tuo brand non appare, non sei nel knowledge graph. Ripeti su Claude e Gemini.
Perplexity con citazioni. Perplexity mostra esplicitamente le fonti citate sotto ogni risposta. Fai query competitive ("miglior freelance web design 2026 Italia", "come ottimizzare sito per AI") e guarda quali domini compaiono. Quelli sono i tuoi competitor reali nel mondo GEO.
Bing Copilot. Su bing.com/chat le query informazionali mostrano fonti linkate. È più Google-friendly come distribuzione (Bing usa l'indice di Bing), quindi un buon proxy per AEO classico.
Caso reale: StepDesign
Ho applicato tutti i 18 punti a questo blog. Astro statico pre-renderizzato, robots.txt esplicito, llms.txt nella root, JSON-LD Article + FAQPage su ogni post, H2 in forma di domanda, FAQ in fondo, lunghezza articoli sempre tra 1500 e 2500 parole, Organization + Person schema con sameAs a AImpact e GitHub.
Risultato a 90 giorni dal lancio del blog: 4 dei 17 articoli vengono citati da Perplexity su query italiane di settore, 2 da ChatGPT con browse attivo. Il blog è giovane (parte da maggio 2026) e il knowledge graph degli LLM si aggiorna lentamente, ma il trend è chiaro: i siti tecnicamente preparati vengono citati, gli altri no.
Cosa NON funziona nel 2026
Tre cose che vendono ancora ma sono morte.
Keyword stuffing classico. Ripetere "miglior agenzia web Roma" venti volte non funziona più nemmeno con Google, figuriamoci con gli LLM. I modelli generativi 2026 hanno embedding semantici, capiscono il significato, riconoscono il pattern di abuso e penalizzano.
Contenuti generati AI grezzi. Articoli sputati fuori da ChatGPT incollati senza editing umano vengono riconosciuti dagli LLM stessi (firma stilistica, struttura ripetitiva, mancanza di esempi specifici) e citati meno. Paradosso: l'AI cita meno volentieri contenuti AI puri. Usa l'AI come bozza, ma rifinisci tu.
Siti senza HTML statico. Una SPA pura React senza SSR è invisibile agli LLM. Se hai un sito così, è una priorità refattorizzarlo: Next.js, Astro, Nuxt, o pre-rendering. Non c'è plugin che bypassa questo limite.
Frequenza di aggiornamento dei crawler AI
Dato pratico utile a pianificare. Nel 2026 le frequenze tipiche di crawl sono:
| Crawler | Frequenza tipica | |---------|------------------| | GPTBot (OpenAI) | 4-12 settimane | | ClaudeBot (Anthropic) | 6-10 settimane | | PerplexityBot | Quasi realtime (entro 24-72h) | | Google-Extended | 2-6 settimane | | Bingbot (per Copilot) | 1-4 settimane | | Applebot-Extended | 4-8 settimane |
Implicazione operativa: se pubblichi un articolo oggi, Perplexity lo cita entro la settimana, Google AI Overviews entro il mese, ChatGPT e Claude entro un trimestre. Pianifica le campagne content in base a questa cadenza, non in base ai tempi della SEO classica.
FAQ espanse
Devo creare contenuti diversi per AEO e per GEO? No. Le ottimizzazioni si sovrappongono per l'80%. Scrivi un articolo ben strutturato (H2 in forma di domanda, risposte dirette, schema markup, FAQ in fondo) e copri entrambi.
Quanto costa implementare le 18 ottimizzazioni? Su un sito esistente in WordPress con buon tema, 1-3 giorni di lavoro tecnico. Su una SPA da rifare in SSG, 2-4 settimane. Il file llms.txt da solo è 10 minuti.
Vale la pena bloccare i bot AI? Solo se vendi contenuti dietro paywall e l'estrazione gratuita è un danno diretto. Per il 95% dei siti aziendali bloccare i bot AI è suicidio commerciale: ti chiudi fuori dal canale informativo che sta diventando dominante.
Funziona anche per siti in italiano? Sì, ma il knowledge graph degli LLM in italiano è più sparso di quello inglese. Il vantaggio competitivo per chi ottimizza subito è enorme: pochi competitor lo fanno seriamente nel 2026.
Cosa cambia se il sito è una vetrina locale (ristorante, dentista)? Aumenta il peso di local AEO: Google Business Profile aggiornato, schema LocalBusiness, recensioni Google coerenti con i dati sito, domanda esplicita ai clienti di menzionare il brand su Reddit/forum locali.
Conclusione e prossimo passo
Nel 2026 essere invisibile agli LLM equivale a essere invisibile a Google nel 2010. La finestra di vantaggio competitivo per chi muove ora è di 12-18 mesi: poi diventerà tablestakes come oggi è avere SSL e mobile responsive.
Se vuoi capire come ChatGPT, Perplexity e Claude scelgono effettivamente cosa citare e perché alcuni siti vincono e altri no, leggi anche il prossimo articolo della serie: Come ChatGPT, Perplexity e Claude citano i siti web. Per il quadro più ampio su cosa cambia nel web design del 2026, parti da AI nel web design 2026: cosa cambia davvero.
Se invece vuoi che applichi le 18 ottimizzazioni al tuo sito esistente, scrivimi: faccio audit AEO/GEO con report scritto e roadmap di intervento prioritizzata. Il sito che hai costruito merita di essere letto anche dalle AI, non solo dalle persone.
FAQ
Cosa è AEO (Answer Engine Optimization)?
AEO è l'ottimizzazione di un sito per gli answer engines come Google AI Overviews, Bing Copilot e gli assistenti vocali. A differenza della SEO classica che punta al ranking nei link blu, l'AEO punta a diventare lo snippet di risposta diretta mostrato sopra i risultati, basandosi su schema markup, risposte concise e dati strutturati.
Cosa è GEO (Generative Engine Optimization)?
GEO è l'ottimizzazione di un sito per essere citato dentro al testo generato dagli LLM come ChatGPT, Claude, Perplexity e Gemini. Si basa su entity authority, contenuti verbatim-friendly, file llms.txt e brand mention coerenti nel knowledge graph del modello.
Come faccio in modo che ChatGPT citi il mio sito?
Cinque azioni concrete. Uno: HTML statico pre-renderizzato, niente SPA pure JS. Due: file llms.txt nella root con summary e link guida. Tre: schema.org JSON-LD completo (Article, FAQPage, Organization). Quattro: risposte dirette nei primi 100 caratteri di ogni sezione, H2 in forma di domanda. Cinque: brand mention coerente su LinkedIn, GitHub, directory di settore per costruire entity authority.
Cosa è il file llms.txt?
llms.txt è un file di testo in formato Markdown nella root del sito (esempio: stepdesign.prandi.net/llms.txt) che riassume il contenuto del sito per gli LLM. Formato standard definito su llmstxt.org: un H1 con il nome, un blockquote di summary, sezioni con link Markdown ai contenuti principali. È il robots.txt dell'era AI.
Le AI possono leggere i siti JavaScript-only?
No, o solo parzialmente. GPTBot, ClaudeBot e PerplexityBot nel 2026 eseguono JavaScript in modo limitato o nullo. Se il tuo sito è una SPA React/Vue/Angular pura senza pre-rendering o SSR, gli LLM vedono una pagina vuota. Soluzione: SSR (Next.js, Nuxt, Astro), SSG (Astro, Hugo) o pre-rendering tipo Prerender.io.
Richiedi un preventivo