AI Web Design
Voice search 2026: come ottimizzare il sito per Siri, Alexa, Google Assistant
Voice search 2026: il 35% delle query è vocale. Come ottimizzare il sito per Siri, Alexa, Google Assistant. Schema, long-tail conversazionali, featured snippet.
Stefano Prandi — 2026-07-07
Il voice search non è più un trend futuribile da slide di convegno. Nel 2026, secondo le rilevazioni incrociate di Comscore, Edison Research e i report degli stessi produttori di smart speaker, circa il 35% delle query mondiali contiene una componente vocale. Significa smart speaker che rispondono in cucina, smartphone interrogati in palestra, navigatori in auto che cercano "officina aperta vicino a me", AirPods che leggono email mentre si cammina.
Per chi gestisce un sito web, ignorare questo flusso significa lasciare sul tavolo una fetta crescente di traffico qualificato. La buona notizia: ottimizzare per la voice search non richiede ricostruire il sito da zero. Richiede capire come funzionano i quattro assistenti principali e applicare una serie di tattiche concrete che, fra l'altro, si sovrappongono molto con la più ampia ottimizzazione per AI search e LLM citation.
I 4 assistenti vocali del 2026
Il panorama si è stabilizzato su quattro grandi famiglie, ciascuna con un proprio bacino di utenza e un proprio modo di scegliere le risposte.
Google Assistant (Android + Nest)
È il cuore del mercato italiano. Vive su ogni Android (circa il 70% degli smartphone in Italia), sui Nest Hub, su Android Auto. Pesca le risposte dall'indice Google: chi è ben posizionato nei featured snippet ha enormi probabilità di essere "letto ad alta voce" dall'assistente. È il bersaglio più redditizio per chi fa già SEO seria.
Siri (Apple ecosystem)
Circa il 30% degli utenti italiani usa iPhone, e Siri è il default su iPhone, iPad, Mac, Apple Watch, AirPods, HomePod, CarPlay. Siri pesca i risultati web da Google ma per le ricerche locali ("ristorante vicino a me") attinge da Apple Maps: chi non ha una scheda Apple Business Connect aggiornata è invisibile alla metà degli utenti premium.
Alexa (Amazon Echo)
Domina la casa. Circa 9 milioni di Echo attivi in Italia nel 2026. Alexa è meno orientata alla ricerca web pura e più ai comandi (timer, musica, smart home, shopping Amazon), ma quando fa ricerca informativa attinge a Bing + a un proprio knowledge graph. Per chi vende prodotti, presidiare Amazon è spesso più rilevante che ottimizzare il sito per Alexa.
AI assistant conversazionali (ChatGPT voice, Gemini Live, Claude voice)
La categoria nuova. Sono assistenti che non "cercano sul web" nel senso classico ma generano risposte sintetizzando fonti. Stanno mangiando quote di mercato soprattutto fra gli under 35. La logica di ottimizzazione qui è quella della citazione LLM: essere fonte autorevole, strutturata, citabile.
Come è fatta una query vocale
Le query vocali hanno quattro caratteristiche ricorrenti che le distinguono nettamente da quelle digitate:
- Sono più lunghe. Mediamente 7-10 parole contro le 3-4 di una query testuale. Si parla per frasi compiute, non per keyword.
- Sono conversazionali. "Dove trovo un parrucchiere aperto la domenica vicino a me" invece di "parrucchiere domenica".
- Sono question-based. Iniziano spesso con chi, cosa, dove, come, perché, quando. Il sito deve poter rispondere esattamente a quella domanda, con quella formulazione.
- Hanno forte intento locale. "Vicino a me", "in centro", "a Modena", "aperto ora" sono modificatori frequentissimi. Questo si lega direttamente alla SEO locale: chi non presidia il proprio territorio non esiste per la voice search.
Le 8 tattiche di ottimizzazione che funzionano davvero
Una checklist concreta da applicare in ordine di priorità.
1. H2 e H3 in formato domanda. Il titolo di sezione deve essere la domanda esatta che un utente potrebbe fare a voce. "Quanto costa rifare un bagno a Modena?" funziona; "Costi ristrutturazione bagni" no.
2. Risposta diretta nei primi 100 caratteri. Subito sotto la domanda, una frase secca di risposta. Gli assistenti vocali leggono i primi 29-40 parole della risposta migliore: se la annacqui con un'introduzione, perdi lo snippet.
3. FAQ schema (FAQPage JSON-LD). Marcare le FAQ con structured data è il singolo intervento col miglior ROI. Riferimento ufficiale: Google FAQPage structured data. Una pagina con FAQ schema ben fatto ha 3-5 volte più probabilità di apparire come risposta vocale.
4. HowTo schema sulle guide. Per articoli del tipo "come fare X", lo schema HowTo permette agli assistenti di leggere i singoli step. Funziona benissimo su contenuti how-to letti in auto o in cucina.
5. Long-tail conversazionali. Andare oltre la keyword research classica. Strumenti come Answer The Public, AlsoAsked o le "people also ask" di Google mostrano le domande vere che la gente fa. Quelle sono le query vocali del prossimo anno.
6. Ottimizzazione featured snippet. Google legge ad alta voce praticamente sempre il featured snippet. Strutturare i contenuti in modo che la propria risposta sia la più sintetica, completa e ben formattata della SERP per quella domanda è l'obiettivo. Bullet list, tabelle, definizioni inquadrate aiutano.
7. Google Business Profile completo. Per le ricerche locali da Google Assistant, GBP è la fonte primaria. Orari, telefono, indirizzo, foto, recensioni, attributi (parcheggio, accessibilità, opzioni di pagamento) devono essere completi e aggiornati. Lo stesso vale per Apple Business Connect lato Siri.
8. Schema LocalBusiness per "vicino a me". Una scheda LocalBusiness JSON-LD sul sito, con coordinate geografiche, area servita, orari di apertura, è ciò che permette ai motori di mappare il sito su query geo-localizzate anche quando l'utente non sta consultando direttamente Maps.
Voice search e GEO: lo stesso lavoro, due output
Il punto interessante è che ottimizzare per la voce significa, in larga parte, ottimizzare per la citazione da parte degli LLM. Le due discipline (voice SEO e GEO, Generative Engine Optimization) condividono:
- Contenuti strutturati come Q&A
- Risposte sintetiche e dirette
- Schema markup ricco
- Autorevolezza della fonte
- Chiarezza dell'autore (E-E-A-T)
Chi sta facendo bene la voice search sta già facendo, senza accorgersene, l'80% del lavoro per essere citato da ChatGPT, Perplexity, Claude e Gemini. È un investimento doppio: stesso sforzo, due canali di traffico futuri presidiati.
Come si misura il traffico da voice search
La domanda più frequente, e la risposta più scomoda: non c'è tracking diretto. Nessun assistente vocale passa un parametro UTM che dica "questa sessione viene da Siri". Si misura per indizi:
- Google Search Console, filtrando le query con 5+ parole o contenenti question words (chi, cosa, dove, come, perché, quando). L'aumento di queste query è il proxy migliore.
- Impression su featured snippet: se crescono, cresce anche la lettura vocale.
- Chiamate dirette: per business locali, un aumento di chiamate non spiegabile da altri canali correla spesso con voice search da smartphone.
- Sessioni mobile con visite molto brevi: l'utente vocale spesso ha già avuto la risposta, arriva sul sito solo per conferma.
Accettare che il tracking sia indiretto è parte del gioco.
I 3 errori più comuni
Rispondere troppo lungo. L'assistente legge 29-40 parole. Se la tua risposta è un paragrafo di 200 parole, viene troncata o scartata in favore di una più sintetica.
Ignorare la dimensione locale. Senza GBP aggiornato e schema LocalBusiness, il sito è invisibile a tutte le query "vicino a me", che sono la maggioranza delle vocali su smartphone.
Non avere schema strutturato. Senza FAQPage, HowTo, LocalBusiness, Article schema, il sito si affida solo all'interpretazione del crawler. Con schema, parla al motore nella sua lingua. Nel 2026 non è più opzionale.
Conclusione
La voice search non sostituirà la ricerca testuale, ma nel 2026 è ormai un canale a sé, con regole sue. Le aziende che ottimizzano contenuti, schema e presenza locale oggi staranno raccogliendo traffico vocale costante mentre i concorrenti continueranno a chiedersi perché Siri non li nomina mai.
Se vuoi capire se il tuo sito è oggi leggibile da Siri, Alexa e Google Assistant — e cosa serve per renderlo tale — puoi richiedere un audit voice/GEO scrivendomi a stefano@prandi.net. Analizzo schema, struttura dei contenuti, presenza locale e ti restituisco un piano operativo concreto.
FAQ
Cosa è il voice search?
Il voice search è la ricerca effettuata pronunciando una query a voce verso un assistente (Siri, Alexa, Google Assistant, ChatGPT voice) invece di digitarla. L'assistente trascrive l'audio, interroga un motore di ricerca o un proprio indice, e risponde a voce con una sintesi vocale o mostra risultati sullo schermo.
Quanta gente cerca vocalmente nel 2026?
Nel 2026 circa il 35% delle query globali contiene una componente vocale, contando smart speaker, smartphone in modalità hands-free e auto connesse. In Italia la quota è leggermente inferiore (28-30%) ma in crescita costante anno su anno.
Quale assistente vocale è più usato in Italia?
Google Assistant guida il mercato italiano per via dell'enorme parco Android (~70% smartphone). Siri segue al 25-30% grazie all'ecosistema Apple, Alexa è dominante negli smart speaker domestici, e i nuovi AI assistant (ChatGPT voice, Gemini Live) stanno conquistando la fascia under 35.
La SEO per voice search è diversa dalla SEO normale?
Sì. Le query vocali sono più lunghe (7-10 parole contro 3-4 testuali), conversazionali, in forma di domanda e con forte intento locale. Vanno ottimizzati formato delle risposte, schema markup (FAQPage, HowTo, LocalBusiness) e densità di featured snippet.
Come misuro le visite da voice search?
Non esiste un tracking diretto delle sessioni voice: gli assistenti non passano un referrer dedicato. Si misura indirettamente da Google Search Console filtrando query lunghe e con question words (chi, cosa, dove, come, perché), e dall'aumento di impression su featured snippet.
Richiedi un preventivo