LLM Wiki: cos'è, come funziona e usi in azienda

Cos’è una LLM Wiki

Una LLM Wiki è una base di conoscenza fatta di semplici file markdown che un agente di intelligenza artificiale costruisce e mantiene aggiornata in autonomia, a partire dai documenti grezzi di una persona o di un’organizzazione. Invece di cercare nei documenti a ogni domanda — come fa un sistema RAG tradizionale — la LLM Wiki compila la conoscenza una sola volta, in fase di ingestione, producendo pagine sintetiche, pagine-entità e pagine-concetto già collegate tra loro.

Il risultato è una conoscenza che si accumula nel tempo come gli interessi: ogni nuova fonte non resta isolata, ma arricchisce e aggiorna le pagine già esistenti. È un’idea semplice con conseguenze importanti per chiunque debba gestire molta documentazione interna.

Da dove nasce: l’idea di Andrej Karpathy

Il pattern è stato reso popolare da Andrej Karpathy, tra le voci più ascoltate nel campo dell’AI. Il 4 aprile 2026 ha pubblicato su GitHub un cosiddetto idea file: non una libreria di codice, ma una descrizione strutturata del pattern, pensata per essere incollata dentro un agente come Claude Code e adattata alle proprie esigenze (fonte originale).

La sua osservazione di partenza è familiare a chiunque accumuli appunti e documenti: li puoi cercare per parola chiave, ma non puoi farci una domanda. La LLM Wiki risolve proprio questo, trasformando un archivio passivo in una base di conoscenza interrogabile e in continua crescita.

Come funziona: l’architettura a tre livelli

Il cuore del pattern è una struttura a tre livelli, volutamente minimale.

Livello	Cosa contiene	Chi lo gestisce
Fonti grezze (`raw/`)	Documenti originali immutabili: report, PDF, trascrizioni, CSV, articoli	L’utente (l’AI legge ma non modifica)
Wiki (`wiki/`)	Pagine markdown generate dall’AI: riassunti, entità, concetti, confronti	L’agente AI
Schema (es. `CLAUDE.md`)	Le istruzioni su come l’agente struttura e mantiene la wiki	L’utente (è configurazione)

Le fonti grezze sono la fonte di verità: non si toccano mai. La wiki è la conoscenza vera e propria, scritta e riscritta dall’AI. Lo schema è il file di configurazione che detta convenzioni e flussi di lavoro.

Le tre operazioni: ingest, query, lint

Ingest — Depositi una nuova fonte e l’agente la legge, ne discute i punti chiave con te, scrive una pagina di sintesi, aggiorna l’indice e aggiorna le pagine-entità e concetto correlate in tutta la wiki. Una singola fonte può toccare 10-15 pagine diverse.
Query — Fai una domanda e l’agente sintetizza la risposta leggendo le pagine pertinenti, con citazioni alle fonti. La risposta può essere testo, una tabella o persino delle slide.
Lint — Periodicamente l’agente controlla la salute della wiki: contraddizioni, affermazioni obsolete, pagine orfane, collegamenti mancanti.

Un esempio concreto di ingestione

Immagina un’azienda che alimenta la propria LLM Wiki. Arriva un’analisi di mercato su un concorrente: l’agente la legge, crea una pagina-entità per quel concorrente, aggiorna la pagina-concetto “posizionamento di prezzo” e segnala una contraddizione con un dato inserito sei mesi prima. Il giorno dopo entra la trascrizione di una call commerciale: l’agente collega le obiezioni emerse alla stessa pagina concorrente, aggiorna la pagina del cliente e annota una decisione presa.

Nessuno ha scritto a mano una sola di queste connessioni. Quando, settimane dopo, qualcuno chiede “come ci posizioniamo rispetto a quel concorrente?”, la risposta è già pronta: sintetizza l’analisi di mercato, le obiezioni reali dei clienti e lo storico dei prezzi, in un colpo solo. È questa la differenza tra archiviare informazioni e costruire conoscenza.

LLM Wiki vs RAG: perché la conoscenza si “compone”

La differenza chiave rispetto al RAG (Retrieval-Augmented Generation) è il momento in cui avviene il lavoro cognitivo.

Con il RAG, a ogni domanda il modello riparte da zero: recupera frammenti grezzi, ne ricostruisce le relazioni, sintetizza una conclusione. È come rieseguire ogni volta lo stesso calcolo. Con la LLM Wiki, invece, quel lavoro è già stato fatto in fase di ingestione: i collegamenti ci sono già, le contraddizioni sono già state segnalate, la sintesi riflette già tutto ciò che hai letto.

Non è una contrapposizione assoluta: il RAG resta imbattibile su volumi enormi e su dati che cambiano in tempo reale, mentre la LLM Wiki vince in coerenza e in costo quando la base di conoscenza ha dimensioni gestibili. Spesso la soluzione migliore è combinarle. Abbiamo approfondito quando scegliere l’una o l’altra nell’articolo dedicato a LLM Wiki vs RAG.

Perché serve in azienda

Il problema che la LLM Wiki affronta non è teorico. Secondo una ricerca McKinsey, i knowledge worker passano circa il 20% della settimana lavorativa — quasi una giornata intera — a cercare informazioni interne e a rintracciare i colleghi giusti (McKinsey, The social economy). È tempo sottratto al lavoro a maggior valore.

A questo si aggiunge la perdita di conoscenza istituzionale: quando una persona lascia l’azienda, con lei se ne va il contesto che aveva in testa e che non era scritto da nessuna parte. Una wiki mantenuta da un’AI cattura quel contesto man mano, invece di perderlo.

C’è poi un terzo vantaggio, spesso sottovalutato: la portabilità. Una LLM Wiki vive in file markdown, leggibili da un essere umano, versionabili in Git e indipendenti da qualsiasi piattaforma proprietaria. È conoscenza aperta nel senso più pratico del termine — la possiedi davvero, non sei in lock-in su un fornitore e puoi spostarla quando vuoi. Per un’azienda che costruisce un asset destinato a durare anni, non è un dettaglio.

Open knowledge: possedere davvero la propria conoscenza

Vale la pena soffermarsi sul tema della portabilità, perché tocca un punto strategico spesso trascurato: la differenza tra usare la conoscenza e possederla.

Molte piattaforme di knowledge management custodiscono il sapere aziendale in formati proprietari, dentro database e indici a cui si accede solo attraverso il loro software. Funziona finché si resta clienti di quel fornitore; il giorno in cui si vuole cambiare, esportare tutto in modo pulito è spesso un’impresa — ed è esattamente il meccanismo del lock-in.

Una LLM Wiki adotta l’approccio opposto, quello dell’open knowledge: la conoscenza vive in file markdown leggibili da un essere umano, versionabili in Git e indipendenti da qualsiasi piattaforma. Puoi leggerli con un editor di testo, spostarli, metterli sotto controllo di versione come fai con il codice, cambiare modello o fornitore senza perdere nulla. Non è solo una questione tecnica: per un’azienda che costruisce un asset destinato a crescere per anni, significa che quell’asset rimane suo, oggi e in futuro. È la stessa logica con cui i team di sviluppo trattano il codice — e applicarla alla conoscenza è un cambio di mentalità prima ancora che di strumento.

Come si costruisce una LLM Wiki aziendale

Per un team di una persona bastano una cartella e un agente. Per un’azienda, il salto di qualità sta nell’integrazione con i sistemi esistenti e nel rispetto di sicurezza, permessi e conformità.

Nell’ecosistema Microsoft — quello su cui lavoriamo ogni giorno in Dev4Side — un’architettura tipica collega:

SharePoint, Teams e OneDrive come fonti documentali, con il rispetto dei permessi già configurati;
Azure OpenAI come modello generativo, così che i dati restino dentro il perimetro di sicurezza aziendale e non escano verso servizi pubblici;
Azure AI Search quando, oltre alla wiki sintetica, serve un livello di recupero su grandi volumi — è qui che LLM Wiki e RAG su Azure OpenAI si combinano.

Il punto delicato non è il modello: è l’ingegneria intorno al modello — connettori sicuri, governance dei permessi, aggiornamento incrementale, audit. È esattamente il tipo di lavoro che distingue un esperimento da un sistema su cui un’azienda può davvero contare.

I limiti della LLM Wiki: quando non è la scelta giusta

Essere onesti sui limiti è il modo migliore per usare bene una tecnologia. La LLM Wiki non è una soluzione universale, e ci sono casi in cui non è lo strumento adatto:

Dati in tempo reale. Se la conoscenza cambia ogni minuto — prezzi, disponibilità di magazzino, ticket in arrivo — la wiki rischia di essere sempre un passo indietro rispetto all’ultima ingestione. Qui il RAG è più adatto.
Volumi enormi. Quando le fonti sono milioni, l’approccio basato su pagine sintetiche e indice mostra i suoi limiti: serve un livello di recupero su larga scala, tipicamente Azure AI Search.
Conoscenza puramente transazionale. Se l’obiettivo è cercare il singolo documento esatto (un contratto specifico, una fattura), la sintesi della wiki aggiunge poco rispetto a una buona ricerca.

In molti scenari reali, però, questi limiti non sono un ostacolo ma un indizio: indicano dove combinare la LLM Wiki con il RAG, in un’architettura ibrida che prende il meglio dei due mondi. È un tema che abbiamo approfondito nel confronto LLM Wiki vs RAG.

Da dove partire

La LLM Wiki non è solo l’ennesimo strumento di AI: è un modo diverso di pensare alla conoscenza aziendale, come a un asset che cresce di valore nel tempo invece di disperdersi. Il pattern è semplice; portarlo in produzione in modo sicuro e integrato con i tuoi sistemi è un progetto di ingegneria.

In Dev4Side progettiamo e costruiamo sistemi di knowledge AI integrati con Microsoft 365 e Azure — lo abbiamo fatto anche per noi stessi: scopri come abbiamo costruito una LLM Wiki per il nostro team marketing. Se vuoi capire come una LLM Wiki potrebbe funzionare nella tua organizzazione, parla con un nostro esperto.

Domande frequenti

Cos’è una LLM Wiki? Una LLM Wiki è una base di conoscenza fatta di file markdown che un agente AI costruisce e mantiene aggiornata a partire dai documenti grezzi dell’organizzazione. A differenza del RAG, che cerca nei documenti a ogni domanda, la LLM Wiki compila la conoscenza una volta sola in fase di ingestione, creando pagine sintetiche e collegate tra loro.

Chi ha inventato la LLM Wiki? Il pattern è stato reso popolare da Andrej Karpathy, che il 4 aprile 2026 ha pubblicato su GitHub un “idea file” che descrive l’architettura a tre livelli (fonti grezze, wiki generata dall’AI, file di schema) e le tre operazioni di base: ingest, query e lint.

Che differenza c’è tra LLM Wiki e RAG? Il RAG recupera frammenti dai documenti a ogni query e ricostruisce il contesto da zero ogni volta. La LLM Wiki, invece, sintetizza e collega la conoscenza una volta in fase di ingestione: i collegamenti, le contraddizioni e i riassunti sono già pronti. Spesso le due tecniche si combinano.

Una LLM Wiki è adatta a un’azienda? Sì, soprattutto come knowledge base interna su documenti che cambiano con frequenza moderata. In ambito enterprise va integrata con i sistemi esistenti (SharePoint, Teams, Azure) e con i controlli di sicurezza e permessi: è esattamente il tipo di progetto che un partner come Dev4Side può costruire su misura.

Su quali tecnologie si costruisce una LLM Wiki in azienda? Tipicamente su file markdown versionati (anche solo in un repository Git), con un agente AI che li mantiene. In un contesto Microsoft si integra con SharePoint e Teams come fonti, Azure OpenAI come modello e, dove serve un recupero su grandi volumi, Azure AI Search.

LLM Wiki: cos'è e come funziona la knowledge base che si aggiorna da sola