Har du någonsin suttit med ett långt dokument fullt av svammel och tänkt: “Snälla, någon – kan inte någon bara plocka ut det viktiga åt mig?” Grattis, din bön har hörts. Google har nämligen släppt LangExtract – ett smart, öppet AI-verktyg som hjälper dig att plocka ut strukturerad information från helt ostrukturerad text. Det är som att ha en personlig assistent som faktiskt orkar läsa allt. Och förstår det.
LangExtract är ett nytt open-source Pythonbibliotek från Google som använder sig av stora språkmodeller (LLM:er) som Gemini för att extrahera värdefull information från långa, röriga texter. Tänk: juridiska dokument, medicinska rapporter, nyhetsartiklar eller bara… allmänt babbel.
Poängen? Att få ut tydlig och användbar data – utan att du själv behöver läsa igenom hundratals sidor.
Och ja, det är gratis.
Till skillnad från andra halvsovande AI‑verktyg är LangExtract inte bara ännu en kodsnutt som spottar ut svar. Den här grejen har superkrafter. Här är några av höjdpunkterna:
Det här verktyget är inte bara för AI-nördar. Här är några konkreta exempel på hur LangExtract används:
Det är som att ha en liten AI-intern som älskar att läsa, aldrig klagar och aldrig tar kaffepaus.
Installera paketet i Pyton
pip install langextract
Skriv en tydlig prompt
Berätta för AI:n vad du vill få ut från texten. Ju tydligare du är, desto bättre resultat.
Lägg till några exempel
Visa AI:n några konkreta exempel på rätt output, så lär den sig snabbare vad du är ute efter.
Kör extraktionen
from langextract import extract
extract(model_id=”gemini-2.5-pro”, …)
Visualisera och spara
Använd lx.visualize()
för att se resultaten i en snygg, klickbar HTML-vy. Du kan också exportera datan till JSONL.
Vi drunknar i information. Alla har vi någon gång försökt läsa igenom ett dokument och tänkt “nej tack, inte idag”. LangExtract är ett svar på den moderna människans största problem: brist på tid och överskott på text.
Med LangExtract kan du snabbt få en överblick, hitta det viktiga och fokusera på det som faktiskt spelar roll – oavsett om du är läkare, forskare, journalist eller bara nyfiken.
Och bäst av allt? Det är öppen källkod. Du kan titta under huven, anpassa det som du vill och använda det fritt.