Google lanserar LangExtract – AI:n som hittar ordning i ditt textkaos

daniel norinAI modeller2 månader sedan77 Visningar

Har du någonsin suttit med ett långt dokument fullt av svammel och tänkt: “Snälla, någon – kan inte någon bara plocka ut det viktiga åt mig?” Grattis, din bön har hörts. Google har nämligen släppt LangExtract – ett smart, öppet AI-verktyg som hjälper dig att plocka ut strukturerad information från helt ostrukturerad text. Det är som att ha en personlig assistent som faktiskt orkar läsa allt. Och förstår det.

Vad är LangExtract?

LangExtract är ett nytt open-source Pythonbibliotek från Google som använder sig av stora språkmodeller (LLM:er) som Gemini för att extrahera värdefull information från långa, röriga texter. Tänk: juridiska dokument, medicinska rapporter, nyhetsartiklar eller bara… allmänt babbel.

Poängen? Att få ut tydlig och användbar data – utan att du själv behöver läsa igenom hundratals sidor.

Och ja, det är gratis.

Vad gör det här Pyonbiblioteket så speciellt?

Till skillnad från andra halvsovande AI‑verktyg är LangExtract inte bara ännu en kodsnutt som spottar ut svar. Den här grejen har superkrafter. Här är några av höjdpunkterna:

  • Källhänvisningar på detaljnivå
    Varje bit av information som extraheras kopplas till exakt var i originaltexten den hittades – ner till karaktärsnummer. Det här gör att du alltid kan dubbelkolla varifrån något kommer.
  • Stöd för egna datastrukturer
    Du kan själv definiera hur du vill att resultatet ska struktureras. Vill du ha en lista med produkter och priser? Eller karaktärer och känslor i Romeo och Julia? Du bestämmer.
  • Få kontroll med promptdesign och exempel
    Ge AI:n tydliga instruktioner och några exempel – så får du bättre resultat. Det är lite som att lära en hund trick, fast utan hundgodis.
  • Klarar stora dokument som en chef
    LangExtract är byggt för att hantera riktigt långa texter. Den delar upp dem i bitar (så kallade “chunks”), processar dem smart och kan till och med köra parallella extraktioner för att spara tid.
  • Visualisering för människor med ögon
    När extraktionen är klar kan du få en snygg HTML-visualisering där all extraherad data visas direkt i kontext. Så du slipper stirra på JSON-filer och få existentiell ångest.
  • Funkar med flera AI-modeller
    Du kan använda både Googles egna Gemini-modeller (via molnet) eller köra lokalt med t.ex. Ollama om du vill slippa skicka data till molnet.

Exempel på hur man kan skapa en knowledge graph

Vad kan man använda det till?

Det här verktyget är inte bara för AI-nördar. Här är några konkreta exempel på hur LangExtract används:

  • Inom sjukvården: Extrahera läkemedel, dosering och biverkningar från kliniska rapporter.
  • Inom juridik: Plocka ut kontraktsvillkor, parter och deadlines från juridiska texter.
  • Inom journalistik: Sammanfatta långa nyhetsartiklar och identifiera nyckelpersoner eller citat.
  • Inom litteratur: Analysera karaktärer, relationer och känslor i klassisk skönlitteratur.
  • Inom ekonomi: Extrahera siffror och finansiella begrepp från ekonomiska rapporter.

Det är som att ha en liten AI-intern som älskar att läsa, aldrig klagar och aldrig tar kaffe­paus.

Så här kommer du igång med LangExtract

Installera paketet i Pyton

pip install langextract

Skriv en tydlig prompt
Berätta för AI:n vad du vill få ut från texten. Ju tydligare du är, desto bättre resultat.

Lägg till några exempel
Visa AI:n några konkreta exempel på rätt output, så lär den sig snabbare vad du är ute efter.

Kör extraktionen

from langextract import extract
extract(model_id=”gemini-2.5-pro”, …)

Visualisera och spara
Använd lx.visualize() för att se resultaten i en snygg, klickbar HTML-vy. Du kan också exportera datan till JSONL.

Ordning och reda, pengar på…med öppen källkod

Vi drunknar i information. Alla har vi någon gång försökt läsa igenom ett dokument och tänkt “nej tack, inte idag”. LangExtract är ett svar på den moderna människans största problem: brist på tid och överskott på text.

Med LangExtract kan du snabbt få en överblick, hitta det viktiga och fokusera på det som faktiskt spelar roll – oavsett om du är läkare, forskare, journalist eller bara nyfiken.

Och bäst av allt? Det är öppen källkod. Du kan titta under huven, anpassa det som du vill och använda det fritt.

Källor

https://developers.googleblog.com/en/introducing-langextract-a-gemini-powered-information-extraction-library

Föregående inlägg

Nästa inlägg

Laddar nästa inlägg...
Följ på
Sök Trendigt
Poppis
Belastning

Inloggning 3 sekunder...

Registrering 3 sekunder...

Kundvagn
Uppdatering av varukorg

HandlaDin varukorg är för närvarande tom. Du kan besöka vår butik och börja handla.