Tänk dig en AI som säger allt den tänker – och gör det utan att viska bort halva sanningen. Det är precis vad Hermes 4 från Nous Research levererar. Den nya modellen utmanar jättarna med toppresultat i matte, kreativitet och full användarkontroll – utan de vanliga spärrarna som får andra AI:er att låta som en trött byråkrat.
Nous Research har släppt Hermes 4, en serie open source språkmodeller som matchar eller överträffar stängda system, men med en twist: inga irriterande innehållsrestriktioner. Det är ett tydligt ställningstagande i kampen mellan företagsstyrd AI och öppen källkod – vem ska egentligen bestämma vad maskinerna får säga?
Tidigare version, Hermes 3, tränades på cirka 1,2 miljarder tokens. Hermes 4 har istället fått ungefär 70 miljarder tokens att öva på.. Det betyder att modellen har ett mycket bredare och djupare underlag, vilket gör svaren mer träffsäkra och pålitliga.
Hermes 4 kan använda ett nytt ”reasoning mode”. När det aktiveras gör modellen först en intern tankeprocess, markerad med <think>
-taggar, innan svaret levereras. På så sätt kan den ge mer genomtänkta svar i svåra frågor – utan att visa användaren alla interna funderingar.
Modellen är särskilt bra på matematik, logik och programmering. Den följer också strukturerade format som JSON bättre än tidigare och kan hantera verktygsanrop. Det gör den användbar både för utvecklare och för mer komplexa uppgifter där svaren behöver vara exakta.
I tester (till exempel RefusalBench) har Hermes 4 visat att den svarar på fler frågor än konkurrenter som GPT-4 och Claude Sonnet. När resonemangsläget är påslaget ligger svarsfrekvensen nära 60 %, vilket gör den mer hjälpsam i situationer där andra modeller ofta vägrar svara.
Trots att modellen är stor – hela 60 miljarder parametrar – är den optimerad för att vara både snabb och prisvärd. I API via Nous Portal kostar den cirka 0,70 USD per miljon tokens, vilket faktiskt är billigare än den äldre Hermes 3. Men på en vanlig persondator kommer du ha problem även om du har ett bra grafikkort.
För att köra Hermes 4 70B fullt ut behövs ett grafikkort med cirka 80 GB VRAM minne, till exempel NVIDIA A100 eller H100. Men det går också att använda kvantiserade versioner som tar mindre plats. Då räcker det med kort i klassen RTX 4090 (24 GB) eller system med gott om RAM om man kör med viss CPU-hjälp. Kvantisering gör modellen mer tillgänglig för vanliga användare.