Titt under huven, inblick i vår kategoriseringsmotor

Vi tänkte i detta blogginlägg ge lite inblick i hur det fungerar under huven på PRO(a)ACT.

Det stora kundvärdet med PRO(a)ACT är att vi avlastar er från administration, vi brukar säga spara tid med automatik. Vi stöttar kunder med AI och det är något vi själva redan implementerat och fortsätter implementera än mer i PRO(a)ACT. Något inom data science är fuzzy matchning, ett sätt är att mäta Levenschteinavståndet, av ryske matematikern Vladimir Levenshtein.



Där man jämför avståndet mellan olika textsträngar genom att mäta antalet operationer som krävs (replace, delete, insert) och används ofta i rättstavningsprogram och sökmotorer. Vi använder det för att förbättra kvalitén i er data, exempelvis när vi kategoriserar kostnaderna.

Många har bristande datakvalité; organisationsnummer saknas, felinmatade organisationsnummer eller felstavade leverantörsnamn för att nämna några. De flesta underhåller inte sin leverantörsreskontra med att uppdatera med korrekta namn om en organisation byter namn.

Grupperingar av leverantörer


Här kan vi se olika kombinationer av Staples förekommer; AB. (med punkt efter) AB och AKTIEBOLAG. Utöver enkla kombinationer av Staples ser vi även att Corporate Express och TG Skrivab förekommer med samma organisationsnummer. Med hjälp av denna input kan vi även gruppera in leverantörsnamn Corporate Express till Staples.


Vi har kunder som har över 70.000 leverantörer och att kategorisera upp detta manuellt skulle vara minst sagt tidskrävande. Många har en oändlig svans av småleverantörer (läs mer om paretoprincipen här).


I tabellen nedan beskriver vi några av våra matchningstyper vi gör.

Utfall av matchningstyper


Scenario: Rad 2
Leverantören 24KALMAR har ett giltigt organisationsnummer i kolumn C.
> Det är ett giltigt organisationsnummer och vi kompletterar med det korrekta namnet 24Sverige AB.

Scenario: Rad 3
Leverantören STAPLES förekommer med ett felaktigt organisationsnummer (556572-1353 tillhör ett inaktivt bolag).
> Vi städar upp med korrektaorganisationsnumret 556091-3591

Scenario: Rad 4
Leverantören 1 KÖK I TENHULT saknar organisationsnummer.
> Då leverantörsnamnet är identiskt med ett bolagsnamn och det förekommer en exakt matchning, kopplar vi ihop det med det korrekta organisationsnumret.

Scenario: Rad 5
Leverantören CORPORATE EXPRESS saknar organisationsnummer.
> Enligt exemplet på grupperingen ovan har vi fått input att Corporate Express är relaterat till Staples. Därför kan vi komplettera med både ett korrekt organisationsnummer och namn.

Scenario: Rad 6
Leverantören LITTLE KIDS saknar organisationsnummer.
> Vi kan inte automatiskt matcha på bara namnet (för det förekommer två organisationer med liknande namn, Little Kids corner och Little Kids Preschool in Gothenburg). Här har en användare valt leverantören Little Kids Preschool in Gothenburg och vi kompletterar med ett giltigt organisationsnummer.

Det mesta av er data lyckas vi kategorisera upp automatiskt. Just nu ligger vi på över 99% matchningsgrad på över 15.3 miljoner rader.

Utvalda inlägg: