24. maj 2016 - 09:15 Der er 4 kommentarer

Sammenlign PDF dokumenter

Hej folkens.

Jeg sidder og bikser lidt med et PDF værktøj jeg har fået skruet sammen (med hjælp fra itextsharp), som jeg bruger til at søge efter el-tegninger i nogle mapper. Jeg har fundet en fin måde at tjekke om en given PDF er en tegning, når tegning er af nyere dato og derfor indeholder tekst, som jeg kan søge efter. Mit problem kommer så, når jeg vil finde gamle tegninger, som bare er billeder og ikke indeholder noget som helst tekst.

Alle vores tegninger har en ramme på hver side, som indeholder 10 kasser til strømveje, samt tegnings hoved og lignende. Min tanke var her at lave en skabelon over den ramme og sammenligne den med den aktuelle PDF fil, men den vil jo aldrig ligne 100%. Den kan være skalleret større eller mindre, eller være roteret lidt den ene eller anden vej.

Kan dette lade sig gøre?
26. maj 2016 - 08:01 #1
Nu skal i ikke allesammen råbe i munden på hinanden! :D
Avatar billede arne_v Ekspert
29. maj 2016 - 00:45 #2
Jeg tror at de manglende svar skyldes at det er en meget vanskelig opgave.

At checke om der er 10 kasser er meget nemt for den menneskelige hjerne men ikke nemt at programmere.

Bedste bud vil være hvis der altid bruges samme PDF konstruktion til at lave de 10 kasser og du kan teste på om der er 10 af den og så gætte på at det er det rigtige.

En anden mulighed var at lave et program som fandt alle filerne og viste dem i en del af et vindue og brugeren så skulle klikke på enten ja eller nej knap. Lidt arbejde, men man burde nemt kunne processe 10 filer i minuttet eller 600 i timen.
01. juni 2016 - 10:28 #3
Problemet her er at det jeg skal bruge er et værktøj til at søge vores 70.000 order igennem og finde gamle eltegninger, som kan være op mod 20 år gamle. Dvs at de er lavet i forskellige tegneprogrammer og nogle af dem, kan endda være printet fra vores leverandør og så skannet ind i vores system. Altså vil der være en del variation i hvordan skidtet ser ud. Jeg har hentet et stykke software der hedder "I-net PDFC" og den kan godt lave de her sammenligninger. Det værktøj er dog til at sammenligne 2 pdf filer for at finde ud af om de er ens, så det er ikke lige det jeg skal bruge her, men det har da vist mig at den sammenligning kan lade sig gøre :) Og jeg er godt klar over det er vanskeligt... det er jo derfor jeg søger hjælp :)
Avatar billede arne_v Ekspert
02. juni 2016 - 05:52 #4
Der er vanskeligt og vanskeligt. En ting er at mangle nogle tips til at kunne skrive 10-100 linier kode. Noget andet er at lave en applikation med 10000-100000 linier kode.

Bedste bud maa vaere at konvertere PDF til bitmap og saa lave noget kasse find kode i den bitmap og se om de rigtige kasser er der.

Jeg er overbevist om at det vil tge meget laengere tid end processen beskrevet ovenfor som vil tage 120 timer.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester