pdf to text converter misforstår nogle ord
HejJeg arbejder på et automatisk fakturaskanning system, som omdanner scannede fakturaer i pdf til excelfiler, som kan faktureres i economic. For at mit program( som jeg har lavet i PHP) kan læse teksten skal den først omdannes til .txt filer og her er "MajorWare-PDF to Text Converter" det hidtil bedste, jeg har fundet. Det læser teksten fra venstre mod højre (som når man læser en bog), hvilket er uhyre vigtigt for at mit priogram kan trække de rette ord ud af filen. Det gør "MajorWare-PDF to Text Converter", men problemet er, at det indimellem misfortolker ord og gætter sig til nogle af bogstaverne. Det gør det meget svært at rette op på i koden, da gættene kan være forskellige fra fil til fil.
Jeg har prøvet at ændre opløsningen i scanneren uden, at det har hjulpet ret meget.
Jeg vil derfor høre om nogle kender til et program, som fejlfrit læser tekst fra pdf filer (fra venstre mod højre) og kvaliteten er vigtigere end prisen.
Mvh Carsten