Er det muligt, at hente al tekst ud fra en pdf og gemme som fx. .txt? Altså tekst som du manuelt kan markere i Adobe Acrobat Reader og så copy/paste. Det er altså ikke tekst, der er del af et billede, jeg er interesseret i.
Jeg kan java og php, så håber det kan lade sig gøre i en af disse sprog? :)
Du skal dog være opmærksom på at PDF-formatet er et format til publicering af færdige dokumenter, og det kan derfor være meget svært at trække noget ud af en PDF-fil som ligner den oprindelige tekst.
Endvidere bør jeg nok tilføje til min første kommentar, at jeg kun selv har brugt iText til at skrive/tilføje til PDF og således ikke er klar over om den har de nødvendige metoder til at extracte tekst overhovedet.
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.