Avatar billede cht Nybegynder
14. februar 2003 - 16:36 Der er 15 kommentarer

Hente tekst fra pdf dokumenter

Er det muligt at hente tekst fra pdf dokumenter vha. asp. Kan det evt. gøres vha. FileSystemObject eller andre komponenter?
Avatar billede medions Nybegynder
14. februar 2003 - 17:23 #1
Nope...

//>Rune
Avatar billede burningice Nybegynder
14. februar 2003 - 19:22 #2
medions>> hvad er det da for noget pjat... selvfølgelig er det muligt... prøv at sæg lidt på google (hint: pdf og asp)...

der er f.eks. den her http://dynamicpdf.com/Products/DynamicPDF/... den kan i hvert fald lave pdf'er, har ikke lige tid til at studere om den kan læse dem også
Avatar billede medions Nybegynder
14. februar 2003 - 19:24 #3
cyberfessor! Det er da ik' muligt at læse en PDF! Kan du fx. kopiere tekst ved at makere en linje i et .pdf dokument?

-jeg tror ikke det er muligt... Men ok, er da intersseret i at vide hvis det er!

//>Rune
Avatar billede medions Nybegynder
14. februar 2003 - 19:30 #4
Nu har jeg kigget ASPIn igennem:

http://www.aspin.com/func/search?tree=aspin/references&pg=1&order=desc&qry=asp+%2Bpdf

+ meget af Google! og jeg har ikke fundet noget om at kunne læse! -der er en masse om at generere PDF filer, men ikke læse fra dem!

//>Rune
Avatar billede cht Nybegynder
14. februar 2003 - 20:57 #5
Jeg ved i hvert fald at man kan markere og kopire en linje i et pdf dokument, hvis man f.eks. bruge Acrobat Reader. Jeg vil også mene at man kan lave en side der henter tekst fra pdf dokumenter, som der bliver sagt kan google jo, der skal måske bare det rigtige komponent til.
Avatar billede burningice Nybegynder
15. februar 2003 - 00:25 #6
medions>> du er vist lidt for hurtigt med at drage konklusioner... punkt 5 på det link du selv henviser til... ABCpdf... den kan bruges til at LÆSE pdf med... hvis du kigger på deres egen hjemmeside

http://www.websupergoo.com/

under produkter og manualen for ABCpdf finder du følgende funktion

http://www.websupergoo.com/helppdf3/5-object_reference/doc/1-methods/read.htm

Read Method   
 
Reads an existing PDF.

Use this method to read a PDF into a document object. Any existing document content will be discarded.

You can specify the PDF as a file path or by passing in the raw PDF data. Raw data must be held as an array of bytes. You can open encrypted PDF documents if you supply a valid password.

osv.

happy programming :)
Avatar billede burningice Nybegynder
15. februar 2003 - 00:26 #7
medions>> og det med at du ikke kan markere en linje i en pdf-fil er da ikke andet end en begrænsning i din reader. hvis du bruger et lidt mere "gråt" program kan du kopiere, printe og redigere så tosset du har lyst... selv de filer der ellers skulle være "beskyttede" ;)
Avatar billede medions Nybegynder
15. februar 2003 - 00:26 #8
lol fair nok :)

cht> Jeg undskylder!

Over and out...

//>Rune
Avatar billede burningice Nybegynder
15. februar 2003 - 00:36 #9
medions>> muaha... elsker når jeg får ret ;)... hvordan går det med itarkiv?
Avatar billede medions Nybegynder
15. februar 2003 - 11:09 #10
cyberfessor> Det går ik' for godt... Mangler tid til at bygge videre på det! Har alt alt for mange jern i ilden lige for tiden! -men mon ik' snart der sker noget!=?

Vi må ihvertfald se at komme igang ;o)

Hvorfor er du aldrig på ICQ / MSN længere?

//>Rune
Avatar billede burningice Nybegynder
15. februar 2003 - 17:32 #11
medions>> det er da fordi at jeg har haft vinterferie... men jeg skal nok være på 24/7 nu.. i hvert fald indtil næste ferie ;)

men jeg får geninstalleret serveren inden for ikke så lang tid, så kan vi også få sat mysql ordenligt op :)
Avatar billede medions Nybegynder
16. februar 2003 - 00:01 #12
Lyder sq godt ;o)

//>Rune
Avatar billede cht Nybegynder
17. februar 2003 - 21:21 #13
Jeg har nu prøvet at installere ABCpdf3.Doc, men det ser da kun ud til at den kan lave pdf dokumenter og tilføje til pdf dokumenter ikke læse teksten fra dem.

>> cyberfessor

Du skriver at nedenstående kode skulle kunne hente teksten fra et pdf dokument, men jeg kan ikke lige se hvordan den skulle kunne det:

Set theDoc = Server.CreateObject("ABCpdf3.Doc")
theDoc.Read "c:\mypics\sample.pdf"
theDoc.FontSize = 500
theDoc.Color = "255 0 0"
theDoc.HPos = 0.5
theDoc.VPos = 0.3
theCount = theDoc.PageCount
For i = 1 To theCount
  theDoc.PageNumber = i
  theDoc.AddText i
Next
theDoc.Save "c:\mypdfs\docread.pdf"

Hvis man prøver at skrive:
response.write theDoc.Read

Så kommer der denne fejlmeddelelse:

Der opstod en Microsoft VBScript-kørselsfejl fejl '800a01c2'

Antallet af argumenter er forkert eller egenskabstildelingen er ugyldig: 'theDoc.Read'

/pdf/readtest.asp, linje 15
Avatar billede cht Nybegynder
17. februar 2003 - 21:50 #14
Avatar billede burningice Nybegynder
17. februar 2003 - 21:52 #15
så er det godt at der er alternativer :)

en lille søgning på PDFZone (http://www.pdfzone.com/toolbox/toolinfo_extract.asp) gav mig følgende som ser lovende ud

http://www.verypdf.com/pdf2txt/pdf2txt.htm
http://www.convertzone.com/pdf2txtcom/usage.htm
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester



IT-JOB

Udviklings- og Forenklingsstyrelsen

Business Analyst med flair for test

Udviklings- og Forenklingsstyrelsen

Rådgivende informationsarkitekter med strategisk fokus

Story House Egmont A/S

Application Specialist

Unik System Design A/S

Head of Internal IT

Billetkontoret A/S

.NET Full Stack Developer