Avatar billede zaphod Nybegynder
04. marts 2005 - 14:56 Der er 6 kommentarer og
2 løsninger

google finder ikke min pdf

Jeg har lavet en hjemmeside hvorpå jeg linker til en pdf fil (lavet vha. pdflatex).

Efter et par dage kan google finde min homepage, men ikke pdf filen.

Tekst kan udemærket ekstraheres fra pdf filen, dvs. jeg kan markere tekst i acrobat reader og kopiere det over i et andet program.

Jeg har for et par år siden gjort nøjagtigt det samme, og det virkede fint. Eneste forskel var at jeg dengang brugte latex->dvi->ps i stedet for pdflatex.

Hvad kan jeg gøre for at google finder min pdf fil?
Avatar billede verakso Nybegynder
04. marts 2005 - 16:19 #1
1) Kan Google se dine ande sider
2) Bruger du metatags til at betstemme roboternes kravlen
3) Eller bruger du måske en robots.txt
4) Hvordan er dit link til pdf-filen (er det dynamiks et en alm. a href=fil.pdf)
Avatar billede zaphod Nybegynder
04. marts 2005 - 16:28 #2
1) ja
2) nej
3) nej
4) href

siden kan iøvrigt ses her: http://www.iau.dtu.dk/~ex24/
acr.pdf som blev lavet for et par år siden bliver fundet af google, mens cooprobots.pdf som er et par dage gammel ikke bliver fundet. Hvis man søger på "cooperative mobile robots" site:dk
bliver hovedsiden fundet, men ikke pdf'en (cooprobots.pdf)
Avatar billede zaphod Nybegynder
11. marts 2005 - 11:19 #3
Er der slet ingen der kan hjælpe?

Kan det skyldes, at hovedsiden indeholder et abstract som er kopieret ordret fra pdf'en, og google derfor udelader pdf'en fordi den minder for meget om hovedsiden?
Avatar billede zaphod Nybegynder
18. marts 2005 - 11:16 #4
det ser ikke ud til nogen kan hjælpe, så jeg lukker, men tak for forsøget verakso
Måske jeg skulle poste det under en anden kategori.
Avatar billede zaphod Nybegynder
18. marts 2005 - 11:23 #5
lukket
Avatar billede zaphod Nybegynder
18. marts 2005 - 11:26 #6
troede man kunne lukke spørgsmålet ved at acceptere et svar fra sig selv.
Avatar billede verakso Nybegynder
21. marts 2005 - 09:47 #7
Man kunne jp fundere lidt over at hvis man kan finde frem til PDF'en via det abstract der er indekseret hos Google, hvor vigigt er det så at Google også indeskere PDF filen.

Men umiddelbart så tror jeg uden at have kigget nærmere på det, at Google simpelthen ikke kan læse din PDF fil. Du skriver selv at sidste gang du lavede dette, da var det en PostSctript fil. Så hvis denne PS fil var tekst og ikke binær, så er det ikke noget problem at læse den.

Jeg kan nemlig se at din PDF ikke er tagged, hvilket muligvis kunne være årsagen, uden at jeg er gået yderligere ned i detajler.
Avatar billede erikjacobsen Ekspert
21. marts 2005 - 09:56 #8
Jeg kender ikke svaret, men der er et par ting man nok skal tage i betragtning

1) Ingen har krav på at blive optaget i en søgemaskine
2) Google (fx) har ret til at prioritere sin indexering ud fra kriterier som vigtighed af siden, krævede ressourcer etc.
3) Din pdf er ret stor ;)
4) Adresser med .../~etellerandet opfattes måske som knap så vigtige som dem der ligger direkte under et domæne.
5) Ja ... hvad ved jeg om det ... ?? ;)

Vent og se om det ikke kommer en dag?
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester